加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

使用正则表达式抓取网页中的email地址

发布时间:2020-12-14 01:40:38 所属栏目:百科 来源:网络整理
导读:import java.io.BufferedReader;import java.io.FileNotFoundException;import java.io.FileReader;import java.io.IOException;import java.util.regex.Matcher;import java.util.regex.Pattern;/* * 根据抓取的网页,获取其中包含的Email地址 * 主要是正则
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
 * 根据抓取的网页,获取其中包含的Email地址
 * 主要是正则表达式应用
 * */
public class EmailSpider {
	public static void main(String[] args) {		
		String filePath = "E:email.html";
		getEmail(filePath);
	}

	private static void getEmail(String filePath) {
		BufferedReader br = null;
		Pattern p = null;
		Matcher m = null;
		
		//构建邮件的正则表达式
		p = Pattern.compile("[w[.-]]+@[w[.-]]+.[w]+");
		try {
			br = new BufferedReader(new FileReader(filePath));
			String line = "";
			while((line = br.readLine()) != null) {
				m = p.matcher(line);
				if(m.find()) {
					System.out.println(m.group());
				}
			}
			
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if(br != null) {
					br.close();
					br = null;
				}
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
		
	}

}

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读