使用正则表达式抓取网页中的email地址
发布时间:2020-12-14 01:40:38 所属栏目:百科 来源:网络整理
导读:import java.io.BufferedReader;import java.io.FileNotFoundException;import java.io.FileReader;import java.io.IOException;import java.util.regex.Matcher;import java.util.regex.Pattern;/* * 根据抓取的网页,获取其中包含的Email地址 * 主要是正则
import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.regex.Matcher; import java.util.regex.Pattern; /* * 根据抓取的网页,获取其中包含的Email地址 * 主要是正则表达式应用 * */ public class EmailSpider { public static void main(String[] args) { String filePath = "E:email.html"; getEmail(filePath); } private static void getEmail(String filePath) { BufferedReader br = null; Pattern p = null; Matcher m = null; //构建邮件的正则表达式 p = Pattern.compile("[w[.-]]+@[w[.-]]+.[w]+"); try { br = new BufferedReader(new FileReader(filePath)); String line = ""; while((line = br.readLine()) != null) { m = p.matcher(line); if(m.find()) { System.out.println(m.group()); } } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } finally { try { if(br != null) { br.close(); br = null; } } catch (IOException e) { e.printStackTrace(); } } } } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |