从源代码里提取中文字符串的java类
发布时间:2020-12-15 03:23:41 所属栏目:Java 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 工作中需要优化代码里的中文警示语和异常信息,实在比较多,所以就写了个程序专门从代码里提取中文字符串。 import java.io.*;import java.util.*;imp
以下代码由PHP站长网 52php.cn收集自互联网 现在PHP站长网小编把它分享给大家,仅供参考
工作中需要优化代码里的中文警示语和异常信息,实在比较多,所以就写了个程序专门从代码里提取中文字符串。
import java.io.*; import java.util.*; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 搜索字符串并输出到控制台 */ public class ExtractStr { public static String getHelpString(String[] args){ String result = String.format("%s [path]",new Object[]{"a"}); return result; } private void getFiles(String rootPath,final String fileExt,List<File> fileList){ File f =new File(rootPath); File[] list=f.listFiles(new FileFilter() { @Override public boolean accept(File f) { boolean ret = f.isDirectory() || (f.isFile() && f.getName().endsWith(fileExt)); return ret; } }); for(File fn : list){ if (fn.isDirectory()){ this.getFiles(fn.getAbsolutePath(),fileExt,fileList); }else{ fileList.add(fn); } } } public List<File> run(String rootPath,String fileExt){ List<File> result = new LinkedList<File>(); this.getFiles(rootPath,result); return result; } public List<String> parserSourceFile(List<String> patternList,File file,int miniCharCount) throws Exception { List<String> result = new LinkedList<String>(); BufferedReader r = new BufferedReader(new FileReader(file)); char[] buffer = new char[(int)file.length()]; r.read(buffer,(int)file.length()); String text=new String(buffer,buffer.length); for(String patternStr : patternList){ //Pattern pattern = Pattern.compile(""(.*?)""); Pattern pattern = Pattern.compile(patternStr); Matcher matchers= pattern.matcher(text); while(matchers.find()){ String t=matchers.group(); if (t.length()>=miniCharCount) result.add(t); } } return result; } public static void main(String []args){ if (args.length==0){ StringBuilder sb = new StringBuilder() .append("未传入需要搜索的有效的源代码路径") .append("n") .append(ExtractStr.getHelpString(args)); System.out.println(sb.toString()); System.exit(1); } List<String> searchFolders=new ArrayList<String>(100); for(int i=0; i<=args.length-1;i++){ File f=new File(args[i]); if (!f.isDirectory() || !f.exists()) continue; searchFolders.add(f.getAbsolutePath()); } List<String> patternList = new LinkedList<String>(); patternList.add("'([u4E00-u9FA5]+)'"); patternList.add(""([u4E00-u9FA5]+)""); ExtractStr es = new ExtractStr(); List<File> fileList = new ArrayList<File>(1000); for(String sarchFolder : searchFolders){ List<File> t=es.run(sarchFolder,".php"); fileList.addAll(t); } Set<String> outList=new HashSet<String>(); for(File f : fileList){ try{ List<String> items=es.parserSourceFile(patternList,f,12); outList.addAll(items); }catch(Exception e){ e.printStackTrace(); } } for(String str : outList){ System.out.println(str); } } } 以上内容由PHP站长网【52php.cn】收集整理供大家参考研究 如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |