加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

从源代码里提取中文字符串的java类

发布时间:2020-12-15 03:23:41 所属栏目:Java 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 工作中需要优化代码里的中文警示语和异常信息,实在比较多,所以就写了个程序专门从代码里提取中文字符串。 import java.io.*;import java.util.*;imp

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

工作中需要优化代码里的中文警示语和异常信息,实在比较多,所以就写了个程序专门从代码里提取中文字符串。
import java.io.*;
import java.util.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 搜索字符串并输出到控制台
 */
public class ExtractStr {
    public static String getHelpString(String[] args){
        String result = String.format("%s [path]",new Object[]{"a"});
        return result;
    }

    private void getFiles(String rootPath,final String fileExt,List<File> fileList){
        File f =new File(rootPath);
        File[] list=f.listFiles(new FileFilter() {
            @Override
            public boolean accept(File f) {
                boolean ret = f.isDirectory() || (f.isFile() && f.getName().endsWith(fileExt));
                return ret;
            }
        });
        for(File fn : list){
            if (fn.isDirectory()){
                this.getFiles(fn.getAbsolutePath(),fileExt,fileList);
            }else{
                fileList.add(fn);
            }
        }
    }

    public List<File> run(String rootPath,String fileExt){
        List<File> result = new LinkedList<File>();
        this.getFiles(rootPath,result);
        return result;
    }

    public List<String> parserSourceFile(List<String> patternList,File file,int miniCharCount) throws Exception {
        List<String> result = new LinkedList<String>();
        BufferedReader r = new BufferedReader(new FileReader(file));
        char[] buffer = new char[(int)file.length()];
        r.read(buffer,(int)file.length());
        String text=new String(buffer,buffer.length);

        for(String patternStr : patternList){
            //Pattern pattern = Pattern.compile(""(.*?)"");
            Pattern pattern = Pattern.compile(patternStr);
            Matcher matchers= pattern.matcher(text);
            while(matchers.find()){
                String t=matchers.group();
                if (t.length()>=miniCharCount)
                    result.add(t);
            }
        }
        return result;
    }

    public static void main(String []args){
        if (args.length==0){
            StringBuilder sb = new StringBuilder()
                    .append("未传入需要搜索的有效的源代码路径")
                    .append("n")
                    .append(ExtractStr.getHelpString(args));
            System.out.println(sb.toString());
            System.exit(1);
        }
        List<String> searchFolders=new ArrayList<String>(100);
        for(int i=0; i<=args.length-1;i++){
            File f=new File(args[i]);
            if (!f.isDirectory() || !f.exists())
                continue;
            searchFolders.add(f.getAbsolutePath());
        }

        List<String> patternList = new LinkedList<String>();
        patternList.add("'([u4E00-u9FA5]+)'");
        patternList.add(""([u4E00-u9FA5]+)"");

        ExtractStr es = new ExtractStr();
        List<File> fileList = new ArrayList<File>(1000);
        for(String sarchFolder : searchFolders){
            List<File> t=es.run(sarchFolder,".php");
            fileList.addAll(t);
        }

        Set<String> outList=new HashSet<String>();
        for(File f : fileList){
            try{
                List<String> items=es.parserSourceFile(patternList,f,12);
                outList.addAll(items);
            }catch(Exception e){
                e.printStackTrace();
            }
        }
        for(String str : outList){
            System.out.println(str);
        }
    }
}

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读