加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 模式搜索如何更快?

发布时间:2020-12-14 05:31:52 所属栏目:Java 来源:网络整理
导读:我正在处理大约1GB的增量文件,我想搜索一个特定的模式. 目前我正在使用 Java正则表达式,你有什么想法可以如何更快地做到这一点? 解决方法 基本上你需要的是可以处理流的状态机.该流被绑定到文件…每次文件增长时,您都会读取附加到的内容(如附加到文件的行的
我正在处理大约1GB的增量文件,我想搜索一个特定的模式.
目前我正在使用 Java正则表达式,你有什么想法可以如何更快地做到这一点?

解决方法

基本上你需要的是可以处理流的状态机.该流被绑定到文件…每次文件增长时,您都会读取附加到的内容(如附加到文件的行的标准输出的tail linux命令).

如果您需要停止/重新启动分析仪,您可以将其存储在起始位置的某个位置(这可以取决于您需要的模式匹配的窗口),然后重新启动.或者您可以从头重新启动.

那是针对“增加文件”的一部分问题.

为了处理内容的最佳方法,它取决于您真正需要的内容,要应用哪种数据和模式.正则表达式可能是最好的解决方案:灵活,快速,比较方便.

从我的理解,如果您想为一些自然语言内容进行文档搜索匹配,Lucene会很好.这将是一个不好的选择,以匹配所有日期或所有行与特定的财产.也是因为Lucene首先创建了一个索引的文档…这将有助于只有真正重的处理,因为索引首先需要时间.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读