加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

如何使用Perl对平面文件进行全文搜索搜索?

发布时间:2020-12-16 06:09:59 所属栏目:大数据 来源:网络整理
导读:我们有一个基于Perl的Web应用程序,其数据源自庞大的平面文本文件库.这些平面文件放在我们系统的目录中,我们广泛地解析它们将信息插入 MySQL数据库,然后将这些文件移动到它们的归档存储库和永久主页(/www/website/archive/*.txt).现在,我们不会解析这些平面文
我们有一个基于Perl的Web应用程序,其数据源自庞大的平面文本文件库.这些平面文件放在我们系统的目录中,我们广泛地解析它们将信息插入 MySQL数据库,然后将这些文件移动到它们的归档存储库和永久主页(/www/website/archive/*.txt).现在,我们不会解析这些平面文件中的每一位数据,而一些较为模糊的数据项也不会被数据库化.

目前的要求是用户能够从Perl生成的网页执行整个平面文件存储库的全文搜索,并返回他们随后可以单击的命中列表并打开文本文件评论.

什么是最优雅,最有效和非CPU密集型方法来实现此搜索功能?

解决方法

我建议按此顺序:

>将整个文档都整合到MySQL表中,并使用MySQL的全文搜索和索引功能.我从来没有这样做,但MySQL总是能够处理超过我可以抛出的东西.
> Swish-E(http://swish-e.org/)仍然存在,旨在构建全文索引并允许排名结果.我已经运行了几年,它运行得很好.>您可以在Perl代码中使用File :: Find来咀嚼像grep -r这样的存储库,但与上面的一个索引选项相比,它会很糟糕.但是,它会工作,甚至可能会让你大吃一惊:)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读