加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

linux – 用于集成自定义Web应用程序的最佳文本搜索引擎?

发布时间:2020-12-14 00:02:16 所属栏目:Linux 来源:网络整理
导读:我们有一个Web应用程序,允许用户上传文档,创建自己的文档,等等.上传的文件存储在Amazon S3上,创建的信息存储在 MySQL数据库中.我正在寻找的是某种搜索引擎,我在其中提供所有文本文档,每个文档都有一个唯一的ID,并构建索引或其他任何内容.之后,我可以给它搜索
我们有一个Web应用程序,允许用户上传文档,创建自己的文档,等等.上传的文件存储在Amazon S3上,创建的信息存储在 MySQL数据库中.我正在寻找的是某种搜索引擎,我在其中提供所有文本文档,每个文档都有一个唯一的ID,并构建索引或其他任何内容.之后,我可以给它搜索查询,它会提取最匹配的文档(通过他们的ID),以及匹配文本的片段.

基本上我们希望允许我们的用户搜索他们上传的东西的存储库,以及其他用户标记为公开的任何内容.该解决方案应该在标准的Linux服务器上运行,理想情况下它应该是开源的,但如果价格不高,我也会考虑付费解决方案.

到目前为止,我发现了三个潜在候选人:

> MySQL Full Text Search – 我读过的一些报道说它很慢
> Apache Lucene – 不幸的是用Java编写,但如果必须的话,我会使用它.据说速度快
> Sphinx – 似乎并不那么受欢迎,理想情况下,无论我找到什么解决方案都会得到很多社区支持.

如果我有任何其他好的选择我忽略了,或者您有上述任何一个经验,请告诉我.

解决方法

看看 Solr.它基于Lucene,所以速度非常快,而且从任何平台上都可以轻松使用.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读