加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java – 快速字符串搜索,如startsWith()不等于()

发布时间:2020-12-15 05:16:41 所属栏目:Java 来源:网络整理
导读:我有一个有序列表(一个字典 – 100K字)和许多单词经常在这个列表中搜索.因此,性能是一个问题.我知道HashSet.contains(theWord)或Collections.binarySearch(sortedList,theWord)非常快.但实际上我并不是在寻找整个单词. 我想要的是让我们说搜索“se”并让所有
我有一个有序列表(一个字典 – 100K字)和许多单词经常在这个列表中搜索.因此,性能是一个问题.我知道HashSet.contains(theWord)或Collections.binarySearch(sortedList,theWord)非常快.但实际上我并不是在寻找整个单词.

我想要的是让我们说搜索“se”并让所有单词以“se”开头.那么Java或任何库中是否有现成的解决方案?

一个更好的示例:在排序列表中,为以下操作提供快速解决方案

List.subList(String beginIndex,String endIndex)//返回间隔

myWordList.subList(“ab”,“bc”);

注意:这是一个非常相似的问题,但接受的答案并不令人满意.
Overriding HashSet’s Contains Method

解决方法

你在这里寻找的是一个名为’trie’的数据结构:

http://en.wikipedia.org/wiki/Trie

它将字符串存储在由前缀索引的树中,其中树的第一级包含字符串的第一个字符,第二级包含第二个字符,等等.结果是它允许您提取非常大的字符串集的子集通过前缀非常快.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读