加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c# – 从Lucene查询中获取查询词以突出显示

发布时间:2020-12-15 17:15:39 所属栏目:百科 来源:网络整理
导读:我的Lucene查询通常会存在一堆AND组合字段. 是否可以再次从查询对象中获取查询的字段? 解决方法 您的意思是提取术语或字段名称?由于您已经知道正在处理BooleanQuery,因此要提取字段,您可以简单地迭代BooleanQuery.getClauses()返回的BooleanClause数组,将
我的Lucene查询通常会存在一堆AND组合字段.
是否可以再次从查询对象中获取查询的字段?

解决方法

您的意思是提取术语或字段名称?由于您已经知道正在处理BooleanQuery,因此要提取字段,您可以简单地迭代BooleanQuery.getClauses()返回的BooleanClause数组,将每个子句重写为其基本查询(Query.rewrite)并递归应用,直到您拥有TermQuery在你的手上.

如果你的意思是术语提取,我不确定Lucene.NET,但在Java Lucene中你可以使用org.apache.lucene.search.highlight.QueryTermExtractor;你将一个(重写的)查询传递给它的一个getTerms重载并得到一个WeightedTerms数组.

据我记忆,使用这种技术的缺点是:

>由于它在内部使用术语集,因此它不会处理同一令牌的多个实例,例如“梦中的梦想”
>它仅支持基本查询类型(TermQuery,BooleanQuery和支持Query.extractTerms的任何其他查询类型).我相信我们已经在内部使用了SpanNearQuery和SpanNearOrderedQuery实例,但我可能错了.

无论哪种方式,我希望这足以让你开始.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读