RegexQuery正则表达式源代码
发布时间:2020-12-14 01:32:59 所属栏目:百科 来源:网络整理
导读:package query; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.Ter
package query; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.Term; import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher; public class RegexQuery { public static void main(String[] args) { // TODO 自动生成的方法存根 IndexWriter writer = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),true); writer.setUseCompoundFile(false); //创建8个文档 Document doc1 = new Document(); Document doc2 = new Document(); Document doc3 = new Document(); Field f1 = new Field("content","word",Field.Store.YES,Field.Index.TOKENIZED); Field f2 = new Field("content","work",Field.Index.TOKENIZED); Field f3 = new Field("content","world",Field.Index.TOKENIZED); doc1.add(f1); doc2.add(f2); doc3.add(f3); writer.addDocument(doc1); writer.addDocument(doc2); writer.addDocument(doc3); writer.close(); IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH); //构建1个个正则表达式,用于匹配所有域名abc.com的地址 String regex = "http://[a-z]{1,3}.abc.com/.*"; //构成term Term t = new Term("url",regex); //创建正则查询 RegexQuery query = new RegexQuery(t); //打印查询结果 Hits hits = searcher.search(query); for(int i = 0; i < hits.length(); i++){ System.out.println(hits.doc(i)); } } } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- 使用URI-Style Namespace编译ActionScript/Flex Library
- Qt 处理XML 文档的三种方式简介——DOM、SAX、流处理
- c# – 按索引获取DataGrid
- c# – 如果我的网站运行ASP.NET MVC或Web窗体怎么办?
- NAND Flash Spare Area 分布
- React入门HelloWorld示例
- 尝试使用SecureRandom.random_number ruby?? 2.0.0的包含范
- Flash整站项目Gaia框架总结(2)AS2部分
- 使用XML解析器(TinyXML)编程之常用参数讲解-------转载的原
- c – 可能的评估订单或Scott Meyers提供的资源泄漏是错误的