2019独角兽企业重金招聘Python工程师标准>>>

Lucene--FuzzyQuery与WildCardQuery(通配符) 博客分类: java 搜索引擎,爬虫

FuzzyQuery:

创建索引:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
IndexWriter writer =  new  IndexWriter(path,  new  StandardAnalyzer(),  false ); 
writer.setUseCompoundFile( false );
  
Document doc1 =  new  Document(); 
Document doc2 =  new  Document(); 
Document doc3 =  new  Document(); 
Document doc4 =  new  Document(); 
Document doc5 =  new  Document(); 
Document doc6 =  new  Document();
  
Field f1 =  new  Field( "content" "word" , Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f2 =  new  Field( "content" "work" , Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f3 =  new  Field( "content" "seed" , Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f4 =  new  Field( "content" "sword" , Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f5 =  new  Field( "content" "world" , Field.Store.YES, 
Field.Index.TOKENIZED); 
Field f6 =  new  Field( "content" "ford" , Field.Store.YES, 
Field.Index.TOKENIZED);
  
doc1.add(f1); 
doc2.add(f2); 
doc3.add(f3); 
doc4.add(f4); 
doc5.add(f5); 
doc6.add(f6);
  
writer.addDocument(doc1); 
writer.addDocument(doc2); 
writer.addDocument(doc3); 
writer.addDocument(doc4); 
writer.addDocument(doc5); 
writer.addDocument(doc6);
  
writer.close();

注:IndexWriter中的create的变量值一般设为true

搜索:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
IndexSearcher searcher =  new  IndexSearcher(path); 
//构建一个Term,然后对其进行模糊查找 
Term t =  new  Term( "content" "work" ); 
FuzzyQuery query =  new  FuzzyQuery(t); 
//FuzzyQuery还有两个构造函数,来限制模糊匹配的程度 
// 在FuzzyQuery中,默认的匹配度是0.5,当这个值越小时,通过模糊查找出的文档的匹配程度就 
// 越低,查出的文档量就越多,反之亦然 
FuzzyQuery query1 =  new  FuzzyQuery(t,  0 .1f); 
FuzzyQuery query2 =  new  FuzzyQuery(t,  0 .1f,  1 ); 
Hits hits = searcher.search(query2); 
for  ( int  i =  0 ; i  < hits.length(); i++) { 
     System.out.println(hits.doc(i)); 
searcher.close();

模糊搜索的三种构造函数,具体讲一下参数的用法(以第三个为例);

第一个参数当然是词条对象,第二个参数指的是levenshtein算法的最小相似度,第三个参数指的是要有多少个前缀字母完全匹配:

WildCardQuery:

通配符就更简单了,只要知道“*”表示0到多个字符,而使用“?”表示一个字符就行了:

?
1
2
3
4
5
6
7
8
IndexSearcher searcher= new  IndexSearcher(path);
Term t1= new  Term( "content" , "?o*" );
WildcardQuery query= new  WildcardQuery(t1);
Hits hits=searcher.search(query);
for ( int  i= 0 ;i<hits.length();i++)
{
      System.out.println(hits.doc(i));
}

That“s all!

http://my.oschina.net/MrMichael/blog/338925

转载于:https://my.oschina.net/xiaominmin/blog/1597428

Lucene--FuzzyQuery与WildCardQuery(通配符)相关推荐

  1. Lucene 的四大索引查询 ——bool 域搜索 通配符 范围搜索

    Lucene 的四大索引查询   清单1:使用布尔操作符 Java代码      //Test boolean operator blic void testOperator(String index ...

  2. Lucene.Net无障碍学习和使用:搜索篇

    在上一篇中,我们初步理解了索引的增删改查基本操作.本文着重介绍一下常用的搜索,以及搜索结果的排序和分页.本文的搜索主要是基于前一篇介绍的文本文件的索引,建议下载最后改进的demo对照着看阅读本文,同时 ...

  3. lucene.net 应用资料

    本文介绍了什么是Lucene,Lucene能做什么. 如何从一个文件夹下的所有txt文件中查找特定的词? 本文将围绕该个实例介绍了lucene.net的索引的建立以及如何针对索引进行搜索.最后还将给出 ...

  4. lucene 查询示例_高级Lucene查询示例

    lucene 查询示例 本文是我们名为" Apache Lucene基础知识 "的学院课程的一部分. 在本课程中,您将了解Lucene. 您将了解为什么这样的库很重要,然后了解Lu ...

  5. vc++调用jni_通过JNI使用C ++尖叫快速进行Lucene搜索

    vc++调用jni 最终,当Lucene执行查询时,在初始设置后,真正的热点通常是相当基本的代码,该代码对整数docID,术语频率和位置的顺序块进行解码,并将它们匹配(例如,对BooleanQuery ...

  6. 高级Lucene查询示例

    本文是我们名为" Apache Lucene基础知识 "的学院课程的一部分. 在本课程中,您将了解Lucene. 您将了解为什么这样的库很重要,然后了解Lucene中搜索的工作方式 ...

  7. 通过JNI使用C ++尖叫快速进行Lucene搜索

    一天结束时,Lucene执行查询时,在初始设置后,真正的热点通常是相当基本的代码,它解码整数docID,术语频率和位置的顺序块,并对其进行匹配(例如,对BooleanQuery并集或交集),则为每个匹 ...

  8. SpringCloud学习笔记024---SpringBoot集成Lucene实现全文检索_分词_索引_更新_删除文档_词条搜索_多条件查询

    JAVA技术交流QQ群:170933152 先看代码实现,下面有lucene介绍: 测试用例 Github 代码 代码我已放到 Github ,导入spring-boot-lucene-demo 项目 ...

  9. C#/.NET 系统优化专题(搜索引擎Lucene的使用)

    讲Lucene之前先说说数据库索引的使用,如下图 对列的计算要避免,任何形式都要避免 in查询 or查询,索引会失效,可能是拆分 in 换exists,not in 不要用,不走索引 is null和 ...

  10. Lucene搜索引擎-搜索

    文章目录 搜索API详解 IndexReader 索引读取器 IndexSearch 索引搜索器 查询结果 基本查询详解 TermQuery 词项查询 BooleanQuery 布尔查询 Phrase ...

最新文章

  1. 在C++工程中设置全局函数
  2. 华为服务器万兆网卡驱动型号,华为万兆光模块型号参数大全
  3. hdu5014 构造b数列使得t最大(小想法)
  4. 选择排序-冒泡排序-归并排序-快速排序-插入排序
  5. 计算机操作系统(1):OS的作用和目标
  6. url过滤怎么解除_腾讯面试官是这样来问布隆过滤器的?
  7. 从C#到Objective-C,循序渐进学习苹果开发(1)--准备开发账号和开发环境
  8. Tomcat的虚拟目录映射常用的几种方式
  9. ABP框架使用打印日志
  10. python 折线图拐角平滑_python利用插值法对折线进行平滑曲线处理
  11. xml突然变成空白_真实职场故事:开会时候,被领导突然提问,我差点被开除了...
  12. ZOJ 3987 秦皇岛现场赛G题 java
  13. VirtualBox升级VirtualBox Guest Additions增强功能
  14. 一大波无门槛优惠券来袭(仅限300张)
  15. 火影忍者、英雄联盟国内版、和平精英强开90/120帧方法
  16. git 避免提交_新秀Git错误避免
  17. 【ZYNQ】中断机制介绍(一)
  18. 云服务ECS/RDS:搭建云服务器ECS管理linux,搭建云数据库管理创建RDS MySQL;
  19. python文本txt处理
  20. SystemVerilog中随机的constrain语法

热门文章

  1. systemverilog硬件设计及建模_Chisel引领敏捷硬件开发浪潮
  2. centeros7 mysql,center os 7 Mysql 安装
  3. 软件开发工程师证书有用吗_bim工程师证书有用吗 含金量怎么样?
  4. 鸿蒙系统正式版官方下载,华为鸿蒙os2.0系统app正式版
  5. python的groupby中函数详解_python groupby函数用法
  6. 动漫风html源码,CSS3动画制作一个卡通风格的404错误页面代码
  7. python代码写入方式_【Python 1-17】Python手把手教程之——文件的读写以及I/O操作...
  8. discuz admin.php无法登录,discuz搬家管理员无法登录后台解决方法
  9. Http协议简单介绍
  10. Android中使用画笔和画布绘制一个矩形