luncene 查询字符串的解析

http://blog.csdn.net/hongfu_/article/details/1933366

搜索流程中的第二步就是构建一个Query。下面就来介绍Query及其构建。

当用户输入一个关键字，搜索引擎接收到后，并不是立刻就将它放入后台开始进行关键字的检索，而应当首先对这个关键字进行一定的分析和处理，使之成为一种后台可以理解的形式，只有这样，才能提高检索的效率，同时检索出更加有效的结果。那么，在Lucene中，这种处理，其实就是构建一个Query对象。

就Query对象本身言，它只是Lucene的search包中的一个抽象类，这个抽象类有许多子类，代表了不同类型的检索。如常见的TermQuery就是将一个简单的关键字进行封装后的对象，类似的还有BooleanQuery，即布尔型的查找。

IndexSearcher对象的search方法中总是需要一个Query对象（或是Query子类的对象），本节就来介绍各种Query类。

由上述代码可以看出，通配符“?”代表1个字符，而“*”则代表0至多个字符。不过通配符检索和上面的FuzzyQuery由于需要对字段关键字进行字符串匹配，所以，在搜索的性能上面会受到一些影响。

对于搜索引擎（比如Google和百度）来讲，很多情况下只需要用户在输入框内输入所需查询的内容，然后再单击“搜索”就可以了，其余的事情全部交给搜索引擎去处理，最后搜索引擎会把检索到的结果显示出来。那么搜索引擎是怎样处理用户输入得符号串的呢？

在Lucene中，这项工作就交给了QueryParser类来完成，它的作用就是把各种用户输入的符号串转为一个内部的Query或者一个Query组。虽然Lucene提供的API允许使用者创建各种各样的Query（查询语句），但它同时也允许通过QueryParser（查询分析器）生成各种各样的Query子对象。这使得Lucene的查询功能更加灵活和强大。

11.5.1 QueryParser的简单用法

QueryParser实际上就是一个解析用户输入的工具，可以通过扫描用户输入的字符串，生成Query对象，以下是一个代码示例：

Query query = null;

query = QueryParser.parse(keywords,fieldName,new StandardAnalyzer());

由上面代码可以看出，当使用QueryParser构建用户Query时，不仅需要用户输入关键字文本，还需要告诉QueryParser默认将在哪个字段内查找该关键字信息。当然，这并不是说用户只能在这个字段内查找关键字信息（例如可以在关键字中使用“content:david”这样的方式指定搜索字段“content”中的关键字），但是如果用户在输入的关键字中没有给出检索字段信息时，QueryParser就将在默认字段内进行检索。

用户输入关键字的格式以及QueryParser所理解的含义如表11-2所示。

表11-2 输入关键字格式和QueryParser理解的含义

格式	含义
“David”	在默认的字段中检索“David”关键字
“content：David”	在“content”字段中检索“David”关键字
“David Mary”或“David OR Mary”	在默认字段中检索David和Mary关键字，它们是“或”关系
“+David +Mary”或“David AND Mary”	在默认字段中检索David和Mary关键字，它们是“与”关系
“content：David –title：Manager”或“content：David AND NOT title：Manager”	在content字段中包括关键字David但在title字段中不包含关键字Manager
“(David OR Mary) AND Robert”	在默认字段中包含David或Mary关键字，但一定要包含Robert关键字
Davi*	在默认字段中检索前缀为Davi
“content："David is a manager"”	在“content”字段中包含短语“David is a manager”

另外很重要的一点，就是在使用QueryParser对用户的输入进行扫描时，还需要给它一个分析器。有关分析器的概念将在后面的章节中介绍。不过，当对用户输入的关键字进行分析时的分析器应当与建立索引时的分析器一样，这样才能保证分析成功。

11.5.2 QueryParser的“与”和“或”

通过表11-1可以了解，当用户输入两个关键字时，QueryParser默认它们之间的关系为“或”关系。如果用户需要改变这种逻辑关系，则可采用下面的方法：

QueryParser parser = new QueryParser(fieldName, new StandardAnalyzer());

parser.setOperator(QueryParser.DEFAULT_OPERATOR_AND);

这样构建的QueryParser实例在对用户输入进行扫描时，就会用空格分开的关键字理解为“与”，其实也就是构建了一个“与”关系的布尔型查询。

luncene 查询字符串的解析—QueryParser类相关推荐

Nodejs--querystring (URL 查询字符串)
2019独角兽企业重金招聘Python工程师标准>>> querystring 模块提供了一些实用函数,用于解析与格式化 URL 查询字符串 querystring.parse(st ...
解析php变量,php使用parse_str实现查询字符串解析到变量中的方法
本文实例讲述了php使用parse_str实现查询字符串解析到变量中的方法.分享给大家供大家参考,具体如下: parse_str()函数可实现把字符串解析到变量中,这意味着实现了字符串与变量之间的一种 ...
在JavaScript中解析查询字符串[重复]
本文翻译自:Parse query string in JavaScript [duplicate] Possible Duplicate: 可能重复: How can I get query str ...
Gin 框架学习笔记（01）— 自定义结构体绑定表单、绑定URI、自定义log、自定义中间件、路由组、解析查询字符串、上传文件、使用HTTP方法
要实现一个 API 服务器,首先要考虑两个方面:API 风格和媒体类型.Go 语言中常用的 API 风格是 RPC 和 REST,常用的媒体类型是 JSON.XML 和 Protobuf.在 Go A ...
NPM酷库：qs，解析URL查询字符串
NPM酷库,每天两分钟,了解一个流行NPM库. Node.js 标准库中有一个库叫querystring,这个库用来处理URL查询字符串: const querystring = require('q ...
用于将带有查询字符串的复杂对象传递到Web API方法的自定义模型绑定器
目录介绍查询复杂对象的字符串字段使用和测试FieldValueModelBinder类 FieldValueModelBinder如何工作? 获取源字段和值将字段部分与对象属性匹配解析枚举类 ...
mysql源代码解析经典类——THD类
1.1 线程类THD概述对于每个客户端连接,我们使用THD作为线程/连接描述符创建一个单独的线程. 1.2 位置 #include <sql_class.h> 嵌套类 //表示只读可连接 ...
[Android开发] Json解析工具类，一个类搞定Json的解析
一.简介利用递归的方式反射解析到bean里面二.详细代码 1. Json格式例如服务器指定规定json格式为: {"code": "--" , // 返回 ...

luncene 查询字符串的解析—QueryParser类

11.4.1 按词条搜索—TermQuery

11.4.2 “与或”搜索—BooleanQuery

11.4.3 在某一范围内搜索—RangeQuery

11.4.4 使用前缀搜索—PrefixQuery

11.4.5 多关键字的搜索—PhraseQuery

11.4.6 使用短语缀搜索—PhrasePrefixQuery

11.4.7 相近词语的搜索—FuzzyQuery

11.4.8 使用通配符搜索—WildcardQuery

11.5.1 QueryParser的简单用法

11.5.2 QueryParser的“与”和“或”

luncene 查询字符串的解析—QueryParser类相关推荐

最新文章

热门文章