lucene域的各种类型
是否分词:
分词的作用是为了索引
需要分词: 文件名称, 文件内容
不需要分词: 不需要索引的域不需要分词,还有就是分词后无意义的域不需要分词
比如: id, 身份证号
是否索引:
索引的的目的是为了搜索.
需要搜索的域就一定要创建索引,只有创建了索引才能被搜索出来
不需要搜索的域可以不创建索引
需要索引: 文件名称, 文件内容, id, 身份证号等
不需要索引: 比如图片地址不需要创建索引, e:\\xxx.jpg
因为根据图片地址搜索无意义
是否存储:
存储的目的是为了显示.
是否存储看个人需要,存储就是将内容放入Document文档对象中保存出来,会额外占用磁盘空间, 如果搜索的时候需要马上显示出来可以放入document中也就是要存储,这样查询显示速度快, 如果不是马上立刻需要显示出来,则不需要存储,因为额外占用磁盘空间不划算.
Field类 |
数据类型 |
Analyzed 是否分析 |
Indexed 是否索引 |
Stored 是否存储 |
说明 |
StringField(FieldName, FieldValue,Store.YES)) |
字符串 |
N |
Y |
Y或N |
这个Field用来构建一个字符串Field,但是不会进行分析,会将整个串存储在索引中,比如(订单号,姓名等) 是否存储在文档中用Store.YES或Store.NO决定 |
LongField(FieldName, FieldValue,Store.YES) |
Long型 |
Y |
Y |
Y或N |
这个Field用来构建一个Long数字型Field,进行分析和索引,比如(价格) 是否存储在文档中用Store.YES或Store.NO决定 |
StoredField(FieldName, FieldValue) |
重载方法,支持多种类型 |
N |
N |
Y |
这个Field用来构建不同类型Field 不分析,不索引,但要Field存储在文档中 |
TextField(FieldName, FieldValue, Store.NO) 或 TextField(FieldName, reader) |
字符串 或 流 |
Y |
Y |
Y或N |
如果是一个Reader, lucene猜测内容比较多,会采用Unstored的策略. |
注意:lucene底层的算法,钱数是要分词的,因为要根据价钱进行对比
例如: 大于12.5元的小于100元的商品搜索出来
如果觉得本文对您有所帮助,欢迎您扫码下图所示的支付宝和微信支付二维码对本文进行随意打赏。您的支持将鼓励我继续创作
lucene域的各种类型相关推荐
- 1.js变量、作⽤域和引⽤类型,js制作页。
一.变量 javascript的变量与其它语⾔(强类型)的变量是有很⼤的区别的.JavaScript 变量松散类型的本质, var result; result = 1; alert(typeof r ...
- 使用Lucene.Net实现全文检索
目录 一 Lucene.Net概述 二 分词 三 索引 四 搜索 五 实践中的问题 一 Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引库,其源码包括"核心&quo ...
- lucene introduction
2019独角兽企业重金招聘Python工程师标准>>> Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序 ...
- 全文搜索技术—Lucene
1. 内容安排 实现一个文件的搜索功能,通过关键字搜索文件,凡是文件名或文件内容包括关键字的文件都需要找出来.还可以根据中文词语进程查询,并且支持多种条件查询. 本案例中的原始内容就是磁盘上的文件 ...
- lucene 第一天
Lucene/Solr 第一天 1. 课程计划 Lucene介绍 全文检索流程介绍 a) 索引流程 b) 搜索流程 Lucene入门程序 a) 索引实现 b) 搜索实现 分词器 a) 分词介绍 b ...
- 实战 Lucene,第 1 部分: 初识 Lucene
Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能.Lucene 目前是 Apache Jakarta 家 ...
- Lucene全文检索_分词_复杂搜索_中文分词器
1 Lucene简介 Lucene是apache下的一个开源的全文检索引擎工具包. 1.1 全文检索(Full-text Search) 1.1.1 定义 全文检索就是先分词创建索引,再执行搜索的过 ...
- 全文检索(一) -- Lucene
1. 前言 1.1 为什么要用Lucene 原来的方式实现搜索功能,我们的搜索流程如下图:如果用户比较少而且数据库的数据量比较小,那么这种方式实现搜索功能在企业中是比较常见的. 现在的方案(使用Luc ...
- 全文检索Lucene
全文检索Lucene lucene入门 什么是lucene Lucene的作用 使用场景 优点和缺点 lucene应用 索引流程 搜索流程 field域的使用 索引库维 ...
最新文章
- 适合做生物信息的笔记本推荐
- 关于《大道至简》第一章的收获
- [c++]C++关键字之friend
- 用友软件工程IT应用研究院
- Pandas的学习(3.DataFrame的创建方法和三种索引方法(iloc、loc、values)以及切片)
- java string 字符个数字_java从字符串中提取数字
- LeetCode 1533. Find the Index of the Large Integer(二分查找)
- python循环语句for计数_Bash For循环(递增计数)与for循环用法详解
- 面试题 01.04. 回文排列
- jsonp 使用选择器
- swagger 接口参数顺序_Swagger常用参数用法
- 【ANSYS命令流】通用后处理技术(一):读取结果文件
- python+opencv+图像几何变换(图片缩放、剪切、位移、镜像,放射变换,旋转)
- 数字化场景——数字化营销
- 为什么打工人 996 会猝死,而企业家 007 却不会?
- 部分插件由于缺少依赖无法加载。要恢复这些插件提供的功能,需要修复这些问题并重启 Jenkins的解决办法
- 一文详解IP地址:含义、作用、格式、分类等
- 基础篇——ROS入门:学习资料、基本介绍、安装配置、文件系统、包创建
- 【JsPlumb】基于JsPlumb设计的Web拓扑图编辑器
- 字节面试杂谈——MySQL、Redis
热门文章
- php中this的使用技巧,JavaScript中this关键字使用方法详解
- y币充值通道_比特币如何扩容?读懂比特币链下扩容技术进展与投资现状
- 视频直播 > 最佳实践 > 如何降低延时
- Docker学习总结(52)—— Docker容器环境变量相关知识点的总结
- Java基础学习总结(91)——阿里巴巴Java开发手册公开版
- php判断参数_php如何判断有没有参数
- git did not exit cleanly (exit code 128)
- 微服务落地践行渐进,4个QA一窥金融微服务现状
- PHP两个日期之间的所有日期
- XCode 单独debug area窗口