索引中文档的属性建立与不建立带来的影响总结
1.依据文档的某属性去查找索引的话,只会返回带有此属性(如果你对当前属性设定了条件,那么需要满足当前条件)的所有文档,没有建立此属性的文档是不会在返回结果文档中的,不管你的属性值类型是什么(string、date、long、int),结果都是一样的
2.查找条件满足,排序不会有任何影响(如果排序的属性文档没有,lucene会按文档建立的先后顺序返回且只会按照这个顺序),只需注意说的第一点
3.索引查找也不会有任何影响,只需注意说的第一点
4.数量查找条件如果满足,绝对正确,但如果是说的第一点的话,那就有问题了
5.如果做数据统一整合的话,建议没有属性的填默认属性,牺牲点微小的存储空间换来正确的查找结果
理论看不懂?举个例子你就懂了
需求:
建立3条数据的索引,每条数据包含weibotime(date)、forwardtims(long)、replytimes(int)等属性
数据建立索引后,变成3个文档:文档A、文档B、文档C
weibotime(date)、forwardtims(long)、replytimes(int)
文档A:     有                          有                         有
文档B:     无                          无                         有
文档C:     无                          无                         有
操作:
Q:查找weibotime并且降序排列
A:返回有weibotime属性的文档,并且结果顺序是降序的,显示当前索引里只有文档A
Q:查找replytimes,weibotime降序排列
A:返回当前3文档,并且结果顺序显示是:文档A、文档B、文档C

     Q:查找replytimes,weibotime升序排列
A:返回当前3文档,并且结果顺序显示是:文档B、文档C、文档A,看到这里你可能会觉得奇怪,文档B、C不都没有属性和值吗,为什么B一定排在C前面?这是lucene实现的,查找的属性有,但操作的属性如排序操作weibotime属性,但两个文档的属性是没有的,那么文档会按建立的先后顺序返回,不管你是升序或者是降序,结果都是一样的

lucene 索引中文档的属性建立与不建立带来的影响总结相关推荐

  1. 深入 Lucene 索引机制

    简介: Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能.Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即 ...

  2. Lucene索引的建立

    Lucene索引的建立 Lucene是完全开源的全文搜索引擎,但不是一个具体的应用App.你需要自己进行一些搭建.但是基本上函数类都是已经提供好了的.最初是Java版的,但由于lucene的高性能,其 ...

  3. lucene全文搜索之三:生成索引字段,创建索引文档(给索引字段加权)基于lucene5.5.3...

    前言:上一章中我们已经实现了索引器的创建,但是我们没有索引文档,本章将会讲解如何生成字段.创建索引文档,给字段加权以及保存文档到索引器目录 luncene5.5.3集合jar包下载地址:http:// ...

  4. lucene: 索引建立完后无法查看索引文件中的数据

    索引建立时 1.对原有索引文件进行建立,是可以访问索引文件中的数据的 2.建立新索引文件,必须等建立完毕后,才可以访问,新建立的文件如果没有建立完是不可以被访问的 如果想建立200w的数据的索引又想立 ...

  5. Lucene学习总结之四:Lucene索引过程分析

    对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后 ...

  6. lucene详细说明文档

    以下部门功能在lucene5以上版本可能有的API所有改变 目录 1.简介 2.了解索引操作 2.1倒排索引 2.2字段类型 2.3细分 2.4文件编号 2.5搜索索引 3.创建索引 4.基本索引操作 ...

  7. 基于Lucene的中文文本分词

    王继明,杨国林 (内蒙古工业大学信息工程学院,呼和浩特010051) 摘要:中文文本分词技术是文本挖掘领域的一个重要分支,在中国仍然处于发展阶段.Apache Jakarta的开源工程Lucene是一 ...

  8. Lucene 索引文件的生成(二十三)之fdxfdtfdm

    从本篇文章开始介绍用于描述存储域(存储域的概念见文章索引文件之fdx&&fdt&&fdm)的索引文件.fdx..fdt..fdm的生成过程,直接给出流程图: 图1:   ...

  9. Lucene 索引原理

    参考文章:时间序列数据库的秘密 (2)--索引 目录 1.Lucene 的倒排索引 2.Lucene 的联合查询 (1)skip list (2)Bitmap Lucene 基于倒排索引实现比关系型数 ...

最新文章

  1. [翻译] Ruby Golf
  2. Java之 将程序打包成jar包
  3. 【Android RTMP】RTMP 直播推流阶段总结 ( 服务器端搭建 | Android 手机端编码推流 | 电脑端观看直播 | 服务器状态查看 )
  4. Terrarium 1.2
  5. keyshot详细安装教程
  6. php7 字符串,php7 参数、整形及字符串处理机制修改实例分析
  7. html有序列表序号怎么变色,html – 如何正确标记/样式有序列表以补偿大项目编号...
  8. vue2.0的Element UI的表格table列时间戳格式化
  9. Wannafly挑战赛14 F
  10. Python中list,tuple,dict,set的区别和用法
  11. 为什么交叉熵损失函数可以用作逻辑回归的损失函数?
  12. Oracle数据库常用sql语句
  13. 《企业IT架构转型之道》读后感(一)
  14. LiveGBS流媒体平台GB/T28181常见问题-海康大华宇视监控设备安防摄像头等设备注册不上来如何检查问题?
  15. “弹出USB大容量存储设备时出问题”的解决方法
  16. Python---PDF旋转角度
  17. 颜色的RGBnbsp;指数
  18. 计算机管理器找不到打印机驱动,电脑提示“无法找到打印机驱动程序包要求的核心驱动”解决方法...
  19. 用HTML+CSS做一个漂亮简单大学生校园班级网页
  20. 高通8953平台usb转以太网芯片ax88772驱动

热门文章

  1. Spring Boot常见应用属性默认值
  2. 1-2 输出N个数的平方和立方值
  3. docker-ovs遇到的问题以及解决办法
  4. 让我的网站变成响应式的3个简单步骤
  5. 疯狂的ASP.NET系列-第一篇:啥是ASP.NET
  6. ASP.NET 程序中常用的三十三种代码
  7. caffeine 弱引用key的实现
  8. spark broadcast的TorrentBroadcast实现
  9. 01 | 基础架构:一条SQL查询语句是如何执行的?笔记(转)
  10. Java企业面试算法新得体会之3二叉树问题24问