1.术语

lucene 在存储它的全文索引结构时,是有层次结构的,这涉及到5个层次:索引(Index);段(Segment);文档(Document);域(Field);词(Term),他们的关系如下图所示:(lucene 索引存储结构概念图)

下图是Lucene生成的索引的一个实例,右边是对这5个层次的描述:

2.基本原理

2.1 lucene架构

2.2 创建索引

IndexWriter W = new IndexWriter(FSDirectory.open(indexdir),

new  StandardAnalyzer(version.LUCENE_30,IndexWriter.MaxFieldLength.UNLIMITED));

2.3 查询索引

3.参考资料

【1】https://blog.csdn.net/ghj1976/article/details/5586329

【2】https://sebol.webs.com/architectureoverview.htm

【3】https://sebol.webs.com/creatingaluceneindex.htm

【4】https://sebol.webs.com/searchingtheindex.htm

转载于:https://www.cnblogs.com/davidwang456/p/9933512.html

lucene基本原理相关推荐

  1. Lucene 基本原理(一)初识

    1.什么是Lucene? (1)根据Lucene官网的定义,Lucene包含: Lucene Core  旗舰子项目,提供基于Java的索引和搜索技术,以及拼写检查,高亮显示和优秀的分析/标记能力. ...

  2. 理解Lucene中的Query

    Query是一个接口,它有很多实现类. QueryParser是Query解析器,用于将一个字符串解析为一个Query对象,这个Query对象可能属于TermQuery,也可能属于PhraseQuer ...

  3. Lucene 的原理

    查看全文 http://www.taodudu.cc/news/show-3619021.html 相关文章: Lucene原理剖析 Lucene 索引原理 lucene原理 Lucene原理分析 白 ...

  4. ElasticSearch 基本原理(三)ElasticSearch与Lucene、Solr、Mysql的关系

    信息检索包含内容非常广,包含文本(搜索引擎). 图片(以图搜索).音频(歌曲识别).视频等多种类型数据的检索.为了高效的检索,通常都用建立索引的方式提高检索速度.因为不同类型的数据存储格式.特征提取方 ...

  5. 分布式搜索 Lucene全文检索基本原理

    一.总论 根据http://lucene.apache.org/java/docs/index.html 定义: Lucene 是一个高效的,基于Java 的全文检索库. 所以在了解Lucene之前要 ...

  6. Solr和lucene

    1. Solr 是什么? Solr它是一种开放源码的.基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中.Solr 提供了层面搜索(就是统计).命中醒目显示并且支持多种输出格式 ...

  7. lucene .doc文件格式解析——见图

    摘自:http://forfuture1978.iteye.com/blog/546841 4.2.2. 文档号及词频(frq)信息 文档号及词频文件里面保存的是倒排表,是以跳跃表形式存在的. 此文件 ...

  8. 剖析Elasticsearch集群系列第二篇 分布式的三个C、translog和Lucene段

    http://www.infoq.com/cn/articles/anatomy-of-an-elasticsearch-cluster-part02?utm_source=infoq&utm ...

  9. Lucene学习总结之六:Lucene打分公式的数学推导

     Lucene学习总结之六:Lucene打分公式的数学推导 在进行Lucene的搜索过程解析之前,有必要单独的一张把Lucene score公式的推导,各部分的意义阐述一下.因为Lucene的搜索 ...

最新文章

  1. Java设计模式(建造者模式-适配器模式-桥接模式)
  2. 学习笔记(2)IPC机制
  3. LeetCode Keyboard Row
  4. python读取xml_python解析xml文件
  5. js验证input输入框(字母,数字,符号,中文)
  6. 【转】_declspec(naked) 使用
  7. 如何绘制逻辑图 — 5. 要素的属性:系统与模块
  8. 产生随机小数_如果取到小数区间内的任一数字?
  9. UOJ14 UER #1 DZY Loves Graph(最小生成树+并查集)
  10. 第1章 神经网络的思想
  11. ibm的服务器怎么重装系统,ibm服务器系统安装的具体教程
  12. 测试手机烧屏的软件,还能修手机烧屏?安卓手机屏幕测试神器
  13. 《软件质量保证与测试》学习笔记【第一章 软件测试基本概念】
  14. 算法总结与学习心得体会
  15. win7修改ftp服务器密码,win7ftp服务器设置用户名密码设置
  16. Git撤销操作之使用--amend改写单次提交
  17. 【树莓派C语言开发】实验11:U型光电传感器
  18. 【C++】(九)作用域、生命期、头文件和工程文件
  19. mysql_backups
  20. 《乐队的夏天》刺猬乐队下半年音乐节巡演时间表

热门文章

  1. linux中分区乱了,找到了linux分区顺序错乱修复方法
  2. php将字符串转成json字符串数组,php数组怎么转成json字符串
  3. 5位随机数重复的概率 php_php防止表单重复提交的方法
  4. php fpm error,关于启动php-fpm失败的解决办法
  5. Leetcode 98. 验证二叉搜索树 (每日一题 20210810)
  6. 特征工程-统计数据特征
  7. F5 BIG-IP 远程代码执行漏洞 CVE-2021-22986 虚拟机上复现
  8. scipy笔记:scipy.sparse
  9. Python可视化应用实战-如何制作酷炫的图表?
  10. 以MATLAB的方式实现微积分问题的计算机求解问题及解决方案集锦(一)