lucene基本原理
1.术语
lucene 在存储它的全文索引结构时,是有层次结构的,这涉及到5个层次:索引(Index);段(Segment);文档(Document);域(Field);词(Term),他们的关系如下图所示:(lucene 索引存储结构概念图)
下图是Lucene生成的索引的一个实例,右边是对这5个层次的描述:
2.基本原理
2.1 lucene架构
2.2 创建索引
IndexWriter W = new IndexWriter(FSDirectory.open(indexdir), new StandardAnalyzer(version.LUCENE_30,IndexWriter.MaxFieldLength.UNLIMITED)); |
2.3 查询索引
3.参考资料
【1】https://blog.csdn.net/ghj1976/article/details/5586329
【2】https://sebol.webs.com/architectureoverview.htm
【3】https://sebol.webs.com/creatingaluceneindex.htm
【4】https://sebol.webs.com/searchingtheindex.htm
转载于:https://www.cnblogs.com/davidwang456/p/9933512.html
lucene基本原理相关推荐
- Lucene 基本原理(一)初识
1.什么是Lucene? (1)根据Lucene官网的定义,Lucene包含: Lucene Core 旗舰子项目,提供基于Java的索引和搜索技术,以及拼写检查,高亮显示和优秀的分析/标记能力. ...
- 理解Lucene中的Query
Query是一个接口,它有很多实现类. QueryParser是Query解析器,用于将一个字符串解析为一个Query对象,这个Query对象可能属于TermQuery,也可能属于PhraseQuer ...
- Lucene 的原理
查看全文 http://www.taodudu.cc/news/show-3619021.html 相关文章: Lucene原理剖析 Lucene 索引原理 lucene原理 Lucene原理分析 白 ...
- ElasticSearch 基本原理(三)ElasticSearch与Lucene、Solr、Mysql的关系
信息检索包含内容非常广,包含文本(搜索引擎). 图片(以图搜索).音频(歌曲识别).视频等多种类型数据的检索.为了高效的检索,通常都用建立索引的方式提高检索速度.因为不同类型的数据存储格式.特征提取方 ...
- 分布式搜索 Lucene全文检索基本原理
一.总论 根据http://lucene.apache.org/java/docs/index.html 定义: Lucene 是一个高效的,基于Java 的全文检索库. 所以在了解Lucene之前要 ...
- Solr和lucene
1. Solr 是什么? Solr它是一种开放源码的.基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中.Solr 提供了层面搜索(就是统计).命中醒目显示并且支持多种输出格式 ...
- lucene .doc文件格式解析——见图
摘自:http://forfuture1978.iteye.com/blog/546841 4.2.2. 文档号及词频(frq)信息 文档号及词频文件里面保存的是倒排表,是以跳跃表形式存在的. 此文件 ...
- 剖析Elasticsearch集群系列第二篇 分布式的三个C、translog和Lucene段
http://www.infoq.com/cn/articles/anatomy-of-an-elasticsearch-cluster-part02?utm_source=infoq&utm ...
- Lucene学习总结之六:Lucene打分公式的数学推导
Lucene学习总结之六:Lucene打分公式的数学推导 在进行Lucene的搜索过程解析之前,有必要单独的一张把Lucene score公式的推导,各部分的意义阐述一下.因为Lucene的搜索 ...
最新文章
- Java设计模式(建造者模式-适配器模式-桥接模式)
- 学习笔记(2)IPC机制
- LeetCode Keyboard Row
- python读取xml_python解析xml文件
- js验证input输入框(字母,数字,符号,中文)
- 【转】_declspec(naked) 使用
- 如何绘制逻辑图 — 5. 要素的属性:系统与模块
- 产生随机小数_如果取到小数区间内的任一数字?
- UOJ14 UER #1 DZY Loves Graph(最小生成树+并查集)
- 第1章 神经网络的思想
- ibm的服务器怎么重装系统,ibm服务器系统安装的具体教程
- 测试手机烧屏的软件,还能修手机烧屏?安卓手机屏幕测试神器
- 《软件质量保证与测试》学习笔记【第一章 软件测试基本概念】
- 算法总结与学习心得体会
- win7修改ftp服务器密码,win7ftp服务器设置用户名密码设置
- Git撤销操作之使用--amend改写单次提交
- 【树莓派C语言开发】实验11:U型光电传感器
- 【C++】(九)作用域、生命期、头文件和工程文件
- mysql_backups
- 《乐队的夏天》刺猬乐队下半年音乐节巡演时间表
热门文章
- linux中分区乱了,找到了linux分区顺序错乱修复方法
- php将字符串转成json字符串数组,php数组怎么转成json字符串
- 5位随机数重复的概率 php_php防止表单重复提交的方法
- php fpm error,关于启动php-fpm失败的解决办法
- Leetcode 98. 验证二叉搜索树 (每日一题 20210810)
- 特征工程-统计数据特征
- F5 BIG-IP 远程代码执行漏洞 CVE-2021-22986 虚拟机上复现
- scipy笔记:scipy.sparse
- Python可视化应用实战-如何制作酷炫的图表?
- 以MATLAB的方式实现微积分问题的计算机求解问题及解决方案集锦(一)