lucene学习笔记_学习Lucene
lucene学习笔记
我目前正在与一个团队合作,开始一个基于Lucene的新项目。 虽然大多数时候我会争论使用Solr还是Elasticsearch而不是简单的Lucene,但这是一个有意识的决定。 在这篇文章中,我正在整理一些学习Lucene的资源–希望您对他们有所帮助,或者可以提示我错过了哪些资源。
项目文件
当然,首选的是出色的项目文档 。 它包含所有模块的Javadoc(最重要的模块是core , analyzers-common和queryparser ),还包含进一步的文档,例如,一个简单的演示应用程序的说明以及对分析 , 查询和评分的有用介绍。 您可能还对标准索引文件格式感兴趣。
除了发行版随附的文档外, 项目Wiki中还有很多信息,但您需要知道要查找的内容。 您还可以加入邮件列表以了解其他用户的操作。
查看分析仪组件时, Solr Start网站可能会有用。 尽管专用于Solr ,但分析器组件的列表对于确定Lucene 的分析器也很有用。 它还包含Javadocs的可搜索版本 。
图书
有关该主题的经典书籍是《 Lucene in Action》 。 在超过500页上,它详细解释了所有基本概念。 不幸的是,其中一些信息已经过时,许多代码示例不再起作用。 此外,不包括较新的概念。 仍然是学习Lucene的推荐文章。
我读过的另一本书是在Packt出版的Lucene 4 Cookbook 。 它包含更多当前示例,但不适合学习基础知识。 另外,在我看来,好像没有任何编辑在写这本书,有很多重复,错别字和断句。 (我在写博客时会犯很多语法错误,但我希望从出版的书中得到更多的语法。)
您还可以通过在基于Lucene的其中一台搜索服务器上阅读一本书来了解有关Lucene不同方面的很多知识。 我可以推荐《 Elasticsearch in Action》 ,《 Solr in Action》和《 Elasticsearch – The Definitive Guide》 。 (如果您会读德语,那我当然是在邀请您阅读有关Elasticsearch的书 。)
博客,会议和视频
关于Lucene的博客文章不计其数,非常好的介绍是Andrew Montalenti撰写的Lucene:The Good Parts 。 一些博客在Lucene上发布常规文章,推荐的则是Mike McCandless (现在主要是弹性Blog上的博客 ), OpenSource Connections , Flax和Uwe Schindler 。 弹性Blog上有很多有关Lucene的内容,如果您想了解当前的发展,我可以推荐“ Elasticsearch和Apache Lucene的本周”系列。 Lucidworks博客上也有一些有趣的帖子,我敢肯定,我在这里忘记提及很多其他博客。
Lucene是两个较大的会议的常规主题: Lucene / Solr Revolution和Berlin Buzzwords 。 您可以在他们的网站上找到许多有关过去事件的录像。
资料来源
最后,该项目是开源的,因此您可以通过阅读库或测试的源代码来了解很多内容。
另一种选择是查看使用它的应用程序,Solr和Elasticsearch。 当然,您需要围绕项目的源头找到自己的方式,但是有时候这并不难。 Elasticsearch的一个示例:如果您想了解如何在Lucene中实现常见的multi_match-Query,您将很容易找到创建Lucene查询的MultiMatchQuery类。
我错过了什么?
希望这篇文章对您有用。 我确信我错过了许多学习Lucene的宝贵资源。 如果您想添加一个,请在评论中或在Twitter上告诉我。
翻译自: https://www.javacodegeeks.com/2016/05/learning-lucene-2.html
lucene学习笔记
lucene学习笔记_学习Lucene相关推荐
- 大数据业务学习笔记_学习业务成为一名出色的数据科学家
大数据业务学习笔记 意见 (Opinion) A lot of aspiring Data Scientists think what they need to become a Data Scien ...
- oracle11g中用asmlib配置磁盘组,ASM学习笔记_配置ASMLIB磁盘组
ASM学习笔记_配置ASMLIB磁盘组 目录 1 ASMLIB Introduction 2 虚拟机添加一个共享磁盘(块设备) 3 下载,安装ASMLIB 4 配置,使用ASMLib 磁盘组 #### ...
- MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结
MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结 一.VARCHAR存储和行长度限制 1.VARCHAR(N)中,N指的是字符的长度,VARCHAR类型最大支持65535,指的是 ...
- 系统架构师学习笔记_第六章(下)_连载
系统架构师学习笔记_第六章(下)_连载 6.3 基于 UML 的软件开发过程 6.3.1 开发过程概述 UML 是独立于软件开发过程的,能够在几乎任何一种软件开发过程中使用.迭代的渐进式软件开发过程 ...
- Go学习笔记_环境搭建
Go学习笔记_环境搭建 Go背景知识 go的特点(官网): Build fast, reliable, and efficient software at scale- Go is an open s ...
- c语言用位运算将一个数清零,C语言学习笔记_位运算
C语言学习笔记_位运算 知识点记录 基本位运算 按位与:全1为1,见0为0:与1相与无变化,与0相与变为0:可用于特定位清零 按位或:见1为1,全0为0:与1相或变为1,与0相或无变化:可用于特定位置 ...
- 数字IC设计学习笔记_静态时序分析STA_ STA基本概念
数字IC设计学习笔记 STA基本概念 1. STA基本概念 2. 时序弧概念 Timing Arc 3. 建立时间和保持时间概念 4. 时序路径概念Timing Path 5. 时钟域概念clock ...
- 模电学习笔记_双极型晶体管及其放大电路(4)
前置:模电学习笔记_双极型晶体管及其放大电路(3) 一.基本知识点 2.5 晶体管单管放大电路的三种基本组态 2.5.1 共集放大电路(射极输出器.射极跟随器) 1.主要特点:高输入阻抗,低输出阻抗, ...
- 模电学习笔记_双极型晶体管及其放大电路(2)
前置:双极型晶体管及其放大电路(1) 一.基本知识点 补充:集成电路中元器件的特点 1.单个元件的参数精度不高,且受温度影响较大,但参数对称性及温度对称性较好.批量间差异较大 2.集成电路工艺制造出的 ...
最新文章
- 针对IE6\7\8\9\10浏览器的CSS hack大全详解
- OpenMP在ARM-Linux以及NDK中的编译和使用
- 学习笔记(1)centos7 下安装nginx
- Subject 在 SAP Spartacus Popover Component 中的应用
- LeetCode 1743. 从相邻元素对还原数组(拓扑排序)
- Java多线程(线程同步)
- 会优化,你真的会优化吗?其实你可能真的缺少一份理解【数据库篇】
- matlab无法识别VS编译器的办法
- vbs画动态爱心代码_求助,求一个vbs画心形的代码(程序小白的求助)
- 基于多租户的云计算Overlay网络
- 完整的连接器设计手册_连接器退化机理是什么?(一)
- Deepin 20.1 安装nvidia显卡驱动 爬坑
- 机器学习必须要会的:方差、标准差、相对标准偏差、正态分布的概念
- 微信小程序swiper组件切换+个人资料展示
- revel MySQL_Go-Revel:Gorp连接MySQL
- Flutter 设置 App 的主色调与字体
- react中的this.state与this.setState的区别
- 数学建模中的插值问题
- round在python是什么意思_细说python中的round()方法
- MATLAB音频信号处理(一):函数简易用法(audioread,sound函数)
热门文章
- CodeForces:372(div1)div373(div2)
- P4287-[SHOI2011]双倍回文【PAM】
- 欢乐纪中某A组赛【2019.7.5】
- CF559C-Gerald and Giant Chess【计数类dp】
- 【状压DP】十二桥问题(nowcoder 1104-B)
- 【Floyed】【最短路】商店选址问题(ssl 1760)
- L2-016 愿天下有情人都是失散多年的兄妹 CCCC
- SpringCloud Zuul(一)之介绍
- Druid SQL查询数据timeStamp时区问题
- [初级]Java中的switch对整型、字符型、字符串的具体实现细节