lucene学习笔记

我目前正在与一个团队合作,开始一个基于Lucene的新项目。 虽然大多数时候我会争论使用Solr还是Elasticsearch而不是简单的Lucene,但这是一个有意识的决定。 在这篇文章中,我正在整理一些学习Lucene的资源–希望您对他们有所帮助,或者可以提示我错过了哪些资源。

项目文件

当然,首选的是出色的项目文档 。 它包含所有模块的Javadoc(最重要的模块是core , analyzers-common和queryparser ),还包含进一步的文档,例如,一个简单的演示应用程序的说明以及对分析 , 查询和评分的有用介绍。 您可能还对标准索引文件格式感兴趣。

除了发行版随附的文档外, 项目Wiki中还有很多信息,但您需要知道要查找的内容。 您还可以加入邮件列表以了解其他用户的操作。

查看分析仪组件时, Solr Start网站可能会有用。 尽管专用于Solr ,但分析器组件的列表对于确定Lucene 的分析器也很有用。 它还包含Javadocs的可搜索版本 。

图书

有关该主题的经典书籍是《 Lucene in Action》 。 在超过500页上,它详细解释了所有基本概念。 不幸的是,其中一些信息已经过时,许多代码示例不再起作用。 此外,不包括较新的概念。 仍然是学习Lucene的推荐文章。

我读过的另一本书是在Packt出版的Lucene 4 Cookbook 。 它包含更多当前示例,但不适合学习基础知识。 另外,在我看来,好像没有任何编辑在写这本书,有很多重复,错别字和断句。 (我在写博客时会犯很多语法错误,但我希望从出版的书中得到更多的语法。)

您还可以通过在基于Lucene的其中一台搜索服务器上阅读一本书来了解有关Lucene不同方面的很多知识。 我可以推荐《 Elasticsearch in Action》 ,《 Solr in Action》和《 Elasticsearch – The Definitive Guide》 。 (如果您会读德语,那我当然是在邀请您阅读有关Elasticsearch的书 。)

博客,会议和视频

关于Lucene的博客文章不计其数,非常好的介绍是Andrew Montalenti撰写的Lucene:The Good Parts 。 一些博客在Lucene上发布常规文章,推荐的则是Mike McCandless (现在主要是弹性Blog上的博客 ), OpenSource Connections , Flax和Uwe Schindler 。 弹性Blog上有很多有关Lucene的内容,如果您想了解当前的发展,我可以推荐“ Elasticsearch和Apache Lucene的本周”系列。 Lucidworks博客上也有一些有趣的帖子,我敢肯定,我在这里忘记提及很多其他博客。

Lucene是两个较大的会议的常规主题: Lucene / Solr Revolution和Berlin Buzzwords 。 您可以在他们的网站上找到许多有关过去事件的录像。

资料来源

最后,该项目是开源的,因此您可以通过阅读库或测试的源代码来了解很多内容。

另一种选择是查看使用它的应用程序,Solr和Elasticsearch。 当然,您需要围绕项目的源头找到自己的方式,但是有时候这并不难。 Elasticsearch的一个示例:如果您想了解如何在Lucene中实现常见的multi_match-Query,您将很容易找到创建Lucene查询的MultiMatchQuery类。

我错过了什么?

希望这篇文章对您有用。 我确信我错过了许多学习Lucene的宝贵资源。 如果您想添加一个,请在评论中或在Twitter上告诉我。

翻译自: https://www.javacodegeeks.com/2016/05/learning-lucene-2.html

lucene学习笔记

lucene学习笔记_学习Lucene相关推荐

  1. 大数据业务学习笔记_学习业务成为一名出色的数据科学家

    大数据业务学习笔记 意见 (Opinion) A lot of aspiring Data Scientists think what they need to become a Data Scien ...

  2. oracle11g中用asmlib配置磁盘组,ASM学习笔记_配置ASMLIB磁盘组

    ASM学习笔记_配置ASMLIB磁盘组 目录 1 ASMLIB Introduction 2 虚拟机添加一个共享磁盘(块设备) 3 下载,安装ASMLIB 4 配置,使用ASMLib 磁盘组 #### ...

  3. MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结

    MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结 一.VARCHAR存储和行长度限制 1.VARCHAR(N)中,N指的是字符的长度,VARCHAR类型最大支持65535,指的是 ...

  4. 系统架构师学习笔记_第六章(下)_连载

    系统架构师学习笔记_第六章(下)_连载 6.3 基于 UML 的软件开发过程 6.3.1  开发过程概述 UML 是独立于软件开发过程的,能够在几乎任何一种软件开发过程中使用.迭代的渐进式软件开发过程 ...

  5. Go学习笔记_环境搭建

    Go学习笔记_环境搭建 Go背景知识 go的特点(官网): Build fast, reliable, and efficient software at scale- Go is an open s ...

  6. c语言用位运算将一个数清零,C语言学习笔记_位运算

    C语言学习笔记_位运算 知识点记录 基本位运算 按位与:全1为1,见0为0:与1相与无变化,与0相与变为0:可用于特定位清零 按位或:见1为1,全0为0:与1相或变为1,与0相或无变化:可用于特定位置 ...

  7. 数字IC设计学习笔记_静态时序分析STA_ STA基本概念

    数字IC设计学习笔记 STA基本概念 1. STA基本概念 2. 时序弧概念 Timing Arc 3. 建立时间和保持时间概念 4. 时序路径概念Timing Path 5. 时钟域概念clock ...

  8. 模电学习笔记_双极型晶体管及其放大电路(4)

    前置:模电学习笔记_双极型晶体管及其放大电路(3) 一.基本知识点 2.5 晶体管单管放大电路的三种基本组态 2.5.1 共集放大电路(射极输出器.射极跟随器) 1.主要特点:高输入阻抗,低输出阻抗, ...

  9. 模电学习笔记_双极型晶体管及其放大电路(2)

    前置:双极型晶体管及其放大电路(1) 一.基本知识点 补充:集成电路中元器件的特点 1.单个元件的参数精度不高,且受温度影响较大,但参数对称性及温度对称性较好.批量间差异较大 2.集成电路工艺制造出的 ...

最新文章

  1. 针对IE6\7\8\9\10浏览器的CSS hack大全详解
  2. OpenMP在ARM-Linux以及NDK中的编译和使用
  3. 学习笔记(1)centos7 下安装nginx
  4. Subject 在 SAP Spartacus Popover Component 中的应用
  5. LeetCode 1743. 从相邻元素对还原数组(拓扑排序)
  6. Java多线程(线程同步)
  7. 会优化,你真的会优化吗?其实你可能真的缺少一份理解【数据库篇】
  8. matlab无法识别VS编译器的办法
  9. vbs画动态爱心代码_求助,求一个vbs画心形的代码(程序小白的求助)
  10. 基于多租户的云计算Overlay网络
  11. 完整的连接器设计手册_连接器退化机理是什么?(一)
  12. Deepin 20.1 安装nvidia显卡驱动 爬坑
  13. 机器学习必须要会的:方差、标准差、相对标准偏差、正态分布的概念
  14. 微信小程序swiper组件切换+个人资料展示
  15. revel MySQL_Go-Revel:Gorp连接MySQL
  16. Flutter 设置 App 的主色调与字体
  17. react中的this.state与this.setState的区别
  18. 数学建模中的插值问题
  19. round在python是什么意思_细说python中的round()方法
  20. MATLAB音频信号处理(一):函数简易用法(audioread,sound函数)

热门文章

  1. CodeForces:372(div1)div373(div2)
  2. P4287-[SHOI2011]双倍回文【PAM】
  3. 欢乐纪中某A组赛【2019.7.5】
  4. CF559C-Gerald and Giant Chess【计数类dp】
  5. 【状压DP】十二桥问题(nowcoder 1104-B)
  6. 【Floyed】【最短路】商店选址问题(ssl 1760)
  7. L2-016 愿天下有情人都是失散多年的兄妹 CCCC
  8. SpringCloud Zuul(一)之介绍
  9. Druid SQL查询数据timeStamp时区问题
  10. [初级]Java中的switch对整型、字符型、字符串的具体实现细节