Apache Lucene Java 全文检索引擎架构

Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

发布公告显示,此版本修复了许多错误,同时包含其他的功能优化和改进。

  • SortedSet DocValues 添加了压缩功能,可以显着减少它们在磁盘上的占用体积
  • BM25FQuery 被扩展为处理 BM25Similarity 之外的相似性。它被重命名为 CombinedFieldQuery 以反映其更通用的范围
  • 添加了新的 PatternTypingFilter 以允许基于一组已配置的正则表达式在 token 上设置类型属性
  • 添加了一个选项来为 IndexWriter 和 DirectoryReader 提供自定义叶排序器,它允许使用提供的 sort criteria 加速排序查询

完整更新内容查看 Changelog。

下载地址:https://lucene.apache.org/core/downloads.html

Apache Lucene Java 全文检索引擎架构相关推荐

  1. 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示4

    前面总结的都是使用Lucene的标准分词器,这是针对英文的,但是中文的话就不顶用了,因为中文的语汇与英文是不同的,所以一般我们开发的时候,有中文的话肯定要使用中文分词了,这一篇博文主要介绍一下如何使用 ...

  2. 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示

    欢迎关注我新搭建的博客:http://www.itcodai.com/ 前面总结的都是使用Lucene的标准分词器,这是针对英文的,但是中文的话就不顶用了,因为中文的语汇与英文是不同的,所以一般我们开 ...

  3. Lucene开源全文检索引擎快速入门

    Lucene是一个用Java开发的开源全文检索引擎,官网是:http://lucene.apache.org/ ,Lucene不是一个完整的全文索引应用(与之对应的是solr),而是是一个用Java写 ...

  4. Lucene:基于Java的全文检索引擎简介(转载)

    Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基 ...

  5. Lucene:基于Java的全文检索引擎简介 车东

    Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基 ...

  6. lucene 全文检索引擎的架构

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引 ...

  7. 【手把手教你全文检索】Apache Lucene初探

    讲解之前,先来分享一些资料 首先呢,学习任何一门新的亦或是旧的开源技术,百度其中一二是最简单的办法,先了解其中的大概,思想等等.这里就贡献一个讲解很到位的ppt.已经被我转成了PDF,便于搜藏. 其次 ...

  8. Apache Lucene与Lucene.Net——全文检索服务器

    lucene学习教程 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品.因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一 ...

  9. java hibernate错误org/dom4j/DocumentException、org/jboss/logging/BasicLogger、org/apache/lucene/index...

    很久没有看java的,今天运行一个以前的hibernate程序: 先报错,org/dom4j/DocumentException: 根据资料,原因是没有导入 dom4j-1.6.1.jar:下载此ja ...

最新文章

  1. 谷歌54量子计算机,量子计算机要来了:谷歌开发了一种名为“ Sycamore”的新型54比特处理器,其200秒产生的输出将需要世界上最快的超级计算机10,000年 - googleblog...
  2. 从文本分类来看图卷积神经网络
  3. UESTC 趣味赛命题报告E
  4. HBase原理-要弄懂的sequenceId
  5. springboot怎么杀进程_全新Steam在线游戏 Among us太空狼人杀攻略
  6. 小程序,修改数组或对象中的值,通过input动态修改数组对象中的值
  7. java redis tokenid_基于Spring及Redis的Token鉴权
  8. html一个页面多个动画,如何在单个html页面中添加两个相同的adobe边缘动画?
  9. 【luogu3373】模板 线段树 2
  10. [转载] java中对象作为参数传递给一个方法,到底是值传递,还是引用传递
  11. SA / SAM 题目集
  12. geexbox 编译
  13. 在进行Forms身份验证时如何将此信息映射到GenericPrincipal 和 FormsIdentity 对象?
  14. x-bov16 firmware android,MSD0431XX 松下
  15. 每周推荐短视频:道哥表达了对自动驾驶技术的感恩之情
  16. 问题解决:Unable to establish SSL connection.
  17. C# 使用NAudio合并mp3、wav音频文件
  18. 【informix】informix 日期字段
  19. 基于xlsx-populate实现的前端埋点导出
  20. jcyzoj1505: 原地tp

热门文章

  1. Android 使用ViewPager实现画廊Gallery效果
  2. 用CSS3写圆角(超简单)
  3. Koding VM 配置nginx 小记
  4. 鸟哥Linux服务器-8
  5. html向php传中文没有值,php - 为什么我的PHP / HTML表单没有向我发送数据 - SO中文参考 - www.soinside.com...
  6. java学习(三)内部类
  7. 数控直线工作台直线控制系统的simulink仿真
  8. html网页的配色,css页面网页配色
  9. AcWing 841. 字符串哈希(字符串Hash)
  10. 磁盘一把锁一个感叹号_TBase中的一些锁