Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。人们经常提到信息检索程序库,虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆。 [1]

参考注意。没有测试

 <dependencies><dependency><!-- 发送http请求 --><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.2</version></dependency><dependency><groupId>org.apache.logging.log4j</groupId><artifactId>log4j-api</artifactId><version>2.3</version></dependency><dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.2</version></dependency><dependency><groupId>org.slf4j</groupId><artifactId>slf4j-log4j12</artifactId><version>1.7.25</version><scope>test</scope></dependency><dependency><!--lucene的核心  --><groupId>arg.apache.lucene</groupId><artifactId>lucene-core</artifactId><version>6.6.0</version></dependency><dependency><!--lucene的分词器  有标准的英文相关分词器  没有中文的  --><groupId>org.apache.lucene</groupId><artifactId>lucene-analyzers-common</artifactId><version>6.6.0</version></dependency><dependency><!-- 查询解析器 --><groupId>org.apache.lucene</groupId><artifactId>lucene-queryparser</artifactId><version>6.6.0</version></dependency><dependency><!-- 各种查询方式  --><groupId>org.apache.lucene</groupId><artifactId>lucene-queries</artifactId><version>6.6.0</version></dependency><dependency><!-- 关键字高亮 --><groupId>org.apache.lucene</groupId><artifactId>lucene-highlighter</artifactId><version>6.6.0</version></dependency><dependency><groupId>org.apache.lucene</groupId><artifactId>lucene-demo</artifactId><version>6.6.0</version></dependency><dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.12</version></dependency></dependencies>

转载于:https://www.cnblogs.com/JBLi/p/10898199.html

lucene 全文检索引擎的架构相关推荐

  1. 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示4

    前面总结的都是使用Lucene的标准分词器,这是针对英文的,但是中文的话就不顶用了,因为中文的语汇与英文是不同的,所以一般我们开发的时候,有中文的话肯定要使用中文分词了,这一篇博文主要介绍一下如何使用 ...

  2. 【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示

    欢迎关注我新搭建的博客:http://www.itcodai.com/ 前面总结的都是使用Lucene的标准分词器,这是针对英文的,但是中文的话就不顶用了,因为中文的语汇与英文是不同的,所以一般我们开 ...

  3. lucene配置动态域_学位论文查重中如何使用Lucene全文检索

    本系统用的是Lucene全文检索架构,Lucene作为一个全文检索引擎框架,在构建机制上有众多明显的优点:首先,它可以对任何可以转化成文本格式的数据进行索引的创建,而学术论文包含的doc.PDF和CA ...

  4. Solr or Lucene全文检索实现原理

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过Http Get操 ...

  5. Lucene—全文检索工具包

    一.Lucene简介 Lucene是Apache Jakarta家族中的⼀个开源项目,是⼀个开放源代码的全文检索引擎工具包,但它不是⼀个 完整的 全文检索引擎,而是⼀个全文检索引擎的架构,提供了完整的 ...

  6. Apache Lucene Java 全文检索引擎架构

    Apache Lucene Java 全文检索引擎架构 Apache Lucene 8.9.0 已发布,Lucene 是完全用 Java 编写的高性能.功能齐全的全文检索引擎架构,提供了完整的查询引擎 ...

  7. Lucene:基于Java的全文检索引擎简介(转载)

    Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基 ...

  8. Lucene:基于Java的全文检索引擎简介 车东

    Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基 ...

  9. Lucene开源全文检索引擎快速入门

    Lucene是一个用Java开发的开源全文检索引擎,官网是:http://lucene.apache.org/ ,Lucene不是一个完整的全文索引应用(与之对应的是solr),而是是一个用Java写 ...

最新文章

  1. linux蓝牙设备无法打开,linux 下 无线 wifi 蓝牙 无法启用
  2. openssl 代码分析(1)
  3. python根据文件名获取文件路径_python 查看文件名和文件路径
  4. Asterisk权威指南/第三章 安装Asterisk
  5. 面试基础算法、及编程 第一弹
  6. 软件接口设计_基于PREEvision的AUTOSAR Adaptive设计——上篇
  7. FreeRTOS内存管理
  8. 【实习笔试面试题】2013网易互联网实习笔试算法题-找出最大连续自然数个数
  9. HashMap Hashtable区别
  10. yuv420图文详解
  11. labview 变量
  12. 腾讯实习生招聘笔试题目
  13. python中输出某段文字_Python如何输出字符串中字符出现的个数
  14. Wrong FS: hdfs://......, expected: file:///
  15. Struts2实现通过浏览器返回一个helloworld页面给用户
  16. C# 使用VS建立数据库并使用
  17. C语言课程设计:课程管理系统
  18. STC89C52RC烧录程序
  19. 类似print shopmail可变数据生成,排版、拼版实现
  20. android人脸抠图,人脸框抠图如何实现

热门文章

  1. hotspot虚拟机的调试
  2. docker dead but pid file exists 问题
  3. System.Threading.Timer 定时器的用法
  4. 第二章课后习题2-5
  5. OpenVINO 部署 Mask-RCNN 实例分割
  6. 帝国理工学院暑期学校 | 大数据与创新主题,郭院士领衔,全球Top10校级证书...
  7. 灵活高效,内含SOTA模型,Facebook开源图像分类研究代码库pycls
  8. 由浅入深|让你彻底理解Python中的yield
  9. 人生苦短,Python值得!这些Pandas隐藏小技巧你知道吗?
  10. 【机器学习】机器学习从零到掌握之八 -- 教你读懂决策树原理