Lucene入门教程:
http://blog.csdn.net/tianlincao/article/details/6867127/
Lucene教程:
http://www.cnblogs.com/zhuxiaojie/p/5277219.html

步骤:
1、索引创建
2、文本搜索

注意:
1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题
2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况
3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。
4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0
5、默认的评分机制不太合理,需要根据自己的业务定制

搜索引擎-Lucene相关推荐

  1. 一个例子学懂搜索引擎(lucene)

    http://www.vifir.com/html/20080827/1703937.html 一个例子学懂搜索引擎(lucene) 来源:javaeye 作者: phz50 2008-08-27 1 ...

  2. 搜索引擎lucene

    引用:http://baike.baidu.com/view/371811.htm Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它 ...

  3. 搜索引擎lucene点滴

    搜索引擎lucene点滴 在项目中有用到搜索引擎lucene.现将学到的lucene中的一些知识点和用法的做了下总结,希望能够对大家有所帮助. 本项目中的lucene使用概述:在Portal项目中lu ...

  4. 5分钟了解搜索引擎Lucene的原理

    场景 假设现在有10W+份word文档,让你做个web页面,给出关键词能快速搜索结果,你会怎么做?那至少有3种方案, 顺序扫描,每次检测文档中是否包含关键词,包含则加入结果列表,不包含继续查找下一个, ...

  5. 阿里P8架构师谈:开源搜索引擎Lucene、Solr、Sphinx等优劣势比较

    开源搜索引擎分类 1.Lucene系搜索引擎,java开发,包括: Lucene Solr Elasticsearch Katta.Compass等都是基于Lucene封装. 你可以想象Lucene系 ...

  6. 主流搜索引擎Lucene,Solr,ElasticSearch

    Lucene Lucene是一个Java全文搜索引擎,完全用Java编写.Lucene不是一个完整的应用程序,而是一个代码库和API,可以很容易地用于向应用程序添加搜索功能. 可扩展的高性能索引 在现 ...

  7. 开发自己的搜索引擎--Lucene 2.0+Heriterx(目录)

    第一篇  搜索引擎入门 第1章  搜索引擎与信息检索    1 1.1  搜索引擎的历史    1 1.1.1  萌芽:Archie.Gopher    1 1.1.2  起步:Robot(网络机器人 ...

  8. Elasticsearch - 搜索引擎Lucene

    1.1. Scaling Lucene 怎样在Lucene之上构建一个分布式.高度伸缩.接近实时的搜索引擎呢? 让我们回顾一下在搜索引擎(基于lucene)伸缩性这条路上都做了那些尝试,并且elast ...

  9. 搜索引擎Lucene(6):查询结果高亮及词频提取

    1.结果高亮 Lucene对高亮显示提供 了两种实现模式,Highlighter和FastVectorHighlighter.FastVectorHighlighter速度快,功能更完美.但其是有一定 ...

  10. 文本搜索引擎Lucene之filed详解和代码测试

    1.索引创建和查询过程 文档数据采集,一般是数据库的数据和爬虫获取的数据.而Lucene不提供信息采集的类库,需要自己编写一个爬虫程序实现信息采集,也可以通过一些开源软件实现信息采集,如下: Solr ...

最新文章

  1. 开启2020高效办公,从团队知识管理开始
  2. 看懂了这套书,你就看懂了程序的灵魂。
  3. Android 隐藏状态栏,沉浸式状态栏,状态栏背景色,状态栏字体色,透明状态工具类
  4. java完全数判断_java基础之完数判断
  5. 订单生产计划表范本_服装生产管理必看丨一文解决车间管理混乱
  6. UC伯克利超酷研究:舞痴和舞王之间,只差一个神经网络
  7. 省选专练[USACO18JAN]Stamp Painting
  8. 请实现一个函数,将一个字符串中的每个空格替换成...
  9. 关于ext4 simg fill chunk type
  10. 2010考研数学二第(20)题——多元积分学:二重积分计算
  11. Dennis M. Ritchie(丹尼斯里奇)
  12. android 格式化sd咔_在Android手机上永久格式化SD卡
  13. 【清北学堂】dwarf
  14. B002 - 基于嵌入式的老人定位追踪监测仪
  15. iOS开发-简单图片背景替换 实现抠图效果
  16. 计算机审计体会论文,审计论文格式_计算机审计实验报告_审计论文范文3000字
  17. sht30 linux示例代码,SHT30 Linux标准 i2c-dev 读取程序
  18. 生态篇-HBase 进化之从 NoSQL 到 NewSQL,凤凰涅槃成就 Phoenix...
  19. python pandas excel 排序_Python pandas对excel的操作实现示例
  20. 世界国家 的数据库sql

热门文章

  1. 漫画:寻找无序数组的第k大元素
  2. 内存管理——高端内存
  3. HTML5方式使用freeswitch——VERTO模块
  4. SQlite数据库的C编程接口(五) 便捷函数(Convenience Functions) ——《Using SQlite》读书笔记
  5. 从Slice_Header学习H.264(三.1)--相关细节之 POC的计算
  6. linux VM中复制虚拟机后eth0变成eth1
  7. python输入人名对话_对话框中的用户输入
  8. dwcs6连接不上access数据库_dw连接access数据库的技巧
  9. logistic回归详解(三):梯度下降训练方法
  10. shell 逐行读取文件