搜索引擎-Lucene
Lucene入门教程:
http://blog.csdn.net/tianlincao/article/details/6867127/
Lucene教程:
http://www.cnblogs.com/zhuxiaojie/p/5277219.html
步骤:
1、索引创建
2、文本搜索
注意:
1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题
2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况
3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。
4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0
5、默认的评分机制不太合理,需要根据自己的业务定制
搜索引擎-Lucene相关推荐
- 一个例子学懂搜索引擎(lucene)
http://www.vifir.com/html/20080827/1703937.html 一个例子学懂搜索引擎(lucene) 来源:javaeye 作者: phz50 2008-08-27 1 ...
- 搜索引擎lucene
引用:http://baike.baidu.com/view/371811.htm Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它 ...
- 搜索引擎lucene点滴
搜索引擎lucene点滴 在项目中有用到搜索引擎lucene.现将学到的lucene中的一些知识点和用法的做了下总结,希望能够对大家有所帮助. 本项目中的lucene使用概述:在Portal项目中lu ...
- 5分钟了解搜索引擎Lucene的原理
场景 假设现在有10W+份word文档,让你做个web页面,给出关键词能快速搜索结果,你会怎么做?那至少有3种方案, 顺序扫描,每次检测文档中是否包含关键词,包含则加入结果列表,不包含继续查找下一个, ...
- 阿里P8架构师谈:开源搜索引擎Lucene、Solr、Sphinx等优劣势比较
开源搜索引擎分类 1.Lucene系搜索引擎,java开发,包括: Lucene Solr Elasticsearch Katta.Compass等都是基于Lucene封装. 你可以想象Lucene系 ...
- 主流搜索引擎Lucene,Solr,ElasticSearch
Lucene Lucene是一个Java全文搜索引擎,完全用Java编写.Lucene不是一个完整的应用程序,而是一个代码库和API,可以很容易地用于向应用程序添加搜索功能. 可扩展的高性能索引 在现 ...
- 开发自己的搜索引擎--Lucene 2.0+Heriterx(目录)
第一篇 搜索引擎入门 第1章 搜索引擎与信息检索 1 1.1 搜索引擎的历史 1 1.1.1 萌芽:Archie.Gopher 1 1.1.2 起步:Robot(网络机器人 ...
- Elasticsearch - 搜索引擎Lucene
1.1. Scaling Lucene 怎样在Lucene之上构建一个分布式.高度伸缩.接近实时的搜索引擎呢? 让我们回顾一下在搜索引擎(基于lucene)伸缩性这条路上都做了那些尝试,并且elast ...
- 搜索引擎Lucene(6):查询结果高亮及词频提取
1.结果高亮 Lucene对高亮显示提供 了两种实现模式,Highlighter和FastVectorHighlighter.FastVectorHighlighter速度快,功能更完美.但其是有一定 ...
- 文本搜索引擎Lucene之filed详解和代码测试
1.索引创建和查询过程 文档数据采集,一般是数据库的数据和爬虫获取的数据.而Lucene不提供信息采集的类库,需要自己编写一个爬虫程序实现信息采集,也可以通过一些开源软件实现信息采集,如下: Solr ...
最新文章
- 开启2020高效办公,从团队知识管理开始
- 看懂了这套书,你就看懂了程序的灵魂。
- Android 隐藏状态栏,沉浸式状态栏,状态栏背景色,状态栏字体色,透明状态工具类
- java完全数判断_java基础之完数判断
- 订单生产计划表范本_服装生产管理必看丨一文解决车间管理混乱
- UC伯克利超酷研究:舞痴和舞王之间,只差一个神经网络
- 省选专练[USACO18JAN]Stamp Painting
- 请实现一个函数,将一个字符串中的每个空格替换成...
- 关于ext4 simg fill chunk type
- 2010考研数学二第(20)题——多元积分学:二重积分计算
- Dennis M. Ritchie(丹尼斯里奇)
- android 格式化sd咔_在Android手机上永久格式化SD卡
- 【清北学堂】dwarf
- B002 - 基于嵌入式的老人定位追踪监测仪
- iOS开发-简单图片背景替换 实现抠图效果
- 计算机审计体会论文,审计论文格式_计算机审计实验报告_审计论文范文3000字
- sht30 linux示例代码,SHT30 Linux标准 i2c-dev 读取程序
- 生态篇-HBase 进化之从 NoSQL 到 NewSQL,凤凰涅槃成就 Phoenix...
- python pandas excel 排序_Python pandas对excel的操作实现示例
- 世界国家 的数据库sql
热门文章
- 漫画:寻找无序数组的第k大元素
- 内存管理——高端内存
- HTML5方式使用freeswitch——VERTO模块
- SQlite数据库的C编程接口(五) 便捷函数(Convenience Functions) ——《Using SQlite》读书笔记
- 从Slice_Header学习H.264(三.1)--相关细节之 POC的计算
- linux VM中复制虚拟机后eth0变成eth1
- python输入人名对话_对话框中的用户输入
- dwcs6连接不上access数据库_dw连接access数据库的技巧
- logistic回归详解(三):梯度下降训练方法
- shell 逐行读取文件