lucene 建索引
为什么80%的码农都做不了架构师?>>>
public static void createIndex(File file){Analyzer ikAnalyzer = new IKAnalyzer(true);IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_36, ikAnalyzer);//设置lucene的版本和分词器LogMergePolicy logMergePolicy = new LogByteSizeMergePolicy();logMergePolicy.setMergeFactor(50);logMergePolicy.setUseCompoundFile(true);//启用复合式索引文件格式,合并多个segmentconfig.setOpenMode(OpenMode.CREATE_OR_APPEND);//设置索引打开模式Directory directory = null;IndexWriter indexWriter = null;try {directory = FSDirectory.open(new File(getIndexPath()));indexWriter = new IndexWriter(directory, config);if(file.isDirectory()){for (File text : file.listFiles()) {if(text.isFile()){indexWriter.addDocument(createDocument(text));indexWriter.commit();}}}else if(file.isFile()){indexWriter.addDocument(createDocument(file));indexWriter.commit();}} catch (IOException e) {log.error(e.getMessage());e.printStackTrace();}}private static Document createDocument(File text){Document doc = new Document();doc.add(new Field("name", FileHelper.getFilename(text), Store.YES, Index.ANALYZED));doc.add(new Field("path", text.getAbsolutePath(), Store.YES, Index.NOT_ANALYZED));doc.add(new Field("content", FileHelper.getContent(text), Store.NO, Index.ANALYZED));log.debug("fileName :"+FileHelper.getFilename(text));log.debug( "fileContent :"+FileHelper.getContent(text));return doc;}
转载于:https://my.oschina.net/u/1778309/blog/392018
lucene 建索引相关推荐
- Lucene.Net---1索引的建立
转载地址:http://blog.csdn.net/xuezhongsong/article/details/4388241 在建立索引前,先了解下lucene中的一些与索引相关的重要类. 为了对文档 ...
- Lucene学习总结之三:Lucene的索引文件格式(1)
Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙. 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程, ...
- Lucene构建索引的原理及源代码分析
文章目录 1. Lucene是什么 2. 全文检索是什么 3. 术语 4. 创建索引过程 4.1 Lucene创建索引示例代码 4.2 分词的过程 4.2.1 原理 4.2.2 源代码 4.3 建索引 ...
- mysql在线上建索引,mysql 5.6在线DDL建索引测试
基本信息: mysql版本: (product)root@localhost [(none)]> select @@version; +------------+ | @@version | ...
- 不该建索引及不走索引的原因
1.5 不应该建索引列的特点: 第一,对于那些在查询中很少使用或者参考的列不应该创建索引.这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度.相反,由于增加了索引,反而降低了系统 ...
- sqlserver怎么查看索引_Sql Server之旅——第六站 为什么都说状态少的字段不能建索引...
我们在学sqlserver的时候,大多教科书和前辈们都说状态少的字段不要建索引,由此带来的开销还不如不建索引,但是这句话有多少人真的知道,或者说有多少人真的对此有比较深刻的理解,而不是听别人道听途说. ...
- 什么情况下应不建或少建索引
1.表记录太少 2.经常插入.删除.修改的表 3.数据重复且分布平均的表字段,假如一个表有10万行记录,有一个字段A只有T和F两种值,且每个值的分布概率大约为50%,那么对这种表A字段建索引一般不会提 ...
- 为什么重复值高的字段不能建索引(比如性别字段等)
结论(以innodb为例) a.非聚簇索引存储了对主键的引用,如果select字段不在非聚簇索引内,就需要跳到主键索引(上图中从右边的索引树跳到左边的索引树),再获取select字段值 b.如果非聚簇 ...
- oracle建索引默认并发,ORACLE重建索引需要考虑问题
一:考虑重建索引的场合 1:表上频繁发生update,delete操作 2:表上发生了alter table ..move操作(move操作导致了rowid变化) 二:判断重建索引的标准 索引重建是否 ...
最新文章
- Asp.net支持三种类型的cache[转]
- 如何找出标有App Store 精华,Essentials的所有软件?
- App社交分享的后续行为可以这样统计
- C#项目评审提问问题集锦
- oracle移动硬盘盒,oracle-linux下挂载移动硬盘 NTFS类型
- Qt文档阅读笔记-Object Trees Ownership解析与实例(为何某些程序在被关闭的时候会崩溃)
- php过程函数,php流程控制和函数
- matlab excel 新建sheet,MATLAB怎么在保存结果的EXCEL里面添加内容?比如把 'sheet1‘ 改成 ‘已知点’ ,在第一行加上 '已知点' ,'x', 'y' 等....
- 浏览——用户自定义路径
- 微软发布ASP.NET MVC 1.0正式版
- 《写给大家看的设计书》封面设计基本要求
- Java开发必会的Linux命令 转载(http://www.importnew.com/17354.html)
- fullcalendar 只保留周_用枝条扦插橡皮树太浪费,只需一个“叶片”,就能变成一棵橡皮树...
- windows10安装ninja过程记录
- 深入理解Nginx~文件路径的定义
- 如何使用 JavaScript 读取文件
- NOIP2017滚粗记
- arcgis的python安装包_用Python使用arcgis中站点包arcpy
- 自动跟圈,不要来回编辑的偷懒小技巧
- 你知道map,filter,sort,reduct,every, some 的用法吗?
热门文章
- postman参数化--上一个接口返回的数据作为下一个接口的参数
- 火狐中怎么把xml转换为html,创建兼容IE、火狐、chrome、oprea浏览器的xmlDom对象方法...
- linux中匿名用户怎么登陆_Linux网络配置 | FTP 实战-匿名用户登录
- 阅读宋立恒《AI制胜:机器学习极简入门》第2章:机器学习中的数据预处理
- Python学习笔记:模块与包
- Java讲课笔记33:多线程概述与线程创建
- 4.线性和卷积——边界问题、解决边界方法和Matlab实战_3
- 指令由电子计算机,电子计算机主要是以
- vue2.0中组建里面套用组件_vue2.0如何嵌套组件
- 鼠标侧键能改为ctrl吗_200元档次又一高竞争力外设 雷柏V30鼠标评测