为什么80%的码农都做不了架构师?>>>   


public static void  createIndex(File file){Analyzer ikAnalyzer = new IKAnalyzer(true);IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_36, ikAnalyzer);//设置lucene的版本和分词器LogMergePolicy logMergePolicy = new LogByteSizeMergePolicy();logMergePolicy.setMergeFactor(50);logMergePolicy.setUseCompoundFile(true);//启用复合式索引文件格式,合并多个segmentconfig.setOpenMode(OpenMode.CREATE_OR_APPEND);//设置索引打开模式Directory directory = null;IndexWriter indexWriter = null;try {directory = FSDirectory.open(new File(getIndexPath()));indexWriter = new IndexWriter(directory, config);if(file.isDirectory()){for (File text : file.listFiles()) {if(text.isFile()){indexWriter.addDocument(createDocument(text));indexWriter.commit();}}}else if(file.isFile()){indexWriter.addDocument(createDocument(file));indexWriter.commit();}} catch (IOException e) {log.error(e.getMessage());e.printStackTrace();}}private static Document createDocument(File text){Document doc = new Document();doc.add(new Field("name", FileHelper.getFilename(text), Store.YES, Index.ANALYZED));doc.add(new Field("path", text.getAbsolutePath(), Store.YES, Index.NOT_ANALYZED));doc.add(new Field("content", FileHelper.getContent(text), Store.NO, Index.ANALYZED));log.debug("fileName :"+FileHelper.getFilename(text));log.debug( "fileContent  :"+FileHelper.getContent(text));return doc;}

转载于:https://my.oschina.net/u/1778309/blog/392018

lucene 建索引相关推荐

  1. Lucene.Net---1索引的建立

    转载地址:http://blog.csdn.net/xuezhongsong/article/details/4388241 在建立索引前,先了解下lucene中的一些与索引相关的重要类. 为了对文档 ...

  2. Lucene学习总结之三:Lucene的索引文件格式(1)

    Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙. 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程, ...

  3. Lucene构建索引的原理及源代码分析

    文章目录 1. Lucene是什么 2. 全文检索是什么 3. 术语 4. 创建索引过程 4.1 Lucene创建索引示例代码 4.2 分词的过程 4.2.1 原理 4.2.2 源代码 4.3 建索引 ...

  4. mysql在线上建索引,mysql 5.6在线DDL建索引测试

    基本信息: mysql版本: (product)root@localhost [(none)]> select @@version; +------------+ | @@version  | ...

  5. 不该建索引及不走索引的原因

    1.5 不应该建索引列的特点: 第一,对于那些在查询中很少使用或者参考的列不应该创建索引.这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度.相反,由于增加了索引,反而降低了系统 ...

  6. sqlserver怎么查看索引_Sql Server之旅——第六站 为什么都说状态少的字段不能建索引...

    我们在学sqlserver的时候,大多教科书和前辈们都说状态少的字段不要建索引,由此带来的开销还不如不建索引,但是这句话有多少人真的知道,或者说有多少人真的对此有比较深刻的理解,而不是听别人道听途说. ...

  7. 什么情况下应不建或少建索引

    1.表记录太少 2.经常插入.删除.修改的表 3.数据重复且分布平均的表字段,假如一个表有10万行记录,有一个字段A只有T和F两种值,且每个值的分布概率大约为50%,那么对这种表A字段建索引一般不会提 ...

  8. 为什么重复值高的字段不能建索引(比如性别字段等)

    结论(以innodb为例) a.非聚簇索引存储了对主键的引用,如果select字段不在非聚簇索引内,就需要跳到主键索引(上图中从右边的索引树跳到左边的索引树),再获取select字段值 b.如果非聚簇 ...

  9. oracle建索引默认并发,ORACLE重建索引需要考虑问题

    一:考虑重建索引的场合 1:表上频繁发生update,delete操作 2:表上发生了alter table ..move操作(move操作导致了rowid变化) 二:判断重建索引的标准 索引重建是否 ...

最新文章

  1. Asp.net支持三种类型的cache[转]
  2. 如何找出标有App Store 精华,Essentials的所有软件?
  3. App社交分享的后续行为可以这样统计
  4. C#项目评审提问问题集锦
  5. oracle移动硬盘盒,oracle-linux下挂载移动硬盘 NTFS类型
  6. Qt文档阅读笔记-Object Trees Ownership解析与实例(为何某些程序在被关闭的时候会崩溃)
  7. php过程函数,php流程控制和函数
  8. matlab excel 新建sheet,MATLAB怎么在保存结果的EXCEL里面添加内容?比如把 'sheet1‘ 改成 ‘已知点’ ,在第一行加上 '已知点' ,'x', 'y' 等....
  9. 浏览——用户自定义路径
  10. 微软发布ASP.NET MVC 1.0正式版
  11. 《写给大家看的设计书》封面设计基本要求
  12. Java开发必会的Linux命令 转载(http://www.importnew.com/17354.html)
  13. fullcalendar 只保留周_用枝条扦插橡皮树太浪费,只需一个“叶片”,就能变成一棵橡皮树...
  14. windows10安装ninja过程记录
  15. 深入理解Nginx~文件路径的定义
  16. 如何使用 JavaScript 读取文件
  17. NOIP2017滚粗记
  18. arcgis的python安装包_用Python使用arcgis中站点包arcpy
  19. 自动跟圈,不要来回编辑的偷懒小技巧
  20. 你知道map,filter,sort,reduct,every, some 的用法吗?

热门文章

  1. postman参数化--上一个接口返回的数据作为下一个接口的参数
  2. 火狐中怎么把xml转换为html,创建兼容IE、火狐、chrome、oprea浏览器的xmlDom对象方法...
  3. linux中匿名用户怎么登陆_Linux网络配置 | FTP 实战-匿名用户登录
  4. 阅读宋立恒《AI制胜:机器学习极简入门》第2章:机器学习中的数据预处理
  5. Python学习笔记:模块与包
  6. Java讲课笔记33:多线程概述与线程创建
  7. 4.线性和卷积——边界问题、解决边界方法和Matlab实战_3
  8. 指令由电子计算机,电子计算机主要是以
  9. vue2.0中组建里面套用组件_vue2.0如何嵌套组件
  10. 鼠标侧键能改为ctrl吗_200元档次又一高竞争力外设 雷柏V30鼠标评测