1 解决大量磁盘IO

  • config.setMaxBufferedDocs(100000); 控制写入一个新的segment前内存中保存的document的数目,设置较大的数目可以加快建索引速度。

数值越大索引速度越快, 但是会消耗更多的内存

  • indexWriter.forceMerge(文档数量); 设置N个文档合并为一个段

数值越大索引速度越快, 搜索速度越慢; 值越小索引速度越慢, 搜索速度越快

更高的值意味着索引期间更低的段合并开销,但同时也意味着更慢的搜索速度,因为此时的索引通常会包含更多的段。如果该值设置的过高,能获得更高的索引性能。但若在最后进行索引优化,那么较低的值会带来更快的搜索速度,因为在索引操作期间程序会利用并发机制完成段合并操作。故建议对程序分别进行高低多种值的测试,利用计算机的实际性能来告诉你最优值。

Lucene(9):Lucene优化相关推荐

  1. lucene索引文件大小优化小结

    lucene索引文件大小优化小结 1 数值数据类型索引优化 1.1 数值类型索引问题 lucene本质上是一个全文检索引擎而非传统的数据库系统,它基于倒排索引,非常适合处理文本,而处理数值类型却不是强 ...

  2. 【Lucene】Lucene的使用和优化

    从程序的实现层面上来学习Lucene的使用和优化 前提: Lucene使用时有7个包需要导入:analysis,document,index,queryParser,search,store,util ...

  3. Lucene使用与优化(转)

    原文链接:http://blog.csdn.net/hongfu_/article/details/1933346 本文所使用的Lucene版本较低,年代久远,许多API可能已经变了. 1 lucen ...

  4. Apache Lucene与Lucene.Net——全文检索服务器

    lucene学习教程 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品.因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一 ...

  5. Lucene 02 - Lucene的入门程序(Java API的简单使用)

    目录 1 准备环境 2 准备数据 3 创建工程 3.1 创建Maven Project(打包方式选jar即可) 3.2 配置pom.xml, 导入依赖 4 编写基础代码 4.1 编写图书POJO 4. ...

  6. java lucene demo,lucene自带的两个demo的运行测试方法

    最近准备做个自己的blog,考虑到对文文章内容的搜索,于是决定通过lucene对文章进行全文搜索.以下是我的学习笔记. 首先学习了中文java上的为自己的系统搞个全文搜索.车东的基于Java的全文索引 ...

  7. 【Lucene】Lucene的工作原理

    Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构.该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I l ...

  8. 【lucene】lucene自定义 filter

    1.概述 package com.lucene.api.search.advince;import org.apache.lucene.index.IndexReader; import org.ap ...

  9. 【lucene】Lucene 自定义 Parser

    1.概述 有时候需要我们扩展一些Parser来实现或者限制一些功能. 原因: 对于某些QueryParser ( FuzzyQuery,WildcardQuery)在查询时会使得性能降低,所以考虑将这 ...

  10. 【lucene】Lucene的lukeall工具

    1.概述 lukeall-4.10.4.jar包 不用放在项目里面,直接打开就ok了 lukeall-4.10.4.jar干嘛用的? https://blog.csdn.net/qq_37591637 ...

最新文章

  1. Composer使用
  2. ISE 14.7安装教程最新版(Win10安装)——解决Win10安装完后打不开快捷方式的方法
  3. unity从入门到精通下载_左手Unity右手Unreal
  4. python使用符号#表示单行注释-【经济金融及Python应用讲义】Python编程规范之注释...
  5. 高通thermal-engine配置文件格式
  6. 报告解读丨企服必看!如何高效搭建规模化营销获客体系?
  7. OpenGL 笔记1 固定管线实例 + 双缓存测试实例
  8. elasticsearch 删除满足条件的语句_ELK从入门到还未精通(二)——ElasticSearch上篇
  9. ue 编写linux脚本,UltraEdit23 sh文件 (shell脚本)着色
  10. ruby hash方法_Ruby中带有示例的Hash.key?(obj)方法
  11. 迟思堂工作室编程规范:单片机C语言
  12. Python读取一个文件并删除换行输出到另外一个文件中
  13. 喜庆博客积分排名进入前3万
  14. 中国国家信息安全产品认证证书 | CCRC信息安全服务资质认证
  15. reviewboard使用 与原理
  16. USB 协议整理 七:STM32F103之USB概述
  17. matlab 绘制扇形区域
  18. 【微信小程序】java游戏后端开发
  19. 为你的程序创建一个控制台
  20. 登录和第三方授权(Cookie和Authorization)

热门文章

  1. 移动web:如何下载和使用Normalize.css?
  2. Thinkpad T460s 新安装 Ubuntu 16.04 LTS wifi无法连接解决方案
  3. linux购物系统源码,2021.4月LooShop购物商城网站PHP源码运营打包版 PC+手机+微信三站合一 带支付宝微信等第三方在线支付功能...
  4. jdk的安装及配置(人人都能学会)
  5. oozie4.3.1编译
  6. 程序员应该掌握的经典算法面试题
  7. 8155与单片机c语言设计,51单片机课程设计报告-基于8155的8LED显示电子码表设计.doc...
  8. 一知名公司裁员,网友爆料称裁 80%…
  9. MATLAB实现遗传算法、模拟退火遗传算法求解避障路径规划问题——计算智能作业
  10. ubuntu运行anaconda