store NO
压缩后的原始数据 原始数据大小 索引大小 索引时间 单词搜索时间
266 791 594 176 0.2
文件组成见后

运行forceMerge(3)后 merge的本质是减少cfx文件 变为pos和doc
索引大小 .doc .pos tip/tim cfs 仅1个
506 132 62 267 33

field store NO 索引大小 594
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.15 72 37 180 298

field store YES 索引大小 1.06
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
302 76 39 204 461

field store NO 同时NOT_ANALYZED 索引大小 669
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.01 0.2 11 635 21

field store NO IndexOptions.DOCS 索引大小 383
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.2 108 0.2 180 85
OmitNorms 索引大小 380

field store NO IndexOptions.DOCS 加 int ID后 索引大小 383
加string ID 索引大小 393
加string ID StoreTermVectors(true);
索引大小 1G 发现tvx和tvd文件有337M

转载于:https://www.cnblogs.com/bonelee/p/6612789.html

lucene倒排索引瘦身的一些实验——merge的本质是减少cfx文件 变为pos和doc;存储term vector多了tvx和tvd文件有337M...相关推荐

  1. 数据库增长到一定程度后的瘦身,优化问题

    经过几年的运行升级,我们的数据库系统会变的越来越大,占用的磁盘空间也是越来越多,数据库的表记录每月都在不断的增加,对系统的响应速度也是不断的下降. 如何为数据库进行瘦身,并提升访问速度呢? 根据实际工 ...

  2. 贝壳找房APP安装包瘦身

    一.背景 在满足产品.UI要求的前提下,尽量减少安装包体积. 以customer插件为例: 插件大小为5MB, 其中1MB是dex,而bkbase占了dex的580KB: 3.1MB是图片. 减少re ...

  3. NTlite给window瘦身+定制程序员专属环境

    目录 流程 瘦身原镜像->配置全套IDE环境->dism++导出 download tools NTlite (修改) Dism++ (打包wim) UltraISO for Window ...

  4. 给QC项目瘦身的方案

    由于参加 测试的同事没有 经验缺陷截图几乎全部使用PNG和BMP格式,14000多张截图占用了40多G的空间,导致QC 管理员每次对 项目备份都报错. 制定了以下瘦身方案 解决上述问题. 1.停止QC ...

  5. APK瘦身记,怎样实现高达53%的压缩效果

    作者:非戈@阿里移动安全,很多其它技术干货.请訪问阿里聚安全博客 1.我是怎么思考这件事情的 APK是Android系统安装包的文件格式.关于这个话题事实上是一个老生常谈的题目.不论是公司内部.还是外 ...

  6. 【剪枝算法】通过网络瘦身学习高效的卷积网络Learning Efficient Convolutional Networks through Network Slimming论文翻译

    此论文翻译仅仅用于自己方便学习.译文来自其他处. 在许多实际应用中部署深度卷积神经网络(CNN)很大程度上受到其计算成本高的限制.在本文中,我们提出了一种新的CNNs学习方案,能同时1)减小模型大小; ...

  7. 阿里妈妈搜索广告CTR模型的“瘦身”之路

    前言 随着号称"地表最强"的千亿参数规模GPT-3模型在 NLP 领域横扫各大数据榜单,大力出奇迹的暴力美学似乎成为了大数据场景建模的不二法门.搜索.推荐和广告场景的 CTR 模型 ...

  8. Android优化系列之apk瘦身

    概述 为什么APK要瘦身.APK越大,在下载安装过程中,他们耗费的流量会越多,安装等待时间也会越长:对于产品本身,意味着下载转化率会越低(因为竞品中,用户有更多机会选择那个体验最好,功能最多,性能最好 ...

  9. newduba首页怎么去掉_京喜小程序首页瘦身实践

    前言 在 web 开发场景,减少代码体积虽然是性能优化的一个方向,还没到锱铢必较的程度.但是在小程序场景,由于代码包上传阶段限制了主包 2M 和总包 16M(近期微信官方正在内测将总包上限调整至 20 ...

最新文章

  1. rpm打包的流程包括以下哪些_卖房流程包括哪些
  2. metinfo mysql off_利用Sqlmap测试MetInfo企业网站管理系统MySql注入
  3. c语言猴子选大王指针,C语言描述怎么用循环队列实现猴子选大王
  4. 浙江大学计算机科学与技术学院分数线,浙江大学录取分数线一般在多少 高考最低多少分能上浙大...
  5. Nginx 配置参数
  6. 洛谷P1044 栈(Catalan数)
  7. 小甲鱼python【easyGUI】学习笔记
  8. FOC项目知识点总结三 | 完全搞懂 Clarke 与 Park 变换(附动图,仿真文件以及详细讲解数学推导过程)
  9. 一个错误例子带你深入理解数据库“自联接”查询
  10. 网页数据库服务器连接超时,数据库连接超时的解决方法
  11. 两个表格合并怎么做?
  12. 仿抖音视频详情页点赞红心动效
  13. 显著性检验的“前世与今生”
  14. B - 爆零(×)大力出奇迹(√) HDU - 2093
  15. AE/PR插件-去朦胧除雾霾增强色彩对比清晰画面调色插件ClearPlus
  16. MyBatis学习笔记(1)—使用篇
  17. linux使用mysql命令行工具_我使用过的Linux命令之mysql - MySQL客户端命令行工具
  18. 寂寂的流年,时光日渐青翠
  19. R语言 根据变量包含某些字符,生成新变量
  20. 为什么直通车关键词点击率和转化率会低

热门文章

  1. 迷你世界电锯机器人_迷你世界:会旋转的机器人,安装多个火箭炮,全方位轰炸敌人...
  2. hdfs文档存储服务器,一文读懂HDFS分布式存储框架分析
  3. python实现高校教务管理系统_python实现教务管理系统
  4. sqlserver往oracle写数据,Sqlserver连接oracle进行读写数据库
  5. 爱丁堡大学计算机专业alevel,爱丁堡大学alevel要求?
  6. 轴只显示5个刻度_组团投资5亿元!武平集中签约5个新型显示产业链投资项目
  7. java输出流缓冲区内容清除,Java输入输出流与缓冲区的使用
  8. mysql-connector-net-6.7.4.msi,在ActiveReports中使用MySQL数据库
  9. Spring事务原理(1),区区一个SpringBoot问题就被干趴下了
  10. docker日志存放路径