lucene倒排索引瘦身的一些实验——merge的本质是减少cfx文件 变为pos和doc;存储term vector多了tvx和tvd文件有337M...
store NO
压缩后的原始数据 原始数据大小 索引大小 索引时间 单词搜索时间
266 791 594 176 0.2
文件组成见后
运行forceMerge(3)后 merge的本质是减少cfx文件 变为pos和doc
索引大小 .doc .pos tip/tim cfs 仅1个
506 132 62 267 33
field store NO 索引大小 594
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.15 72 37 180 298
field store YES 索引大小 1.06
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
302 76 39 204 461
field store NO 同时NOT_ANALYZED 索引大小 669
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.01 0.2 11 635 21
field store NO IndexOptions.DOCS 索引大小 383
索引文件组成 fdt/fdx/fnm .doc .pos tip/tim cfs
0.2 108 0.2 180 85
OmitNorms 索引大小 380
field store NO IndexOptions.DOCS 加 int ID后 索引大小 383
加string ID 索引大小 393
加string ID StoreTermVectors(true);
索引大小 1G 发现tvx和tvd文件有337M
转载于:https://www.cnblogs.com/bonelee/p/6612789.html
lucene倒排索引瘦身的一些实验——merge的本质是减少cfx文件 变为pos和doc;存储term vector多了tvx和tvd文件有337M...相关推荐
- 数据库增长到一定程度后的瘦身,优化问题
经过几年的运行升级,我们的数据库系统会变的越来越大,占用的磁盘空间也是越来越多,数据库的表记录每月都在不断的增加,对系统的响应速度也是不断的下降. 如何为数据库进行瘦身,并提升访问速度呢? 根据实际工 ...
- 贝壳找房APP安装包瘦身
一.背景 在满足产品.UI要求的前提下,尽量减少安装包体积. 以customer插件为例: 插件大小为5MB, 其中1MB是dex,而bkbase占了dex的580KB: 3.1MB是图片. 减少re ...
- NTlite给window瘦身+定制程序员专属环境
目录 流程 瘦身原镜像->配置全套IDE环境->dism++导出 download tools NTlite (修改) Dism++ (打包wim) UltraISO for Window ...
- 给QC项目瘦身的方案
由于参加 测试的同事没有 经验缺陷截图几乎全部使用PNG和BMP格式,14000多张截图占用了40多G的空间,导致QC 管理员每次对 项目备份都报错. 制定了以下瘦身方案 解决上述问题. 1.停止QC ...
- APK瘦身记,怎样实现高达53%的压缩效果
作者:非戈@阿里移动安全,很多其它技术干货.请訪问阿里聚安全博客 1.我是怎么思考这件事情的 APK是Android系统安装包的文件格式.关于这个话题事实上是一个老生常谈的题目.不论是公司内部.还是外 ...
- 【剪枝算法】通过网络瘦身学习高效的卷积网络Learning Efficient Convolutional Networks through Network Slimming论文翻译
此论文翻译仅仅用于自己方便学习.译文来自其他处. 在许多实际应用中部署深度卷积神经网络(CNN)很大程度上受到其计算成本高的限制.在本文中,我们提出了一种新的CNNs学习方案,能同时1)减小模型大小; ...
- 阿里妈妈搜索广告CTR模型的“瘦身”之路
前言 随着号称"地表最强"的千亿参数规模GPT-3模型在 NLP 领域横扫各大数据榜单,大力出奇迹的暴力美学似乎成为了大数据场景建模的不二法门.搜索.推荐和广告场景的 CTR 模型 ...
- Android优化系列之apk瘦身
概述 为什么APK要瘦身.APK越大,在下载安装过程中,他们耗费的流量会越多,安装等待时间也会越长:对于产品本身,意味着下载转化率会越低(因为竞品中,用户有更多机会选择那个体验最好,功能最多,性能最好 ...
- newduba首页怎么去掉_京喜小程序首页瘦身实践
前言 在 web 开发场景,减少代码体积虽然是性能优化的一个方向,还没到锱铢必较的程度.但是在小程序场景,由于代码包上传阶段限制了主包 2M 和总包 16M(近期微信官方正在内测将总包上限调整至 20 ...
最新文章
- rpm打包的流程包括以下哪些_卖房流程包括哪些
- metinfo mysql off_利用Sqlmap测试MetInfo企业网站管理系统MySql注入
- c语言猴子选大王指针,C语言描述怎么用循环队列实现猴子选大王
- 浙江大学计算机科学与技术学院分数线,浙江大学录取分数线一般在多少 高考最低多少分能上浙大...
- Nginx 配置参数
- 洛谷P1044 栈(Catalan数)
- 小甲鱼python【easyGUI】学习笔记
- FOC项目知识点总结三 | 完全搞懂 Clarke 与 Park 变换(附动图,仿真文件以及详细讲解数学推导过程)
- 一个错误例子带你深入理解数据库“自联接”查询
- 网页数据库服务器连接超时,数据库连接超时的解决方法
- 两个表格合并怎么做?
- 仿抖音视频详情页点赞红心动效
- 显著性检验的“前世与今生”
- B - 爆零(×)大力出奇迹(√) HDU - 2093
- AE/PR插件-去朦胧除雾霾增强色彩对比清晰画面调色插件ClearPlus
- MyBatis学习笔记(1)—使用篇
- linux使用mysql命令行工具_我使用过的Linux命令之mysql - MySQL客户端命令行工具
- 寂寂的流年,时光日渐青翠
- R语言 根据变量包含某些字符,生成新变量
- 为什么直通车关键词点击率和转化率会低
热门文章
- 迷你世界电锯机器人_迷你世界:会旋转的机器人,安装多个火箭炮,全方位轰炸敌人...
- hdfs文档存储服务器,一文读懂HDFS分布式存储框架分析
- python实现高校教务管理系统_python实现教务管理系统
- sqlserver往oracle写数据,Sqlserver连接oracle进行读写数据库
- 爱丁堡大学计算机专业alevel,爱丁堡大学alevel要求?
- 轴只显示5个刻度_组团投资5亿元!武平集中签约5个新型显示产业链投资项目
- java输出流缓冲区内容清除,Java输入输出流与缓冲区的使用
- mysql-connector-net-6.7.4.msi,在ActiveReports中使用MySQL数据库
- Spring事务原理(1),区区一个SpringBoot问题就被干趴下了
- docker日志存放路径