站内搜索(ELK)之数据表字典类型字段的索引思路
数据表字典类型的字段,如人员表中的“性别”、流程表中的“处理状态”,此类字段中的值高度重复,不建议放到可检索的索引字段中,原因如下:
若数据表字典类型字段的值索引到单独的索引字段中,因字典数据字符数一般比较少,根据搜索引擎(如elasticsearch)计算得分算法,字符数少的索引字段被检索命中后,比大字段命中后的得分高,这对于一般的应用场景,会对检索结果造成严重干扰。
可考虑的字典数据索引方法:
1、若搜索结果要用于分析系统、报表系统,可考虑字典型数据单独索引,但不放到可检索的索引字段中,避免搜索时干扰;搜索完成后,对搜索结果再进行二次处理。
2、若不考虑数据分析、结果分类等需求,可将字典数据与其他大字段数据合并后,再索引,如将人员表中“性别”与人员住址、简历等字段合并,降低其计算得分时的权重。
转载于:https://www.cnblogs.com/jiangtao1218/p/8485476.html
站内搜索(ELK)之数据表字典类型字段的索引思路相关推荐
- 用全文检索构建站内搜索和大数据搜索引擎
全文检索首先对要搜索的文档进行分词,然后形成索引,通过查询索引来查询文档.全文检索是目前搜索引擎,大数据搜索的关键技术.全文检索系统可实现亚秒级的检索速度以及每秒上百次的并发检索支持. 需求: 实现淘 ...
- 假设mysql数据表t1有字段_Mysql 索引及优化
什么是索引 索引是什么?相信大家都用过字典.你是怎么从厚厚的新华字典中找到你需要找到的那个字的呢?又是怎么从一本书中快速定位到你需要的章节? 我们都是通过书中的目录,然后根据目录中的页码定位到我们要的 ...
- MySQL创建数据表TIMESTAMP类型字段问题
今天在导入数据时出现了这个错误: Incorrect table definition; there can be only one TIMESTAMP column with CURRENT_TIM ...
- 关于站内搜索的方案对比
基于数据库的搜索 基于spider抓取的站内搜索 全文检索站内搜索软技术 网站 大部分网站,如中文BT联盟 部分中大型网站如俺要下载软件网 少量大型网站,如华军网 技术原理 数据库搜索 经Spid ...
- Discuz3.数据库数据表字典详解(完整版)
Discuz3.数据库数据表字典详解(完整版) 转自:https://discuzt.cr180.com/discuzcode-db.html pre_common_admincp_cmenu后台菜单 ...
- -gMIS持续优化更新, +InSiteSearch站内搜索
2019独角兽企业重金招聘Python工程师标准>>> -gMIS 部署和应用的场景越来越多,最近在考虑为所有gMIS承载管理的数据库系统增加一个站内搜索功能, +InSiteSea ...
- Lucene.net站内搜索—5、搜索引擎第一版实现
目录 Lucene.net站内搜索-1.SEO优化 Lucene.net站内搜索-2.Lucene.Net简介和分词 Lucene.net站内搜索-3.最简单搜索引擎代码 Lucene.net站内搜索 ...
- PHP站内搜索功能(laravel自带Scout驱动+elasticsearch)
站内搜索 由于最近做的网站需要用到网站的站内搜索,我也是偷偷摸摸学了一手,希望有需要的朋友也可以看看 搜索引擎 Elasticsearch 官方网站 https://www.elastic.co/cn ...
- ElasticSearch技术方案(二)——站内搜索
文章目录 背景 ES实现站内搜索 ES实现站内搜索 流程图 站内搜索实现分析 SpringBoot整合SpringData ElasticSearch 1. 引入依赖: 2.配置application ...
最新文章
- 中国电子学会发布《新一代人工智能领域十大最具成长性技术展望(2018-2019年)》...
- IdentityServer Topics(2)- 定义资源
- OpenCV图像监视:在Visual Studio调试器中查看内存中图像
- Ribbon源码解析(一)
- Apache Karaf配置远程调试
- 数据结构之二叉树:二叉查找树基本功能,Python代码实现——10
- 深入理解Magento-第九章-修改、扩展、重写Magento代码
- 江苏大学矩阵论、数理统计期末考试复习
- 【转】:TCP/IP详解学习笔记系列
- Google 今天抽风了!
- 关于php 调用接口 微信云支付 HmacSha256 加密 request_content 生成 authen_code
- 荣耀9igoogle模式_将您的iGoogle主页导出到另一个帐户
- Linux没有网怎么解决。
- 微信小程序wx.getImageInfo()获取图片信息
- 最小编辑距离 动态规划 python
- Swiper + 图片懒加载
- iOS ZBarSDK 用ZBarReaderView自定义二维码扫描界面
- 《解忧杂货店》阅读后感
- 树上路径(path)
- pandas中diff用法