【Elasticsearch】Elasticsearch 相关度评分 TFIDF
文章目录
- 1.概述
- 2._score是如何被计算出来的
- 3.评分范围
- N.扩展阅读
1.概述
relevance score算法,简单来说,就是计算出,一个索引中的文本,与搜索文本,他们之间的关联匹配程度
Elasticsearch使用的是 term frequency/inverse document frequency算法,简称为TF/IDF算法
Term frequency(TF):搜索文本中的各个词条在field文本中出现了多少次,出现次数越多,就越相关
Inverse document frequency(IDF):搜索文本中的各个词条在整个索引的所有文档中出现了多少次,出现的次数越多,就越不相关
示例:
搜索请求:hello world
doc1:hello
【Elasticsearch】Elasticsearch 相关度评分 TFIDF相关推荐
- 搜索相关度算法 TF-IDF与BM25
TF-IDF VS BM25 在ES5.0版本之前,ES一直用的是TF-IDF来进行相关度算分:在5.0后的版本,ES换成了BM25版本.本文将从算法设计的角度,先介绍两个算法,再结合ES来尝试分析一 ...
- Elasticsearch相关度评分算法(三):BM25(Okapi BM25)
文章目录 1.引言 2.相关度概率模型 3.Okapi BM25 函数 3.1 逆文档频率:IDF(qi)IDF(q_i)IDF(qi) 3.1.1 函数公式及参数 3.1.2 函数曲线 3.1.3 ...
- [Elasticsearch] Elasticsearch权威指南翻译目录
为了方便大家能够更加快速地找到自己需要参考的那部分,对已经翻译完成的部分根据权威指南的目录做了相应目录,希望能够有所帮助. 起步(Getting Started) 1. 你懂的,为了搜索 英文原文链接 ...
- ELASTICSEARCH 搜索的评分机制
从我们在elasticsearch复合框输入搜索语句到结果显示,展现给我们的是一个按score得分从高到底排好序的结果集.下面就来学习下elasticsearch怎样计算得分. Lucene(或 El ...
- Elasticsearch中的评分排序--Function score query
文章目录 1. 背景 2. 数据构建 3. function score使用 3.1 function score示例 3.2 参数说明 1. 背景 实际开发中,使用elasticsearch做搜索时 ...
- Elasticsearch - Elasticsearch 优化(十五)
一.硬件选择 Elasticsearch 的基础是 Lucene,所有的索引和文档数据是存储在本地的磁盘中 具体的路径可在 ES 的配置文件../config/elasticsearch.yml 中配 ...
- html显示elasticsearch,ElasticSearch查询:高亮显示(10)
什么是高亮显示 根据关键字搜索时,搜索出的内容中的关键字会显示不同的颜色,称之为高亮百度搜索关键字"elasticsearch" 京东商城搜索"iphone xs max ...
- ElasticSearch --- elasticsearch.yml配置详解
一.Cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的. es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集 ...
- Elasticsearch - Elasticsearch集群Cluster(三)
阅读本文前可先参考 https://blog.csdn.net/MinggeQingchun/article/details/126618387 一.单机 & 集群 1.单机 单台 Elast ...
最新文章
- 在Docker Hub上你可以很轻松下载到大量已经容器化的应用镜像,即拉即用——daocloud国内镜像加速...
- 找到二叉树中符合搜索二叉树条件的最大拓扑结构
- 经济和信息化谋定研究-左晓栋:国家网络安全事件应急预案
- 【HDU - 1412】 {A} + {B} (STL + set)
- 蓝桥杯---特别数的和(C语言)
- bzoj 1133: [POI2009]Kon(DP)
- 高通平台camera bring-up
- Nginx爆出新漏洞,谨防“拖库”风险
- 牛客练习赛53 (E 老瞎眼 pk 小鲜肉) 线段树+离线
- 【redis集群:2. 集群伸缩】
- JavaScript JS 如何定义多行文本
- 断点续传的原理(转)
- Latex学习笔记(五)——Latex模板学习总结
- Hadoop2.x与3.x的区别:
- 如何让爆满的C盘腾出 10G空间
- 服务器安装torchvision库文件时报错EnvironmentError: [Errno 28] No space left on device的完美解决方法及思维过程
- jks与keystore的转换
- 单片机项目:8个发光二极管从上至下间隔一秒流动,其中每个管亮500ms,500ms,亮时蜂鸣器响,灭时蜂鸣器关闭,一直重复下去
- Cholesky和LU矩阵分解
- SpringBoot笔记通俗易懂版
热门文章
- 小米11 Pro系列细节再曝光:大杯大升级!
- 和平精英、宾果消消消等多款游戏APP存隐私不合规行为
- iPhone 12系列起售价又要涨了?128GB起步...
- “我在B站有套房”成真:云蹦迪、不停学还健身
- 英特尔中国:截至2018年底女性员工占比33%
- 阿里巴巴公布“新六脉神剑”:因为信任 所以简单
- 马斯克:我上大学时就想创立电动汽车公司
- 被指抄袭后 新浪微博APP绿洲更换Logo 重新上架
- EMUI10还有哪些看点?分布式技术能力、开放与工具链...
- 真无线蓝牙耳机霸主之争:苹果AirPods和索尼WF-1000XM3怎么选?