1.概述

翻译:https://www.elastic.co/cn/blog/practical-bm25-part-1-how-shards-affect-relevance-scoring-in-elasticsearch

这是三部分实用BM25系列中关于相似度排名(相关性)的第一个帖子。下一篇文章链接在底部。

背景

在Elasticsearch 5.0中,我们将Okapi BM25作为默认的相似度算法,这是用于对与查询相关的结果进行评分的算法。我不会在这篇博客中过多地介绍BM25与其他方法的对比,但如果你想了解BM25的理论论证,你可以跳转到Elastic{on} 2016的BM25解神秘化演示。相反,我将为您介绍BM25的实际用法,包括可用的参数和影响评分的因素。

请记住,这个博客主要是为文本文档评分的。也就是说,它真正专注于帮助我们的搜索用户。如果您正在为日志或指标建立索引,并返回按某个明确的元数据/数字顺序(如时间戳)排序的结果,那么这个博客主要是为了满足您的好奇心。

理解sh

【Elasticsearch】实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分相关推荐

  1. 【Elasticsearch】实用BM25 -第2部分:BM25算法及其变量

    1.概述 转载:https://www.elastic.co/cn/blog/practical-bm25-part-2-the-bm25-algorithm-and-its-variables 这是 ...

  2. ElasticSearch最佳入门实践(一)什么是ElasticSearch

    ElasticSearch ElasticSearch是一种分布式.高可用.高性能.可伸缩的搜索和分析系统. 什么是搜索 百度:比如我们想搜索任何信息的时候,就会上百度搜索一下.例如找一部自己喜欢的电 ...

  3. 太实用了!在Java的Word 文档中插入或读取艺术字

    太实用了!在Java的Word 文档中插入或读取艺术字 简直不能太实用! 扫码关注<Java学研大本营>,加入读者群,分享更多精彩 艺术字是一组文本样式,允许您向文本添加设计元素,例如填充 ...

  4. Elasticsearch最佳实践之Index与Shard设计

      Index与Shard,这两个概念在<Elasticsearch最佳实践之核心概念与原理>一文有详细的介绍,分别对应了Elasticsearch的两种数据组织方式:逻辑组织和物理组织. ...

  5. 【Elasticsearch】all shards failed no shard available for get .xxx[doc] routing null

    1.背景 es不知道什么原因突然挂了,然后后台日志信息如下 该错误是和 [elasticsearch]xpack exporter failed to flush export bulks 这个错误一 ...

  6. ElasticSearch特点|B+Tree|lucene倒排索引结构|lucene与elasticsearch的关系|基本概念

    ElasticSearch特点 1. 天然分片,天然集群: es 把数据分成多个shard,下图中的P0-P2,多个shard可以组成一份完整的数据,这些shard可以分布在集群中的各个机器节点中.随 ...

  7. elasticsearch学习之路---Linux 下安装并启动elasticsearch

    1.进入elastic官网下载elasticsearch 点击打开链接,,选择tar,右键复制链接 2.进入命令行输入: wget https://artifacts.elastic.co/downl ...

  8. Windows Phone 实用开发技巧(10):Windows Phone 中处理图片的技巧

    在开发Windows Phone应用程序的时候,或多或少会与图片打交道,下面总结下Windows Phone 中处理图片的一些技巧 1.  图片格式. 2.  图片编译方式 3.  图片加载方式 4. ...

  9. java操作es聚合操作并显示其他字段_java使用elasticsearch分组进行聚合查询(group by)-项目中实际应用...

    java连接elasticsearch 进行聚合查询进行相应操作 一:对单个字段进行分组求和 1.表结构图片: 根据任务id分组,分别统计出每个任务id下有多少个文字标题 1.SQL:select i ...

最新文章

  1. (转)Unity Assets目录下的特殊文件夹名称(作用和是否会被打包到build中)
  2. 使用NeMo快速完成NLP中的信息抽取任务,英伟达专家实战讲解,内附代码
  3. 用DOS命令来运行Java代码
  4. 阴影效果 ShadowLayout 布局实现(让控件实现立体效果)
  5. not accessible due to restriction on required library
  6. Ubuntu12.04下arm交叉编译环境的建立
  7. 一段Big5繁体转换简体GB2312的程序
  8. 利用ffmpeg来进行视频解码的完整示例代码
  9. 大数据处理黑科技:揭秘PB级数仓GaussDB(DWS) 并行计算技术
  10. python3 urllib模块
  11. Ubuntu 64-bit下搭建 Apache 2、PHP5、MySQL、GO Web服务器
  12. C#学习笔记二: C#类型详解
  13. python如何实现清屏
  14. 手机 putty linux,putty下载-putty 安卓版v4.04-PC6安卓网
  15. SPSS数据分析之多选题定义
  16. c4d安装没有出现语言文字,关于C4D以及渲染器插件安装时遇到的问题以及解决方法...
  17. 实例详解——编译器命令#pragma section作用于函数时作用域是否覆盖到其子函数...
  18. 编程记录——研究一下python对shepp_logan体模数据实现iradon变换
  19. APP赚钱盈利的8大方法
  20. 字节跳动Data数据平台/数据分析招聘

热门文章

  1. 宁德时代是前8个月全球最大电动汽车电池供应商
  2. 蚂蚁森林:国庆节前组织网友去阿拉善等三地参与秋季验收
  3. 根深才能叶茂:基础软件突破亟待产业界携手创新完善生态
  4. 水滴公司启动医务社工高级人才培养计划
  5. 问世十年,腾讯宣布重磅产品死亡:一代人的青春记忆!
  6. 华为一所英国研发中心建设项目获当地批准 计划总投资4亿英镑
  7. 中国移动回应“5G消息APP”下架:并非面向客户商用发布的产品
  8. 持续狂奔的拼多多快追上阿里了
  9. 疫情之下,哪些行业正在逆势爆发?
  10. 疑似三星Galaxy S11入网:搭载骁龙865处理器+支持25W快充