bm25 是什么?
bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词qiq_iqi​,然后单词的分数由3部分组成:

单词qiq_iqi​和D之间的相关性
单词qiq_iqi​和D之间的相关性
每个单词的权重

最后对于每个单词的分数我们做一个求和,就得到了query和文档之间的分数。


参考:https://www.jianshu.com/p/53e379483f3e
https://www.jianshu.com/p/1e498888f505

经典检索算法:BM25算法相关推荐

  1. 检索算法: BM25原理详解

    文章目录 简介 Function k1k_1k1​ 的作用 bbb 的作用 终极总结 参考文档 简介 BM25算法常用来进行搜索. 输入问题Q0Q_0Q0​,在数据中去匹配其它Q时,可以用BM25进行 ...

  2. 如何使用BM25算法检索出最相关的序列

    背景 起因 博主正在进行的科研应用到了in-context learning这个范式,与传统的学习范式不同,情境中学习并不是真的学习,即不改变模型的参数,称为in-context inference ...

  3. bm25算法Java代码_搜索引擎相关度算法 -BM25 JAVA实现

    bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法. 它的出现主要是解决TF-IDF算法中 TF的影响可无限增大的不足,本质上 BM25是基于TF-IDF并做了改 ...

  4. bm25算法Java代码_BM25算法在Lucene中的应用

    Lucene是apache软件基金会jakarta项目组的一个子项目,是一个用Java写的全文检索引擎工具包,可以方便的集成到系统中提以提供高效的检索能力,Lucene核心功能分为建索和检索两部分.而 ...

  5. 搜索引擎相关度算法 -BM25 JAVA实现

    bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法. 它的出现主要是解决TF-IDF算法中 TF的影响可无限增大的不足,本质上 BM25是基于TF-IDF并做了改 ...

  6. 【码书】一本经典且内容全面算法书籍,学算法必备

    之前推荐了好几本算法书,有<啊哈!算法>,有<算法图解>,有<漫画算法>,也有<我的第一本算法书>,很多粉丝不乐意了,觉得我推荐了这么多算法书籍,竟然没 ...

  7. 经典常用算法/常用算法思维---附伪代码以及实现

    本篇文章旨在分享一些常用算法的伪代码以及部分算法的具体实现,后面也会更新我在刷算法题中学到的或者从别的地方看到的经典算法思维 本博客并不提供算法说明,算法证明,算法分析,算法测试等内容,只提供算法的伪 ...

  8. Pytorch之CNN:基于Pytorch框架实现经典卷积神经网络的算法(LeNet、AlexNet、VGG、NIN、GoogleNet、ResNet)——从代码认知CNN经典架构

    Pytorch之CNN:基于Pytorch框架实现经典卷积神经网络的算法(LeNet.AlexNet.VGG.NIN.GoogleNet.ResNet)--从代码认知CNN经典架构 目录 CNN经典算 ...

  9. c++Binary search二分法检索(折半检索)的实现算法(附完整源码)

    C++Binary search二分法检索的实现算法 C++Binary search二分法检索(折半检索)的实现算法完整源码(定义,实现,main函数测试) C++Binary search二分法检 ...

最新文章

  1. Tableau实战系列数据连接及数据准备
  2. mybatis_user_guide(8) 日志
  3. 判断字符串是否为正整数 浮点小数
  4. python点线图_Python | 点线图
  5. MATLAB学习笔记(十一)
  6. Gson 转化为带反斜杠的json
  7. 写给音响工程师的科普文章(一)——从模电角度去了解调音台的信号流程
  8. 全网最全的 Java 技术栈内容梳理(持续更新中)
  9. 设计灵感|App登录注册页面设计方式
  10. 结对编程四则运算第三周-挑战出题(20172301、20172304、20172328)
  11. allegro出光绘文件出现的几个问题
  12. 怎么快速读懂c语言程序,零基础如何看懂C语言程序的基本结构
  13. 【ACM省赛】第九届河南省程序设计大赛 B 宣传墙
  14. 软件测试自我介绍 说什么才能让面试官一下子记住你!
  15. python开发中级_针对中级Python开发人员的13个项目构想
  16. 技术型产品经理的思维能力
  17. SpringBoot 全局配置和静态资源配置
  18. SpringBoot访问静态资源(图片)
  19. Linux中重定向输入和输出
  20. 安科瑞能耗系统在智能配电网下中小型企业(江阴市康乾车业有限公司)的设计和应用

热门文章

  1. 爬虫爬当当网书籍信息
  2. MySQL 如何利用一条语句实现类似于if-else条件语句的判断
  3. $与一些特殊字符的组合用法
  4. JavaScriptJQ 004_JS闭包
  5. gcc4.4下实现backtrace代码
  6. 识别你的ADFS是什么版本的(Which version of ADFS is running)
  7. HDU - 5875 Function [单调性剪枝+预处理]
  8. 第27章 正则表达式
  9. selenium+python自动化82-只截某个元素的图
  10. iOS传感器开发——为APP添加手机密码、指纹进行安全验证