1. 经典模型的前提概念

  • 以ki表示indexing item,K = {k1, k2, …, kt}为整个系统的indexing item集,即整个系统只有t个indexing item
  • 针对文档dj,wij为ki在dj中的权值,若ki没有在dj中出现,则wij = 0
  • dj可以表示为dj = {w1j, w2j, …, wtj}
  • gi(dj) =  wij

2. 布尔模型中的查询q

  • q由若干ki、连接词ANDORNOT构成,比如q = ka AND (kb OR (NOT kc))
  • q可以写成一个析取范式qdnf = (1, 1, 1) ∨(1, 1, 0)∨(1, 0, 0),三元组(1, 1, 1)称为qdnf的一个合取分量qcc

3. 布尔模型中的相似度

  • if 存在qcc ∈ qdnf满足对任意ki,gi(dj) = wij = gi(qcc),则sim(dj, q) = 1,即文档dj与查询q相关
  • else sim(dj, q) = 0,即文档dj与查询q无关

4. 关于gi(qcc)的理解

  • 考虑到dj是个t元组,形如dj = {1, 0, 1, 1, ..., 0, 0},“对任意ki,gi(dj) = wij = gi(qcc)”从实质上就是dj = qcc,但是:
  • qcc中并不会包含所有t个indexing item,设|qcc| = n,一般情况下t != n,所以可以从以下两个方面理解
  • (1)扩展qcc到t元
  • (2)截取(或者叫投影)dj到n元
  • 举例:dj = (w1j = 0, w2j = 1, w3j = 1),qcc = (w2 = 1, w3 = 1)。扩展dj(投影dj到(w2, w3)),dj' = (w2j = 1, w3j = 1) = qcc;扩展qcc,qcc' = (w1 = 0, w2 = 1, w3 = 1) = dj

[#0x002B] IR经典模型之布尔模型相关推荐

  1. 信息检索与排序模型之布尔模型

    在 学习 布尔模型之前首先让我们了解一下模型的基本概念为后面的学习奠定基础.模型是采用数学工具对现实世界某种事物或某种运动的抽象描述,面对相同的输入,模型输出应能够无限地逼近现实世界的输出(如:天气预 ...

  2. 布尔模型(Boolean Model)

    布尔模型(Boolean Model)介绍 最早的IR模型,也是应用最广泛的模型:目前仍然应用于商业系统中:Lucene是基于布尔(Boolean)模型的. 布尔模型描述 文档D表示:一个文档被表示为 ...

  3. 信息检索—布尔模型(Boolean )和向量空间模型(VSM)

    文章目录 布尔模型(Boolean Model) 布尔模型缺点 向量空间模型(Vector Space Model) 计算VSM的步骤 计算VSM的公式 VSM缺点 布尔模型(Boolean Mode ...

  4. 文档查询匹配的方法:布尔模型,向量空间模型

    文档查询匹配的方法:布尔模型,向量空间模型 文档表示:词袋方法Bag-of-Words Approach • 在 IR 中表示文档(和查询)的传统方法: 记录出现的单词(术语; 通常,加上每个文档中的 ...

  5. vecm模型怎么写系数_经典传染病的SIR模型(基于MATLAB)

    经典的SIR模型是一种发明于上个世纪早期的经典传染病模型,此模型能够较为粗略地展示出一种传染病的发病到结束的过程,其核心在于微分方程,本次我们利用matlab来对此方程进行 其中三个主要量 S是易感人 ...

  6. 瀑布模型(经典的生命周期模型)

    适用范围:系统需求明确,技术成熟.工程管理较为严格的场合. 由Winston Royce在1970年最早提出的软件开发模型.软件开发过程与软件生命周期是一致的,也称经典的生命周期模型. 规定了各项软件 ...

  7. matlab删失数据威布尔,基于混合I型删失数据威布尔模型的可接受抽样计划

    基于混合I型删失数据威布尔模型的可接受抽样计划 Acceptance Sampling Plans with Type-I Hybrid Censoring Scheme of Weibull Dis ...

  8. Deep_Rank,经典ctr系列预估模型复现框架

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx Deep_Rank是一套从数据生成到模型生成的完整框架.对输入特征,特征工程,核心模型,模型输 ...

  9. 《基于海思35xx nnie引擎进行经典目标检测算法模型推理》视频课程介绍

    前言 沉寂两个月,终于将新的视频课程<<基于海思35xx nnie引擎进行经典目标检测算法模型推理>>(其链接为https://edu.csdn.net/course/deta ...

最新文章

  1. 工业用微型计算机(6)-指令系统(3)
  2. java 根据类名示例化类_Java即时类| from()方法与示例
  3. Java设计模式(2 / 23):观察者模式
  4. c#switch语句判断成绩_switch语句成绩等级例子
  5. Project Euler Problem 104 Pandigital Fibonacci ends
  6. JS原型链原理(链表)
  7. 调试wifi简单记录
  8. Excel导入Sql Server出现Null的解决方法
  9. php sqlserver 日期转字符串,sqlserver  时间(datetime)转换成字符串
  10. HDU 5855 Less Time, More profit 【最大流-最大权闭合子图】
  11. 【阿里云】阿里云跨账号内网互通
  12. [设计模式学习笔记] -- 策略模式
  13. 关于ubuntu 下载后没有网的情况
  14. 外贸B2C独立站如何做?
  15. 多人交友+私密相亲,红娘相亲直播源码
  16. 1000行代码实现定制形象送虎年祝福
  17. 域环境users提权调用lsrunase.exe 批处理完成安装字体
  18. 编写shell脚本判断当前主机的CPU生产商
  19. 【bzoj2259】[Oibh]新型计算机 堆优化Dijkstra
  20. python中tk窗口刷新_用按钮刷新tk窗口

热门文章

  1. 2021年中国拖拉机产量、进出口情况及补贴政策[图]
  2. 【心率传感器与Arduino连接读取心率数据】
  3. 为什么linux网卡只有lo,用ifconfig命令,只有lo,没有eth0的解决方案
  4. QWT下载、安装、配置教程
  5. ---一首非常好听的歌!
  6. 都市男女的30句妙语叹息
  7. 概念系列1:标准差标准误
  8. Django服务器安装ssl证书,Django网站(Apache部署)安装Let's Encrypt免费SSL证书
  9. 分布式存储之GlusterFS
  10. Xming X Server 配置和使用