信息检索与排序模型之布尔模型
在 学习 布尔模型之前首先让我们了解一下模型的基本概念为后面的学习奠定基础。模型是采用数学工具对现实世界某种事物或某种运动的抽象描述,面对相同的输入,模型输出应能够无限地逼近现实世界的输出(如:天气预报模型)。 信息检索模型就是表示文档与用户查询以及查询与文档的关系框架。下图是常用的信息检索模型以及所支撑其的相关数学背景。
信息检索模型以及支撑的数学背景
信息检索模型以及支撑的数学背景
布尔模型描述:
文档(用D表示)—— 一个文档被表示为关键字的集合;
查询式(用Q表示)—— 用于表示用户查询的关键词的布尔组合,并用“与(And)、或(or)、非(Not)”链接起来,且用括号知名优先次序;
举例
下面有2个文档:
文档1:a b c f g h;
文档2:a f b x y z;
用户想找出出现a或者b但一定要出现z的文档。当然我们仔细一看,结果显而易见是文档2符合用户的需求。但是对于计算机布尔排序模型它是怎么实现的呢 ?
将查询表示为布尔表达式Q=(a∨b) ∧z,并转换成析取范式qDNF=(1, 0,1) ∨(0,1,1) ∨(1,1,1);
文档1和文档2的三元组对应值分别为(1,1,0)和(1,1,1);
经过匹配,将文档2返回;
布尔模型的优点:
通过使用复杂的布尔表达式,可以很方便地控制查询结果,经过某种训练的用户可以容易地写出布尔查询表达式;
相当有效的实现方法,相当于识别包含了一个某个特定term的文档式;
布尔模型问题:
不支持部分匹配,而完全匹配会导致太多或者太少的,非常刚性: ―与”意味着全部; ―或”意味着任何一个;
很难控制被检索的文档数量原则上讲,所有被匹配的文档都将被返回;
很难对输出进行排序;
如果一篇文档被用户确认为相关或者不相怎样,相应地修改查询式呢。
信息检索与排序模型之布尔模型相关推荐
- [#0x002B] IR经典模型之布尔模型
1. 经典模型的前提概念 以ki表示indexing item,K = {k1, k2, -, kt}为整个系统的indexing item集,即整个系统只有t个indexing item 针对文档d ...
- 信息检索—布尔模型(Boolean )和向量空间模型(VSM)
文章目录 布尔模型(Boolean Model) 布尔模型缺点 向量空间模型(Vector Space Model) 计算VSM的步骤 计算VSM的公式 VSM缺点 布尔模型(Boolean Mode ...
- 布尔模型(Boolean Model)
布尔模型(Boolean Model)介绍 最早的IR模型,也是应用最广泛的模型:目前仍然应用于商业系统中:Lucene是基于布尔(Boolean)模型的. 布尔模型描述 文档D表示:一个文档被表示为 ...
- matlab删失数据威布尔,基于混合I型删失数据威布尔模型的可接受抽样计划
基于混合I型删失数据威布尔模型的可接受抽样计划 Acceptance Sampling Plans with Type-I Hybrid Censoring Scheme of Weibull Dis ...
- 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 本笔记源于CDA-DSC课程,由常国珍老师主讲 ...
- 推荐系统-排序层:主流CTR模型综述【Click-Through-Rate,点击率预估,指精排层的排序】【CTR 模型的输入(即训练数据)是:大量成对的 (features, label)数据】
一.CTR 模型建模 在讲 CTR 模型之前,我们首先要清楚 CTR 模型是什么,用来解决什么问题.所以我们先描述 CTR 问题,并对其进行数学建模. 一个典型的推荐系统架构如下图所示: 一般会划分为 ...
- 文档查询匹配的方法:布尔模型,向量空间模型
文档查询匹配的方法:布尔模型,向量空间模型 文档表示:词袋方法Bag-of-Words Approach • 在 IR 中表示文档(和查询)的传统方法: 记录出现的单词(术语; 通常,加上每个文档中的 ...
- 揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 信息检索(IR)—排序学习技术
信息检索(IR)-排序学习技术 1 引入 回顾搜索引擎的发展历史,其发展的过程如下图所示: 在之前的文章中,我们介绍了基于链接分析的搜索引擎,下面我们来介绍基于排序学习的搜索引擎中的排序学习技术. 1 ...
最新文章
- 工信部发布新能源车准入新规 9月1日起正式实施
- 北斗导航 | 利用模拟卫星星座估计GNSS接收机位置
- webpack常用loader和plugin及打包速度优化
- BZOJ4061/Gym100624F CERC2012 Farm and Factory 最短路、切比雪夫距离
- delphi ---ttoolbar,ttoolbutton
- 支付宝和微信的JSSDK发起支付
- pythonopencv的配置_python配置与使用OpenCV
- BugTracker.NET安装指南
- Ubuntu server中静态IP配置
- Zabbix监控Oracle 连接数
- Cisco IPSec *** 配置详解
- Tkinter模拟发送邮箱验证码并在指定时间后验证码过期
- access 套用表格_将ACCESS数据库导入到EXCEL表格
- 目标检测 3—— 人脸检测
- 【推荐】“汇新杯”新兴科技+互联网创新大赛——IT人大展拳脚的创业大赛
- Githut Token (hidden): Githut 安装验证
- 小胡时隔两年的第二篇Blog
- Google Chrome企业咨询服务市场调研报告- 行业发展机遇、市场定位及主要驱动因素
- 江苏工勤计算机高级工职称,事业单位专业技术职称与工勤岗高级工的区别
- Js 高德地图SDK