布尔文献检索模型简介
在没有网络的时候,手头能访问的信息量太少是个问题。现在有了网络,怎么在海量的数据中找到自己需要的信息是另一个头疼的问题。现在全世界有超过 5 亿个网站,存在大量的文献数据库,即使一个比较生僻的关键字,可能都会返回成千上万的搜索结果。为了可以得到更准确、更相关的搜索结果,适合的信息检索数学模型是必不可少的。
布尔逻辑将是建立最早的模型,也是目前应用最广泛的检索技术。它是通过布尔逻辑运算符:逻辑与(AND),逻辑或(OR),逻辑非(NOT)的组合来表达用户的检索需求。布尔逻辑是乔治·布尔在19 世纪中期定义的代数系统。1957 年,巴·希列尔最先探讨了将布尔逻辑应用到计算机检索的可能性。上世界 6,70 年代,布尔检索模型被正式用于各类文献系统并且逐步成为商业标准。于此同时,也有其他的文献检索模型被创建,比如向量空间模型、概率检索模型、模糊集合模型、扩展布尔检索模型等 。
布尔模型有简单,容易上手的特点。由于采用的是准确匹配的策略,在关键字表达式正确的情况下,可以很容易返回精确的结果。但是在文献调研阶段,要构造这样一个准确的表达式很困难,需要经过多次的迭代或者需要专业人员的帮忙。同时,如果忽略了一些关键字,很可能就会错过重要的相关文献 [1]。
除了精确构造表达式比较困难外,布尔模型的另外缺点是无法区分关键字之间的重要程度,所以对返回结果也就无法进行排序,只能靠自己对结果进行筛选。在进行筛选的时候,可以用 CARS 标准来衡量结果:
C (credible):资源是否可信?任何人都可以宣称自己的资源是可信的,但是仍然需要用自己的专业知识来做出判断。
A(accurate):信息是否准确?“信任但要验证”的原则在现在这个信息泛滥的时代处处适用。
R(reasonable):研究假设是否合理?
S(supported):其他的文献是否支持这篇文章?文章结果是否已经得到重复验证?
[1] 网络信息采集与应用,南京航空航天大学图书馆。
布尔文献检索模型简介相关推荐
- 搜索推荐系统[10]项目实战系列Z1:手把手教学(商品搜索系统、学术文献检索)语义检索系统搭建、召回排序模型详解。
搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排).系统架构.常见问题.算法项目实战总结.技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排 ...
- wos 文献被引_全世界最权威的文献检索工具,这6个检索技巧必须要掌握!
WOS-著名的科学引文索引数据库,历来被公认为世界范围最权威的科学技术文献的索引工具,能够提供科学技术领域最重要的研究成果. SCI引文检索的体系更是独一无二,不仅可以从文献引证的角度评估文章的学术价 ...
- 搜索引擎的检索模型-查询与文档的相关度计算
1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况 ...
- [转]搜索引擎的文档相关性计算和检索模型(BM25/TF-IDF)
搜索引擎的检索模型-查询与文档的相关度计算 1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是 ...
- 《搜索引擎-信息检索实践》7.2.1 分类应用与检索/BM25检索模型
1.简介 在所有的二元检索模型中,文档会被归为两类,相关文档和不相关文档.我们的任务是确定新来的文档是属于相关文档还是不相关文档. 如何判断相关与否,我们认为新来的文档如果属于相关文档的概率大于不相关 ...
- 概率检索模型:BIM+BM25+BM25F
1. 概率排序原理 以往的向量空间模型是将query和文档使用向量表示然后计算其内容相似性来进行相关性估计的,而概率检索模型是一种直接对用户需求进行相关性的建模方法,一个query进来,将所有的文档分 ...
- 计算机基础知识的文献,四 计算机文献检索基础知识(原理、结构和功能)
1.计算机检索原理 计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结 ...
- 计算机检索基础知识,[转载]四 计算机文献检索基础知识(原理、结构和功能)...
1.计算机检索原理 计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结 ...
- 《文献检索》期末复习整理~2020
注:本整理仅根据老师所划知识点进行整理,不能完全反应整个课程的内容 文章目录 第一章:信息检索概述 1.1--信息素养 信息素养的定义 1.2--信息与信息源 信息的特点 信息源的定义 信息的分类 文 ...
最新文章
- java如何读取excel文件
- 【题解】 [HNOI2015]落忆枫音 (拓扑排序+dp+容斥原理)
- Eboot 编译编译器决定中断向量及其实现单一性的原因
- wordpressQQ登陆php代码_WordPress实现前台登录功能
- 浅尝EffectiveCSharp_1
- Qt工作笔记-WebEngineView调用web站点中的JS脚本(含Vue Cli脚本)
- 第3章 flappy bird作业、SVN、GIT、码云
- Spring源码入门——AnnotationBeanNameGenerator解析
- 机器学习基石笔记-Lecture 14 Regularization
- 海风科技快速开发平台和构件的由来(一)
- ue4文档接口类学习
- android录屏软件大全,安卓免费录屏软件哪个好用 免费长时间录屏软件推荐
- Python给自己写一款不一样的吃鸡“外挂”!把把吃鸡绝不封号
- kux格式怎么转换 kux完美转换成MP3音频的技巧分享
- office2019word2019excel2019ppt2019关闭自动更新设置步骤
- 微信表情符号写入判决书,你发的OK、炸弹都可能成为“呈堂证供”
- 研华电脑510上电自启_研华工控机BIOS设置通电自启动方法技巧
- matlab函数重名,matlab无法定义具有重复名称 f 的函数。
- sql判断邮箱是否合法_如何验证会员系统中用户的邮箱是否真实存在
- vue cube-ui 搜索栏子组件封装