在没有网络的时候,手头能访问的信息量太少是个问题。现在有了网络,怎么在海量的数据中找到自己需要的信息是另一个头疼的问题。现在全世界有超过 5 亿个网站,存在大量的文献数据库,即使一个比较生僻的关键字,可能都会返回成千上万的搜索结果。为了可以得到更准确、更相关的搜索结果,适合的信息检索数学模型是必不可少的。

布尔逻辑将是建立最早的模型,也是目前应用最广泛的检索技术。它是通过布尔逻辑运算符:逻辑与(AND),逻辑或(OR),逻辑非(NOT)的组合来表达用户的检索需求。布尔逻辑是乔治·布尔在19 世纪中期定义的代数系统。1957 年,巴·希列尔最先探讨了将布尔逻辑应用到计算机检索的可能性。上世界 6,70 年代,布尔检索模型被正式用于各类文献系统并且逐步成为商业标准。于此同时,也有其他的文献检索模型被创建,比如向量空间模型、概率检索模型、模糊集合模型、扩展布尔检索模型等 。

布尔模型有简单,容易上手的特点。由于采用的是准确匹配的策略,在关键字表达式正确的情况下,可以很容易返回精确的结果。但是在文献调研阶段,要构造这样一个准确的表达式很困难,需要经过多次的迭代或者需要专业人员的帮忙。同时,如果忽略了一些关键字,很可能就会错过重要的相关文献 [1]。

除了精确构造表达式比较困难外,布尔模型的另外缺点是无法区分关键字之间的重要程度,所以对返回结果也就无法进行排序,只能靠自己对结果进行筛选。在进行筛选的时候,可以用 CARS 标准来衡量结果:

C (credible):资源是否可信?任何人都可以宣称自己的资源是可信的,但是仍然需要用自己的专业知识来做出判断。

A(accurate):信息是否准确?“信任但要验证”的原则在现在这个信息泛滥的时代处处适用。

R(reasonable):研究假设是否合理?

S(supported):其他的文献是否支持这篇文章?文章结果是否已经得到重复验证?

[1] 网络信息采集与应用,南京航空航天大学图书馆。

布尔文献检索模型简介相关推荐

  1. 搜索推荐系统[10]项目实战系列Z1:手把手教学(商品搜索系统、学术文献检索)语义检索系统搭建、召回排序模型详解。

    搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排).系统架构.常见问题.算法项目实战总结.技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排 ...

  2. wos 文献被引_全世界最权威的文献检索工具,这6个检索技巧必须要掌握!

    WOS-著名的科学引文索引数据库,历来被公认为世界范围最权威的科学技术文献的索引工具,能够提供科学技术领域最重要的研究成果. SCI引文检索的体系更是独一无二,不仅可以从文献引证的角度评估文章的学术价 ...

  3. 搜索引擎的检索模型-查询与文档的相关度计算

    1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况 ...

  4. [转]搜索引擎的文档相关性计算和检索模型(BM25/TF-IDF)

    搜索引擎的检索模型-查询与文档的相关度计算 1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度.实际搜索结果排序的因子有很多,但最主要的两个因素是 ...

  5. 《搜索引擎-信息检索实践》7.2.1 分类应用与检索/BM25检索模型

    1.简介 在所有的二元检索模型中,文档会被归为两类,相关文档和不相关文档.我们的任务是确定新来的文档是属于相关文档还是不相关文档. 如何判断相关与否,我们认为新来的文档如果属于相关文档的概率大于不相关 ...

  6. 概率检索模型:BIM+BM25+BM25F

    1. 概率排序原理 以往的向量空间模型是将query和文档使用向量表示然后计算其内容相似性来进行相关性估计的,而概率检索模型是一种直接对用户需求进行相关性的建模方法,一个query进来,将所有的文档分 ...

  7. 计算机基础知识的文献,四 计算机文献检索基础知识(原理、结构和功能)

    1.计算机检索原理 计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结 ...

  8. 计算机检索基础知识,[转载]四 计算机文献检索基础知识(原理、结构和功能)...

    1.计算机检索原理 计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结 ...

  9. 《文献检索》期末复习整理~2020

    注:本整理仅根据老师所划知识点进行整理,不能完全反应整个课程的内容 文章目录 第一章:信息检索概述 1.1--信息素养 信息素养的定义 1.2--信息与信息源 信息的特点 信息源的定义 信息的分类 文 ...

最新文章

  1. java如何读取excel文件
  2. 【题解】 [HNOI2015]落忆枫音 (拓扑排序+dp+容斥原理)
  3. Eboot 编译编译器决定中断向量及其实现单一性的原因
  4. wordpressQQ登陆php代码_WordPress实现前台登录功能
  5. 浅尝EffectiveCSharp_1
  6. Qt工作笔记-WebEngineView调用web站点中的JS脚本(含Vue Cli脚本)
  7. 第3章 flappy bird作业、SVN、GIT、码云
  8. Spring源码入门——AnnotationBeanNameGenerator解析
  9. 机器学习基石笔记-Lecture 14 Regularization
  10. 海风科技快速开发平台和构件的由来(一)
  11. ue4文档接口类学习
  12. android录屏软件大全,安卓免费录屏软件哪个好用 免费长时间录屏软件推荐
  13. Python给自己写一款不一样的吃鸡“外挂”!把把吃鸡绝不封号
  14. kux格式怎么转换 kux完美转换成MP3音频的技巧分享
  15. office2019word2019excel2019ppt2019关闭自动更新设置步骤
  16. 微信表情符号写入判决书,你发的OK、炸弹都可能成为“呈堂证供”
  17. 研华电脑510上电自启_研华工控机BIOS设置通电自启动方法技巧
  18. matlab函数重名,matlab无法定义具有重复名称 f 的函数。
  19. sql判断邮箱是否合法_如何验证会员系统中用户的邮箱是否真实存在
  20. vue cube-ui 搜索栏子组件封装

热门文章

  1. 个人实战经验分享-虚拟产品的几种零基础起步赚钱玩法
  2. Tableau可视化设计案例-04标靶图、甘特图、瀑布图
  3. 淘宝网店经营场所证明如何下载
  4. 门户网站还有存在的意义吗?
  5. 计算机技术发展趋势是什么,计算机以后的发展趋势是什么?
  6. Python中list和tuple的相互转换
  7. Matlab从三维矩阵中取出一列并且reshape
  8. 双目相机标定图片拍摄规范
  9. 全国计算机应用考试模拟试题,全国计算机应用能考试模拟试题.doc
  10. 他环游中国、拍 10 万张照,终于做出这本 App Store 第一的旅游书