*************************************************************************

免费订阅我的“信息管理与信息系统专业课期末复习”专栏,后续会相继推出其他专业课和平台课的期末复习资料哦

*************************************************************************

目录

第一讲 信息检索概述

(一)信息素养

(二)数据链

(三)信息检索模型

1. 定义:

2. 类别:

3. 布尔模型:

4. 向量空间模型:

5. 经典概率模型:

(四)信息检索系统的结构与评价

1. 信息检索系统的定义:

2. 数据库类别:

3. 信息检索系统的评价:

第二讲 信息检索的方法与技巧

(一)网络信息检索的基本方法

1. 布尔逻辑检索

2. 邻近检索(位置限制检索)

3. 短语检索(精确检索)

4. 截词检索

5. 字段限制检索

(二)信息检索的技巧

1. 扩大检索范围:

2. 缩小检索范围:


这两章内容不是很多,就整合在一起了。复习内容综合了书本知识和课上老师讲的内容,因此将更加全面。

整理不易,觉得好的话可以点个赞~

第一讲 信息检索概述

(一)信息素养

课堂上老师曾多次提及信息素养这一概念,但是并没有给出一个明确的定义,因此这里将我记录的笔记呈现出来,欢迎大家的补充。

1. 信息素养概念一:得知何时需要信息,如何获取信息,以及获取信息后如何评价和有效利用信息的能力

2. 信息素养概念二:信息素养是信息意识、信息能力、信息知识、信息道德

3. 信息素养概念三:信息素养是一种批判性思维,并且能够使用数字技术获取信息解决问题

4. 信息素养概念四:

从定义性的角度:从定义什么是由信息素养的人展开,描述一个具有信息素养的人是什么样的使人定义信息素养。

从过程性的角度:沿着人处理信息的过程展开,过程逻辑明确、系统。

从结构性的角度:a. 首先关注外在能力,包括高效获取,评判与选择信息,归纳存储,快速提取信息的能力,以及运用多媒体表达和使用信息的能力。

b. 其次,把这种外在能力转化为社会能力,即实现自身的社会意义

c. 最后,关注内在,提升人的内在品质,注重道德、情感、法律意识和责任感的培养。

(二)数据链

数据 信息 知识 智慧
原始的(Row) 有语义的(Meaningful) 有用的,并且得到的过程可靠,经过了实践的验证(Useful) 是一种信念,通过反思与实践(Thinking)

(三)信息检索模型

1. 定义:

信息检索模型,就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表述为某种数学公式,再经过演绎和推断,揭示和实际校验,翻过来指导信息检索实践。

2. 类别:

集合论:代表模型是布尔模型

代数模型:代表模型是向量空间模型

概率模型:代表模型是经典概率模型

3. 布尔模型:

定义:是基于集合理论和布尔代数的一种简单的检索模型。

优点是:形式简洁,结构简单

缺点是:只能判断文献要么相关要么不相关,无法描述与查询条件部分匹配的情况,可能导致检出的文献过多或过少。

4. 向量空间模型:

定义:通过对检出文献按相似度降序排列的方式来实现文献与查询的部分匹配。

优点:标引词加权改进了检索效果;其部分匹配策略云心检出与查询条件相近的文献;余弦公式根据文献与查询之间的相似度对文献进行排序。

缺点:标引词被认为相互独立

5. 经典概率模型:

emmm,感觉课本上的不太会考,就没做笔记了(绝对不是懒)

(四)信息检索系统的结构与评价

1. 信息检索系统的定义:

信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

2. 数据库类别:

按内容与功能划分包括以下几种:

  • 指南数据库
  • 交易数据库
  • 全文数据库(研究人员最常用)
  • 书目数据库(研究人员最常用)
  • 字典数据库
  • 数值数据库
  • 图像数据库

3. 信息检索系统的评价:

定义:信息检索系统评价的核心是检索性能的评价。检索性能评价是根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价以进一步完善检索工作的过程

指标1-查全率:从数据库中检出的数据中相关的信息量/整个数据库中相关的数据量

指标2-查准率:从数据库中检出的数据中相关的信息量/从数据库中检出的所有信息量

为了帮助大家理解这两个概念,请看下表:

所有的数据量(信息量)
你检索到的信息量       你没检索到的信息量
相关的信息量(始终是分子 相关的信息量
不相关的信息量         不相关的信息量

我把数据分成四个部分,检索到的相关的,检索到的不相关的,没检索到的相关的,没检索到的不相关的。

而检索到的相关的始终是分子,检索到的相关的+没检索到的相关的是查全率的分母,所以查全率用来表示相关记录(指所有的信息量)被检中的比例;检索到的相关的+检索到的不相关的是查准率的分母,所以查准率用来表示检出记录(指检索出来的所有信息量)的相关程度
                指标3-其他:其他还有一些指标如误检率、漏检率、新颖率大家可以自行查看。


第二讲信息检索的方法与技巧

(一)网络信息检索的基本方法

1. 布尔逻辑检索

包括逻辑与(AND),逻辑或(OR),逻辑非(NOT),这个比较简单就不细讲。

2. 邻近检索(位置限制检索)

定义:用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索

依据:文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。

3. 短语检索(精确检索)

就是一字不差的检索,很好理解

4. 截词检索

定义:在检索标识中保留相同的部分,用相应的截词符代替可变化的部分。

类别:前截词,后截词,中截词

5. 字段限制检索

、                定义:在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特殊的字段中,即字段限制检索

字段类型:

  • 基本索引字段:一篇记录中主要用来表达文献内容特征的字段称为基本索引字段,如篇名,文摘,叙词+自由词(主题词)
  • 辅助索引字段:表达文献外部特征的字段,如著者,机构名,语种,刊名,出版物等

(二)信息检索的技巧

1. 扩大检索范围:

检索词角度:使用上位词;增加同义词、近义词、缩略词等

逻辑连接词角度:使用逻辑或OR,减少逻辑非NOT

2. 缩小检索范围:

检索词角度:使用下位词;减少同义词、近义词、缩略词等

逻辑连接词角度:使用逻辑与AND,减少逻辑非NOT

......暂时只想到这些,后续可能有补充,也欢迎大家补充~


喜欢这篇文章的话就点个赞吧~如果觉得对你有用的话可以收藏起来以备不时之需

如果你对这类复习文章感兴趣的话,可以免费订阅我的“信息管理与信息系统专业课期末复习”专栏,里面后续会推出信管专业其他专业课的期末复习资料。

武汉大学信管专业期末复习系列——《信息检索》(第一、二章)信息检索概述+信息检索的方法与技巧相关推荐

  1. 武汉大学信管专业期末复习系列——《信息检索》(第十章)信息检索的应用

    ************************************************************************* 免费订阅我的"信息管理与信息系统专业课期末 ...

  2. 武汉大学信管专业期末复习系列——《计算机网络》(谢希仁版)(网络层)

    ************************************************************************* 免费订阅我的"信息管理与信息系统专业课期末 ...

  3. 微型计算机中存储器分成哪几个等级?它们各有什么特点?用途如何?,《微机原理》复习思考题第十二章存储器.DOC...

    <微机原理>复习思考题第十二章存储器 第章 存储器 ?????????????????????????????????????????????????????????? ????????? ...

  4. 期末复习系列之企业管理

    企业管理 复习!!!冲冲冲!!! 企业管理期末复习整理 一. 名词解释 1 股份有限公司(6) 2 企业管理(40) 3 市场细分(94) 4 财务分析(213) 5 人力资源管理(148) 6 产品 ...

  5. 概率论与数理统计期末复习题型集锦——第一章

    文章目录 第一章 一.概念性知识点 1. 事件间的关系 2. 互不相容事件.对立事件 3. 事件间的运算律 4.习题 二.计算题型 1. 排列组合 2. 古典概型 3. 几何概型 4. 条件概率 5. ...

  6. 《计算机网络》期末复习(第1~8章)

    前言 以下为我按照老师画的考试范围,理出的大黑书<计算机网络自顶向下方法>(第七版)复习知识点.(emmmm准确的说是我按照考试范围看了一遍大黑书,全篇博客并不简化,感觉也不利于速成,但不 ...

  7. 软件测试期末复习知识点(第三章、第四章)

    软件测试期末复习 第三章 黑盒测试 等价类划分 因果图 边值分析 功能测试 第四章 白盒测试 逻辑覆盖 路径分析 程序路径的树表示及路径编码 程序插装 断言语句 程序变异 第三章 黑盒测试 等价类划分 ...

  8. 972信息检索 | 第六章 专业性书目信息检索系统

    文章目录 第六章 | 专业性书目信息检索系统 SciFinder SciFinder的检索模式 剑桥科学文摘(CSA) CSA的检索 生物学文摘(BA) BP的检索 工程索引(Ei Compendex ...

  9. 972信息检索 | 第五章 国外综合性信息检索系统

    文章目录 第五章 | 国外综合性信息检索系统 Web of Science(WOS) WOS数据库资源 WOS的检索 WOS的检索方式 Journal Citation Report InCites ...

最新文章

  1. 正则匹配:Email 密码强度 身份证 手机号 日期 数字每4个字空一格等
  2. mysql 数据文件压缩,压缩MySQL数据文件的妙招
  3. 【笔记】HMM在股票指数中的简单应用
  4. zipkin server 数据持久化问题
  5. 玩! 框架:为什么我会爱上它
  6. 查询能力(SIP OPTIONS)
  7. 【转】C#开发笔记之05-迭代器中的状态机(State Machine)到底是什么?
  8. Java 判断文件是否隐藏
  9. 联想拯救者Y90电竞旗舰正式入网:搭载三星E4 OLED屏 支持144Hz刷新率
  10. 蓝桥杯2015 C语言大学B组 C/C++
  11. RSAC 2021:厂商发布概述
  12. 【Landsat 8】介绍
  13. Blue Prism如何成为RPA领域魔力象限领袖
  14. CCS安装教程——学习DSP的第一步
  15. 从github安装python项目
  16. 洛伦兹吸引子 matlab,混沌蝴蝶——洛伦兹吸引子
  17. html详细笔记及练习的几个例子
  18. 简单的车票管理系统(c语言)
  19. Dell电脑插入耳机不能识别
  20. 曝光程序员的桌面!有点心酸 |每日趣闻

热门文章

  1. 单片机七阶音符_(单片机问题)让蜂鸣器发出do,ri,mi,fa,so,la,si,按这个顺序发声,每个音符各发声1秒....
  2. Activit跳转动画之界面上某个位置 裂开上下拉伸动画跳转
  3. uni-app之使用vantweapp中的tree-select组件
  4. Python辅助作业批改
  5. #今日论文推荐#ECCV 2022 | 清华字节提出MGD:适用于分类/检测/分割的生成式知识蒸馏
  6. React-Native初学者的模拟器调试及真机调试
  7. 用mosquitto替换AWS KVS(Kinesis Video Streams)之WebRTC-C库的信令控制
  8. 小厨餐饮加盟有什么优势
  9. phps的利用(phps文件就是php的源代码文件)
  10. 从 OpenStack 到 Mesos 再到 Kubernetes, 携程容器云自动化运维平台实践\n