资料仅供参考

资料仅供参考

计算机信息检索02139自考资料

第一章信息检索概述

信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找岀有关信息的过程。

根据检索手段的不同,信息检索能够分为手工检索、光盘检索、联机检索和网络检索。

信息检索的基本原理

经过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系 统,并经过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获

得和利用信息源。

信息检索语言

信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号 及其使用规则构成的供标引和检索的工具。

五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后 三者统称为计算机信息检索。

与手工检索相比,计算机信息检索的特点表现在:

(1)速度快、效率高,仅几分钟就能够从成千上万条记录中找到所需信息;

(2)检索范围广,能够迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都能够成为信息源;

(3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就能够在任何地方借助 光盘和通信网络查询所需信息。

信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译 和抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。

信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。

信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。

数据库由字段、记录和文档构成。

根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。

信息检索系统评价的核心是检索性能评价。

检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进 一步完善检索工作的过程。

评价检索效果的最主要的指标:查全率和查准率。

查全率

查全率是指检岀文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比 例。

查准率

查准率是指检岀文献中合乎需要的文献数量占检岀文献全部数量的比例。

第二章网络信息检索的方法与技术

布尔逻辑检索的主要运算符

布尔逻辑检索的主要运算符有:逻辑与(“AND )、逻辑或(“OR”)、逻辑非(“NOT )

它们分别代表的含义是:(1、逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”.

表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT

后面的检索词。

邻近检索

邻近检索是用一些特定的算符来表示检索词与检索词之间的顺序和词间距的检索。

短语检索:短语用“ ”表示,检索岀与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索”

截词检索

是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所 有含有相同部分标识的记录全部检索岀来。截词符一般用? ”或“*表示,但不同的数据库中有所差

另U。

常见的截词检索方法有前截词、中间截词和后截词。

在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限 制检索。

模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、

下位词进行检索,以达到扩大检索范围、避免漏检的目的。

信息检索的主要技术有:

(1)全文检索技术;(2 )多媒体信息检索技术;(3)超文本及超媒体检索技术;(4)智能信

息检索技术;(5)可视化信息检索技术;(6 )跨语言信息检索技术;(7 )文本聚类技术。

(8)智能信息检索的最大特点是在检索过程中引入了资源对象的语义处理。

检索策略

检索策略是为实现检索目标而制订的全盘计划或方案,是就一个问题检索一个或多个数据库所 输入的全部检索式的集合。

信息检索的一般步骤(主要流程):

(1) 分析信息需求。即要确切了解所要查询的目的和要求,确定检索问题的关键词、涉及学科、

信息类型、查询方式、查询范围、查询时间等。

(2)选择合适的检索工具。选择合适的检索工具主要从检索工具的类型、收录范围、检索问题 的类型、检索具体要求等方面综合考虑。

(3)确定检索点与关键词。应尽量选专指词、特定概念或专业术语,避免冷僻词汇和太泛的词。

(4)正确构造检索式。利用搜索工具支持的检索运算、允许使用的检索标识和各种限定,正确 构建检索式。

(5)及时调整检索策略。当检索结果为零或检索结果太少,需要扩大检索范围;检索时如果得 到太多的检索结果,或检索结果不相关,需要缩小检索范围。

(6)检

计算机信息检索自考知识点,计算机信息检索02139自考资料.docx相关推荐

  1. 教师办公用计算机统计表,XX中学计算机配备及多媒体教室统计表(规范化学校资料).doc...

    XX中学计算机配备及多媒体教室统计表(规范化学校资料).doc (3页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.90 积分 XX学校计算机配备 ...

  2. 计算机绘图自考知识点,计算机绘图(电子AD)自考大纲-08年9月.doc

    计算机绘图(电子AD)自考大纲-08年9月,计算机绘图自考,小学生计算机绘图作品,计算机绘图,机械制图与计算机绘图,计算机绘图基础教程,计算机绘图基础,计算机绘图师,计算机绘图特点,计算机绘图1100 ...

  3. 计算机的发展知识点,计算机一级MsOffice考试知识点:计算机的发展

    MsOffic常用组件有Word.Excel.Powerpoint等.本文特意为大家收集整理了计算机一级MsOffice考试知识点:计算机的发展,一起看看吧! 1.1计算机的发展 一.计算机发展 1. ...

  4. 计算机组成原理主存储器知识点,计算机组成原理(存储器).ppt

    计算机组成原理(存储器).ppt 计算机组成原理,主讲颜俊华 存储子系统,存储子系统,主要知识点 掌握存储器的分类.存储系统的层次结构 掌握存储单元.存储容量.地址线.数据线的关系3. 掌握用半导体存 ...

  5. 计算机四级软件工程知识点,计算机四级考试题库及搜题软件,送一份备考指南给大家!...

    原标题:计算机四级考试题库及搜题软件,送一份备考指南给大家! 大家都知道,英语与计算机考试都是我们读书生涯中很常见的考试.其计算机四级考试就是全国计算机等级水平考试中的一中. 计算机四级是针对计算机的 ...

  6. 计算机操作员五级知识点,计算机操作员五级.doc

    计算机操作员五级 上海市计算机操作员(五级)鉴定环境模拟盘答题指导 一.说明 为了广大考生能够很好的适应考试环境,在大家平时训练的基础上,可以在上海市劳动和社会保障局/wsbs/zypxjd/jnjd ...

  7. 计算机运算器存储器知识点,计算机一级知识点:运算器、控制器

    计算机一级知识点:运算器.控制器 一级主要考核微型计算机基础知识和使用办公软件及因特网(Internet)的基本技能.一级主要考核微型计算机基础知识和使用办公软件及因特网(Internet)的基本技能 ...

  8. 计算机图形学透视投影知识点,计算机图形学

    计算机图形学期末复习 第一章 绪论 计算机图形学定义:计算机图形学是研究通过计算机将数据转换成图形,并在专门显示设备上显示的原理.方法和技术 第二章 计算机设备及硬件系统 知识点 阴极射线管(CRT) ...

  9. 职高计算机选修6知识点,(计算机基础考试7.doc

    试卷编号:9619 所属语言:计算机基础 试卷方案:WINhy 试卷总分:100分 共有题型:4种 一.单选 共40题 (共计40分) 第1题 (1.0分) 题号:5923 难度:中 第81章 一个六 ...

  10. 计算机绘图自考知识点,计算机绘图(电子CAD)自考大纲-08年9月.doc

    天津市高等教育自学考试课程考试大纲 课程名称:计算机绘图(电子CAD) 课程代码:4201 第一部分 课程性质与目标 一.课程性质与特点 <计算机绘图(电子CAD)>是电子类专业的一门专业 ...

最新文章

  1. 土地档案管理系统需求分析
  2. Python与MySQL数据库的交互实战
  3. R语言optim函数进行函数优化实战(和lm函数进行对比)
  4. PMCAFF | 赶集、暴风影音这些优质App为什么都在做积分商城?
  5. wxWidgets:wxDialUpManager类用法
  6. 各版本lettuce spring集成流程(连接池、哨兵配置)
  7. HTML5 API详解(18):IndexedDB 本地存储
  8. 大学生起诉小米获赔流量费1元
  9. 自动化测试和测试开发的区别?培训学哪个更好?
  10. String reverse方法
  11. 第9章 推箱子(《C和C++游戏趣味编程》配套教学视频)
  12. linux3.10.53编译,根据官方文档在Linux下编译安装Apache
  13. 给本地Git配置账号信息
  14. 基于SSM的大学拍卖网站(含文档)
  15. Python英语单词查询
  16. Ubuntu20.04右键添加新建空白文本文件的方法
  17. 炫酷的时间HTML页面,炫酷css3垂直时间轴特效
  18. 数学/数论专题-学习笔记:狄利克雷卷积
  19. 基于云开发的校园社区小程序 微信小程序开发实战 课设作业
  20. 【Machine Learning】模型融合之Stacking

热门文章

  1. 扩展欧几里得算法——Python详解
  2. php 时间转换yyyymmdd,YYYYMMDD字符串日期转换为日期时间值
  3. 基于Web的爬虫系统设计与实现
  4. app逆向入门分析——破解某APP登陆请求参数
  5. [指导]HP ProBook/EliteBook/Zbook系列笔记本clover安装黑苹果
  6. TM1640的驱动及代码
  7. smobiler中实现页面切换_使用Smobiler实现类似美团的界面
  8. PandoraBox潘多拉无线桥接(中继)使用方法和无法使用解决----小米mini小米3路由
  9. linux rm批量,Linux rm删除大批量文件
  10. 如何快速调出软键盘_天生我材必有用 | 如何快速的计算和调用防火阀、调节阀、铝合金风口等材料价格...