信息检索过程中常用的检索表达式

检索表达式是检索策略的具体体现之一,简称检索式。检索式一般由检索词和各种逻辑运算符组成。具体来说,它是用检索系统规定的各种算符将检索词之间的逻辑关系、位置关系等连接起来,构成的计算机可以识别和执行的检索命令式。检索式构造的优劣关系到检索策略的成败。

检索表达式主要有逻辑表达式、截词检索表达式、位置检索表达式等,其中,最为常用的是逻辑表达式。

1.逻辑表达式

逻辑表达式是指利用布尔逻辑算符,对检索词的关系进行表达,又称布尔逻辑表达式。布尔逻辑是目前计算机检索最简单、最基本的匹配模式,也是计算机检索领域广泛采用的逻辑表达方式。布尔算符有“逻辑与”(“AND”)、“逻辑或”(“OR”)、“逻辑非”(“NOT”)等。

A AND B                         A OR B                            A NOT B

图 布尔逻辑算符示意图

(1)逻辑“与”:表示它所连接的两个检索词必须同时出现在结果中,逻辑检索式可写为:A AND B。也有些数据库中用“*”或其他符号表示。例如,要查找关于“计算机检索”方面的信息,检索需求可以表述为:“计算机AND检索”。目前,在一些数据库(如中国期刊网)中提供的二次检索,实质上也是逻辑“与”的运算。逻辑“与”的检索能增强检索的专指性,使检索范围缩小。

(2)逻辑“或”:表示它所连接的两个检索词中任意一个出现在结果中就满足检索条件,检索式可写为:A OR B。在一些中文数据库中,用“+”表示逻辑“或”。例如,想检索关于“计算机”的信息,可以表达为:计算机+电脑。逻辑“或”主要用于表达检索词的近义词、同义词、全称和缩写等,以便全面、完整地表达相关的概念。

(3)逻辑“非”:表示它所连接的两个检索词中,应从第一个概念中排除第二个概念,检索式可写为:A NOT B。在一些中文数据库中用 “-”表示逻辑 “非”。例如,想查找关于“研究生教育”的资料,但要求不包括在职研究生,可以将检索式写为:“(研究生*教育)-在职研究生”或“研究生-在职研究生*教育”。逻辑 “非”表示具有不包含某种概念关系的一组组配,用来缩小检索范围。但在实际检索中要慎重使用。

逻辑表达式在实际检索过程中,易于理解,便于使用。例如,想检索“中国高等教育的发展趋势”,用逻辑表达式可写成:中国*高等教育*发展趋势。表示要求查找的文献的相应字段中同时包含“中国”、“高等教育”、“趋势”这三个词,而排列形式不限。

以上逻辑运算符中,其运算优先级顺序为“非”、“与”、“或”,但是可以用括号改变它们之间的运算顺序。还要注意的就是对于同一个逻辑运算式来说,不同的运算顺序有不同的运算结果。

2.截词检索表达式

截词检索表达式指在检索式中用专门符号(截词符号)表示检索词的某一部分,检索词允许有部分变化,检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。截词检索表达式在西方语言检索中应用比较广泛,在中文信息检索中也有一定的应用。采用截词检索表达式,既能防止漏检,又能节省时间,是提高检索效率的有力措施。不同检索系统采用的截词符不完全相同,一般常采用“?”、“*”等。

截词方式有多种,按截断的位置来分,截词有前截断、中间截断、后截断等;按截断的字符数量来分,可分为有限截断和无限截断两种。

后截词,又称右截词、前方一致,允许检索词尾部有若干变化形式。例如检索式“Comput?”将检出包含Computer、Computing、Computed、Computerization等词汇的结果。

中间截词,允许检索词中间有若干变化形式,例如“wom * n”就可同时检索到含有woman和women的结果。

前截词,又称左截词、后方一致,允许检索词的前端有若干变化形式,例如检索 “*physics”就可检得包含physics、astrophysics、biophysics、chemicophysics等词的结果。

截词检索表达式在使用时,一定要合理使用,截断部分要适当,不要截得太短,以免增加检索噪音,查出很多无关的文献。

3.位置检索表达式

位置检索表达式表示两个检索词之间的位置邻近关系(不同的的检索系统采用的表达符号可能不同),常用的有:

W(nW):W是with的缩写,(W)表示其两侧的检索词必须按前后顺序出现在记录中,两词之间不允许插入其它词,只可能有空格或一个标点符号。(nW)表示两侧的检索词中间允许插入的词最多只能有n个,且检索词的位置不能颠倒。

N:是near的缩写,(N)表示其两侧的检索词位置可以互换,在两词之间不能插入其它词,但允许有空格或标点符号。(nN)表示允许在此运算符两策的检索词之间最多插入n个词,且两个检索词的位置可颠倒。

L:是link的缩写,(L)表示其两侧的检索词之间有主从关系,前者为主,后者为副。L可用来连接主、副标题词。

F: 是field的缩写,(F)表示其两侧的检索词必须出现在同一个字段中,但两个检索词的词序不限,且两个检索词之间的单词数量也不限制。如,两个检索词必须同时出现在篇名字段、文摘字段或叙词字段。

S:是subfield的缩写,(S)表示两侧的检索词必须出现在同一个子字段中,如同一个句子或短语中,但词序不限,且两个检索词之间可有若干个其它词。

在某些检索系统中,还使用双引号“ ” 标示不可分割的词组或短语,如“civil engineering”,在检索结果中civil engineering必须是连在一起的词组。

利用计算机运算符编写检索式,计算机信息检索过程中常用的检索表达式相关推荐

  1. 计算机信息检索系统中常用的检索技术,在计算机信息检索系统中,常用的检索技术主要有哪些...

    满意答案 蒙奇奇.011703 推荐于 2018.05.21 采纳率:47%    等级:12 已帮助:8418人 在计算机信息检索系统中,常用的检索技术主要有以下六种: 1. 布尔逻辑检索 利用布尔 ...

  2. 在计算机检索系统中常用的检索技术有,计算机检索技术有哪些

    计算机检索技术:1.布尔逻辑检索:利用布尔逻辑算符进行检索词或代码的逻辑组配.2.截词检索:截词检索是计算机检索系统中应用非常普遍的一种技术.3.位置检索.4.字段限定检索.5.加权检索.6.聚类检索 ...

  3. 计算机二进制基础列式,计算机基础;十进制数100对应的二进制数、八进制数和十六进制数分别是...

    中计数采用了多种记数制,比如:十进制,六十进制(六十秒为一分,六十分为一小时,即基数为60,运算规则是逢六十进一),--.在计算机中常用到十进制数.二进制数.八进制数.十六进制数等,下面就这几种在计算 ...

  4. mongodb 字段检索_如何在MongoDB中创建,检索,更新和删除记录

    mongodb 字段检索 介绍 (Introduction) MongoDB is a free and open-source NoSQL document database used common ...

  5. html判断cookies ph,【教程】如何利用IE9的F12去分析网站登陆过程中的复杂的(参数,cookie等)值(的来源)...

    在抓取网站内容,模拟网站登陆等过程中: 往往要去分析某些变量,参数,某cookie的值的来源. 而想要分析单个的值,相对于从F12所抓取到的海量信息,即N多条的记录,且每天记录中有N多数据信息,来说, ...

  6. 电大计算机dm编写程序,中央电大计算机组成原理与汇编语言试题.docx

    中央电大计算机组成原理与汇编语言试卷 一.填空题(每空1分) 1>冯?诺依曼体制中最核心的思想是计算机采用 存储程序工作方式. 2.有一机器字 24位,其中操作码占 4位.若采用二地址寻址,则每 ...

  7. win7计算机回收站网络闪退,win7使用过程中在回收站上出现的常见问题及解决方法汇总...

    又是一年开学季,即将走入校门的同学们相信已经是整装待发了.很多同学都会选择带上电脑去学校,作为操作系统中的佼佼者,Windows7仍以其丰富的创新性和卓越的兼容性而成为市场的主流.同时Win7简单.安 ...

  8. 爱普生LQ630k针式机使用过程中最常见问题

    和爱普生630k 类似的机器还有很多      比如下面这些机器都可以参考爱普生630k  爱普生LQ630K/LQ635K  适用于EPSON LQ610K/LQ615K/LQ630K/LQ635K ...

  9. WEB OF SCIENCE 中检索式的编写

    2019独角兽企业重金招聘Python工程师标准>>>   WEB OF SCIENCE中检索式的编写 (其他数据库中编写的思路是一样的,只要根据其数据库的各种算符的规定即可) 1. ...

最新文章

  1. iOS 13 如何删除SceneDelegate
  2. 文献记录(part48)--Vector of Locally and Adaptively Aggregated Descriptors for Image Feature ...
  3. 推荐一个ASP.NET的资源网站
  4. java 中的 io 系统总结
  5. 化工图纸中LISP_必备干货丨石油化工安装工程质量与成本控制研究
  6. python/selenium/chrome
  7. atitit.流程标准化--- mysql启动不起来的排查流程attilax总结
  8. css盒模型(附图解)
  9. Maven教程-使用Nexus搭建私服,Java基础视频
  10. layui多级联动下拉框的实现_layui省市县多级联动
  11. python中等高线填充颜色_Matplotlib:使用透明颜色填充等高线图
  12. 树莓派有些WIFI连接不上
  13. 极光Im + layIm 实现后台聊天
  14. 【eclipse】mybatis配置文件创建与mapper接口文件创建
  15. SpringBoot项目中增加favicon.ico图标
  16. 网络与路由器故障诊断基础知识
  17. 单源最短路径dijkstra算法
  18. 咪唑型离子液体修饰二氧化硅改性PVC薄膜|离子液体修饰碳纳米管(CNTs-ILE)化学试剂
  19. 阿里云天池大赛赛题(机器学习)——工业蒸汽量预测(完整代码)
  20. RVV线与RV线有什么区别

热门文章

  1. 简单的描述电荷泵的工作原理
  2. ChatGPT让沟通更智能、更便捷
  3. 短视频是屌丝逆袭的一个绝好的机会
  4. css mix-blend-mode图层混合模式(跟ps的功能图层混合模式类似)
  5. 嵌入式linux gprs,在嵌入式Linux下GPRS上网方案[zt]
  6. wrf视频文件如何查看
  7. XML+XSL 实例
  8. 什么是点阵图 Bitmap ?
  9. modbus网关都有哪些特点,modbus网关的功能及作用
  10. React 如何封装消息提示组件message--Material-UI