7辅助搜索

7.1、通配符问题

很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。GOOGLE不支持通配符,只能做精确查询,关键字中的“*”或者“?”会被忽略掉。

7.2、关键字的字母大小写

GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

7.3、搜索整个句子

GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。

示例:搜索包含“long, long ago”字串的页面。
搜索:“"long long ago"”
结果:已搜索有关long long ago的中文(简体)网页。 共约有16,500项查询结果,这是第1-10项 。 搜索用时 0.06秒。

7.4、搜索引擎忽略的字符和词汇

GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。

示例:搜索关于第一次世界大战的信息
搜索:“"worldwar i"”
结果:"i"使用过于频繁,没有被列入搜索范围。已向英特网搜索"worldwar i". 共约有7,370项查询结果,这是第1-10项 。 搜索用时0.17秒。

7.5、强制搜索

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。

示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"+who +am +i"”
结果:已向英特网搜索"+who +am +i". 共约有332,000项查询结果,这是第1-10项 。 搜索用时3.68秒。

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

8进阶搜索

上面已经探讨了GOOGLE的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。

8.1、对搜索的网站进行限制

“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。 共约有1,730项查询结果,这是第1-10项 。 搜索用时 0.23秒。

示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙 的中文(简体)网页。 共约有734项查询结果,这是第1-10项 。 搜索用时0.12秒。

示例:搜索新浪文教频道中关于鲁迅的信息。
搜索:“鲁迅 site:edu.sina.com.cn”
结果:已在edu.sina.com.cn搜索有关 鲁迅的中文(简体)网页。 共约有672项查询结果,这是第1-10项 。 搜索用时0.24秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。

8.2、查询某一类文件(往往带有同一扩展名)

“filetype:”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。:)

最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档大约有2500万左右。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。

示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“ecommerce filetype:pdf”
结果:已向英特网搜索ecommerce filetype:pdf. 共约有25,500项查询结果,这是第91-100项 。 搜索用时 0.44秒。

下面是某项搜索结果:

[PDF] www.ecommerce.gov/apec
文档类型: PDF/Adobe Acrobat - 一般文字档
Page 1. A Partnership of the Business Community With APEC Economies E-COMMERCE
READINESS ASSESSMENT GUIDE www.ecommerce.gov/apec Page 2. ...
www.ecommerce.gov/apec/docs/readiness_guide_files/readiness_guide_5.pdf - 类似网页

可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。

搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdf ecommerce”。搜索结果数量大致相同,不过查询结果顺序则略有很大差别。

注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。

“filetype”的另一个强大用处则在图片搜索。下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。进入“http://images.google.com/”,查找关于本拉登的JPG图片。

搜索:“Bin Laden filetype:jpg”
结果:搜索有关 Bin Laden filetype:jpg 的图片()。(试验版) 共约有1,630项查询结果,这是第1-20项 。 搜索用时0.14秒。

除此之外,我尚未发现其他的filetype用法。如果有谁知道,请给我发邮件。预先感谢。:)

8.3、搜索的关键字包含在URL链接中

“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。 共约有16项查询结果,这是第1-10项 。 搜索用时0.16秒。

示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关inurl:security windows2000 的网页。 共约有188项查询结果,这是第1-10项 。 搜索用时0.27秒。

注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。

“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。 搜索用时0.36秒。

8.4、搜索的关键字包含在网页标题中

“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。 共约有465项查询结果,这是第1-10项 。 搜索用时0.16秒。

Google搜索从入门到精通 v4.0 (二)相关推荐

  1. GOOGLE搜索从入门到精通v3.0 from:http://www.being.org.cn/tool/google.htm

    GOOGLE搜索从入门到精通v3.0 原文:http://www.lasg.ac.cn/docs/googlebook.html 作者:donquix 内容 1,前言 2,摘要 3,如何使用本文 4, ...

  2. [推荐]GOOGLE搜索从入门到精通v3.0

    作者:donquix (donquix@sina.com) ------------------------------ 内容 1,前言 2,摘要 3,如何使用本文 4,GOOGLE简介 5,搜索入门 ...

  3. GOOGLE搜索从入门到精通v3.0

    内容 1,前言 2,摘要 3,如何使用本文 4,GOOGLE简介 5,搜索入门 6,初阶搜索 6.1,搜索结果要求包含两个及两个以上关键字 6.2,搜索结果要求不包含某些特定信息 6.3,搜索结果至少 ...

  4. Google搜索从入门到精通

    一篇不错的google搜索运用文章: from http://lilybbs.net/vd555635/main2.html [本篇全文] [回复本文] [本篇作者: 54tw] [本篇人气: 617 ...

  5. Google搜索从入门到精通【转】

    1.前言 我是在2000年上半年知道Google的.在这之前,我搜索英文信息通常用AltaVista,而搜索中文信息则常用Sina.但自使用了Google之后,它便成为我的Favorite Searc ...

  6. Google搜索引擎从入门到精通

    Google搜索从入门到精通 1.Google简介 Google是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年 9月发明,Google Inc. 于19 ...

  7. SpringBoot从入门到精通教程(二十七)- @Valid注解用法详解+全局处理器Exception优雅处理参数验证用法

    问题痛点 用 Spring 框架写代码时,写接口类,相信大家对该类的写法非常熟悉.在写接口时要写效验请求参数逻辑,这时候我们会常用做法是写大量的 if 与 if else 类似这样的代码来做判断,如下 ...

  8. OpenShift从入门到精通系列之二:深入了解OpenShift与K8S的关系

    OpenShift从入门到精通系列之二:深入了解OpenShift与K8S的关系 一.OpenShift与K8s的关系 二.OpenShift发展简史 三.OpenShift对K8s的增强 四.Ope ...

  9. Oracle数据库从入门到精通系列之二:SGA和后台进程

    Oracle数据库从入门到精通系列之二:SGA和后台进程 一.SGA 二.后台进程 一.SGA Oracle有一个很大的内存块,称为系统全局区(SGA),用于(但不限于): 维护所有进程需要访问的内部 ...

最新文章

  1. c# 垃圾回收是引用类型而言的
  2. KMP-next数组
  3. ES6新特性之字符串扩展
  4. Mac修改系统用户名好方法(文件无丢失)
  5. mysql显示表已存在_MySQL数据库与数据表的相关操作
  6. 详解摄像头各个引脚的作用关系
  7. sql server 部署_将程序包部署到SQL Server集成服务目录(SSISDB)
  8. php地图,php调用google地图
  9. 边缘计算以及kubeedge概念的通俗解释
  10. android后台前台切换,Android 把后台应用切换到前台
  11. 独家 | GAN大盘点,聊聊这些年的生成对抗网络 : LSGAN, WGAN, CGAN, infoGAN, EBGAN, BEGAN, VAE
  12. 初学者如何入门C语言
  13. Photoshop调色教程
  14. 微信小程序答题,怎么设计页面渲染,答完一题,跳到下一题
  15. 视频教程-oracle数据库教程-Oracle
  16. 传奇开区网站如何添加流量统计代码
  17. 高德地图API学习二、获取定位数据
  18. 现在计算机有64位吗,任何电脑都可以装64位系统吗|是不是所有的电脑都可以装64位系统...
  19. java中的线程同步机制讲解
  20. 自定义仿全民直播界面的悬停效果

热门文章

  1. 全网搜php,ThinkPHP-FM全网自动采集聚合影视搜索源码
  2. Latex 文本编辑技巧
  3. python:「股价瞭望者」(StockWatcher)
  4. 【2022】RedHat最新RHCE中级认证考题解析
  5. 检测你的网站是否被挂马的方法
  6. Galaxybase企业版图数据库基准测试
  7. assembly的概念
  8. FX2N通讯监控记录, PLC程序/参数/注释/文件寄存器的写入和读出
  9. tts 文本转语音 java_用TTS实现文本转语音
  10. 11月不良与垃圾信息举报:垃圾邮件7,976件次 升59.2%