1
1
第4章 网络信息资源检索
4.1 概述
4.2 网络检索工具—搜索引擎
4.3 综合性搜索引擎
4.4 专业性搜索引擎
4.5 特色搜索引擎
2
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算机
网络可以利用的各种信息资源的总和”。具体的
说是指所有以电子数据的形式把文字、图像、
声音、动画等多种形式的信息存贮在光、磁等
非纸介质的载体中,并通过网络通信、计算机
或终端等方式再现出来的资源。
3
网络信息资源的的特点:
(1)数量庞大,增长迅速。最大的搜索引擎Google已收录200亿网页,
且每年以级数的速度在增长。据预测,到2008年Google收录网页将
超过1000亿。
(2)内容丰富,形式多样。通过因特网可以获取学习、娱乐、工作、生
活、购物等各方面的信息。另外,资源有有文本、视频、音频、动画
多种表现形式。
(3)变化频繁,价值不一。比较大的网站的一般信息一般每天更新一
次,特别是新闻信息实时更新,大网站的内容更新快且真实可靠,小
网站或个人网站虽不乏优秀和可参考的信息,但质量良莠不齐。
(4)结构复杂,分布广泛。网络信息主要采取万维网WWW---网页形
式—超链接结构,但网上还有大量的FTP文件,论坛信息,新闻组信
息,不同的信息结构需要不同的检索工具。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各
机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管
理无统一标准和规范,网络信息分散于不同国家、不同地区服务器
上,采用不同的操作系统及数据结构,字符界面、图形界面、菜单方
式、超文本方式等,缺乏集中统一的管理机制。
4
4.1.2 网络信息资源的类型
按人类信息交流的方式分类:
• 非正式出版信息。如电子邮件、电子会议、专题组和论坛、电子
公告板新闻等。
• 正式出版物。即用户可以查询到的各种数据库、联机杂志、电子
版工具书、报纸、专利信息等。
从网络信息检索角度,按信息查询方式对网络信息进行分
类:
• (1) 互联网(WWW)信息。
• (2) FTP信息。
• (3) Telnet信息。
• (4) USENET/Newsgroup信息资源。
• (5) USTSERV/Mailing List 信息。
• (6) Gopher信息。
5
• 若按组织形式分,可将网络信息资源分为以下
三种类型:文件型、数据库型、超媒体型。
• 按时效性分,可将网络信息资源分为动态信息、
电子报纸、电子期刊、电子图书、联机馆藏目
录、联机数据库等。
• 按信息的媒体形式分为:文本信息、超文本信
息、多媒体信息。
• 按网络信息服务方式分为:网站信息、新闻组
信息、论坛信息、文件服务信息。
• 按信息格式分为:HTML、TXT、DOC 、PDF、
RM、 MP3……。
6
4.1.3 网络信息检索的一般方法
1.网上浏览
• (1)偶然发现。
• (2)顺“链”而行。
2.网络资源指南(目录型检索工具)
3.搜索引擎
4.图书馆网站的网络导航
2
7
4.2 网络检索工具—搜索引擎
4.2.1 搜索引擎概念
4.2.2 搜索引擎基本原理
搜索引擎的原理,可以看作三步:
• 从互联网上抓取网页
• 建立索引数据库
• 在索引数据库中搜索排序。
8
4.2.3 搜索引擎类型
按照信息搜集方法和服务提供方式的不
同,搜索引擎系统可以分为三大类:
• (1)目录式搜索引擎:
• (2)全文搜索引擎:
• (3)元搜索引擎:
超搜索---www.bbmao.com:网页数据库来源于
五大搜索引擎Google、雅虎、百度、iAsk以及搜狗。
9
4.3 综合性搜索引擎
4.3.1 Google的使用
4.3.2 百度的使用
4.3.3 新浪爱问的使用
4.3.4 搜狐搜狗的使用
10
4.3.1 Google的使用
两位斯坦福大学的博士生 Larry Page 和
Sergey Brin 在 1998 年创立了 Google。
Google是目前因特网上最大的搜索引擎
2006年4月12日Google公司宣布Google
的全球中文名称正式取名为“谷歌”。
www.google.com
www.google.cn (屏蔽了一些网站)
11
网页搜索:支持以下几个高级命令检索:
(1) “site”表示搜索结果局限于某个具体网站或
者网站频道。
(2)filetype:搜索特定类型的文件。格式:“关
键词文件的扩展名”。
• 例1:搜索包含“电子商务”关键词的word文件。输入:
电子商务 filetype:doc。
• 例2:搜索包含“网络安全”方面的powerpointer文件。
输入:网络安全filetype:ppt。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入:搜索
引擎filetype:pdf。
12
(3)intitile:限制你搜索的关键词出现在
网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页,
输入:“intitile:信息检索”。
(4)inurl:限制你搜索的关键词出现在网
页的url中。
• 例:搜索网页url中含有“mp3”的网页,输入:
“inurl:mp3”。
(5)link:可以得到一个所有包含了某个指
定URL的页面列表.
• 例如:link:www.google.com 就可以得到所
有连接到Google的页面。
3
13
单击中文主页,单击Google.com in
English链接进入英文界面。英文界面还有
更多功能:
• Blog Search:博客搜索,已支持中文检索。
• Book Search:Google的图书搜索。
• Froogle:Google的商品购物搜索引擎。
• Google Finance:财经搜索。
• Google Maps:Google的图书搜索。
• Google Video:Google的视频搜索。
14
Google的免费软件:
桌面搜索:只有1.7MB。
Google 工具栏
Picasa 图片管理软件
Google talk:即时通讯软件。
Google Earth:基于卫星图片的地图软件。
Google SketchUp:3D作图软件。
Google Pack:Google发布的免费软件包。
15
4.3.2 百度的使用
百度是全球最大的中文搜索引擎,2000年
1月由李彦宏、徐勇两人创立于北京中关
村,致力于向人们提供“简单,可依赖”的信
息获取方式。 “百度”二字源于中国宋朝词
人辛弃疾的《青玉案》诗句:“众里寻他千
百度”,象征着百度对中文信息检索技术的
执著追求。
16
目前主要有以下功能:
• 新闻搜索
• 网页搜索
• 贴吧
• MP3搜索
• 图片搜索
• 百度地图
• 百度知道
• 百度百科
• 百度空间
17
4.3.3 新浪爱问的使用
“爱问iAsk”是新浪完全自主研发的搜索产
品,采用了目前最为领先的智慧型互动搜
索技术,充分体现人性化应用的产品理
念,为广大网民提供全新搜索服务。
网址:www.iask.com
18
目前爱问主要有以下功能:
• 网页搜索
• 博客搜索
• 本地搜索
• 知识人搜索
• 视频搜索
• 共享资料
• 开放词典
• 大百科
• 专业搜索
4
19
4.3.4 搜狐搜狗的使用
搜狗是搜狐公司于2004年8月3日推出的完
全自主技术开发的全球首个第三代互动式
中文搜索引擎,是一个具有独立域名的专
业搜索网站--“搜狗”(www.sogou.com)。
最进推出了最智能的搜狗拼音输入法,下载
地址:www.sogou.com/pinyin
20
目前主要有以下功能:
网页搜索:
• 网页搜索特色:智能分类、智能纠错、拼音查
询、相关搜索、网页快照、英文词典、便捷计
算、股票查询、邮编查询、天气速查、IP查询、
手机号码地区查询、楼盘查询、区号查询、生
字快认、成语查询、软件查询、游戏查询、热
书荐读、搜狗十点。
音乐搜索
新闻搜索
说吧:类似百度贴吧。
21
地图搜索
人物搜索:在茫茫人海中找到你想的人,
也能搜到你自己。数据来源于校友录
ChinaRen数据库。
购物搜索:搜索 300 万种商品,覆盖
1000 多家商城。
商机搜索:搜索您所需商业信息,掌握比
竞争对手更多的销售机会。
22
其他的比较好的中文综合性搜索引擎还有:
• 雅虎:www.yahoo.cn
• 中搜:www.zhongsou.com
• 天网:www.tianwang.com
23
4.4 专业性搜索引擎
专业性搜索引擎又称为垂直搜索,是针对
某一个行业的专业搜索引擎,是搜索引擎
的细分和延伸,是对网页库中的某类专门
的信息进行一次整合,定向分字段抽取出
需要的数据进行处理后再以某种形式返回
给用户。
24
4.4.1 工作搜索引擎
在网络没有兴起之前,求职或者招聘,只能通过纸媒、电
视和广播这三条途径实现。不过,网络改变了这一切,随
着ChinaHR(中华英才网)、51job(前程无忧)和智联招
聘等专业招聘网站的诞生,通过网站找工作成了流行的求
职方法。在此之后,搜索引擎的大红大紫,又催生了搜职
网等工作搜索引擎网站的出现。
• 职友集---www.jobui.com
• 搜职网---www.globehr.com
• 牛耳搜职网---www.newerjob.com
• 职业大百科---www.jobsoso.com
5
25
4.4.2 论坛搜索引擎
www.qihoo.com: qihoo(奇虎)论坛搜
索,目前最好的论坛搜索引擎。
www.teein.com: Teein论坛搜索有高级搜
索选项,功能强大。页面布局合理,有不少贴
心的小功能。
www.daqi.com:大旗网
26
4.4.3 读书搜索引擎
www.duxiu.com :读秀图书搜索
www.wensou.com:文搜网,中国第一家
专业文学搜索引擎。
http://book.httpcn.com/search:电子
书搜索引擎,中国最大的电子图书搜索引
擎。
27
4.4.4 法律搜索引擎
www.qseek.net: Qseek是国内首家专
业的法律搜索引擎。
www.findalawyer.cn :律师搜索网,数据
库包括160多个国家的100多万律师和律所
的详细信息。
28
4.4.5 软件搜索引擎
根据《中国互联网络发展状况统计报告》统计,55.1%
的搜索引擎用户经常搜索网上软件资源。这一比例超过
了MP3(47.9%)和图片(30.2%),成为第一大专业
搜索门类。
www.soft8.net:搜索软件吧,中国首家专
业软件搜索引擎。
www.digdig.com.cn:海量软件搜索
www.chaoji.com:超级软件搜索
29
4.5 特色搜索引擎
4.5.1 中文视频搜索:
• www.cblinkx.tv:专业中文视频搜索引擎
• www.tvix.cn:影立驰视频搜索
• www.tvmao.com:电视猫,中国最全的电视
节目预告网站,最准确的电视节目搜索引擎。
30
4.5.2游戏搜索引擎
• www.souyo.cn:搜游,是首个专门致力于游
戏领域的中文搜索引擎。
• http://search.17173.com/: 17173游戏
搜索引擎,网络游戏第一门户网站的搜索引擎。
• www.yousou.com:网络游戏搜索,只提供
网络游戏软件下载、游戏攻略秘籍、游戏图像
音乐搜索功能。
6
31
4.5.3 购物搜索引擎
• www.danawa.com.cn:大拿网
• www.8848.net: 8848购物搜索引擎,我国
第一个专用中文购物搜索引擎。
• www.bibiba.com:比比吧
• www.pkbao.com :PK宝
32
4.5.4 web 2.0搜索引擎
博客搜索:
• 中文博客搜索引擎---www.souyo.com
• 奇虎博客搜索:blog.qihoo.com
• Google博客搜索:blogsearch.google.com
33
生活信息搜索:
• www.120ask.com:有问必答,全国最大的
健康生活在线问答平台。
• http://search.soufun.com/:搜房购屋搜索
引擎
• www.world163.com:全球旅游搜索引擎
• www.edushi.com: E都市,全球首个三维
仿真城市。
……__

第4章 网络信息资源检索相关推荐

  1. 主题目录检索是什么举例子_网络信息资源检索与利用第二次作业

    < 网络信息资源检索与利用 >课程实验第 2 次实验报告 实验内容及基本要求: 实验项目名称: 网络搜索引擎的应用 实验类型: 验证 每组人数: 1 实验内容及要求: 1. 请分别针对网络 ...

  2. 972信息检索 | 第九章 网络信息检索与利用中的有关问题

    文章目录 第九章 网络信息检索与利用中的有关问题 网络信息的选择与评价 网络信息选择与评价的主体 网络信息选择与评价的客体 网络信息选择和评价的标准 已制定的标准 网络信息资源的评价标准 网络性能的评 ...

  3. 论文原稿:网络信息资源评价现状及构建研究

    注:本文发表于<图书情报工作>2006年第12期,若要引用,请使用原文. 请点击此处下载此文的word版: http://dl2.csdn.net/down4/20070730/30074 ...

  4. Wireshark数据抓包分析(网络协议篇)第1章网络协议抓包概述

    Wireshark数据抓包分析(网络协议篇)第1章网络协议抓包概述 网络协议是用于不同计算机之间进行网络通信的.网络协议是网络上所有设备(如网络服务器.计算机.交换机.路由器等)之间通信规则的集合,它 ...

  5. 通信网络基础期末复习-第三章-网络的时延分析

    文章目录 第3章 网络的时延分析 3.1 Little定理 3.2 M/M/m型排队系统 3.2.1 M/M/1排队系统 M/M/1排队系统的例题 3.2.2 M/M/m排队系统 3.3 M/G/1型 ...

  6. 计算机网络的体系结构与协议基本概念,计算机网络技术基础-第3章网络体系结构与协议.ppt...

    <计算机网络技术基础-第3章网络体系结构与协议.ppt>由会员分享,可在线阅读,更多相关<计算机网络技术基础-第3章网络体系结构与协议.ppt(19页珍藏版)>请在装配图网上搜 ...

  7. 计算机网络在线测试第二章,进行测验:-第2章-网络体系结构与网络协议测试.doc...

    进行测验:-第2章-网络体系结构与网络协议测试.doc 142计算机网络 142-301214-J01062-1 作业 进行测验 第2章 网络体系结构与网络协议测试进行测验 第2章 网络体系结构与网络 ...

  8. CSAPP:第十一章 网络编程

    CSAPP:第十一章 网络编程 11.1 客户端服务器模型11.2 全球IP因特网11.3 套接字接口 11.1 客户端服务器模型   每个网络应用都是基于客户端-服务器模型.采用这个模型,一个应用是 ...

  9. 信安教程第二版-第12章网络安全审计技术原理与应用

    第12章 网络安全审计技术原理与应用 12.1 网络安全审计概述 227 12.1.1 网络安全审计概念 227 12.1.2 网络安全审计相关标准 227 12.1.3 网络安全审计相关法规政策 2 ...

  10. 信安教程第二版-第11章网络物理隔离技术原理与应用

    第11章 网络物理隔离技术原理与应用 11.1 网络物理隔离概述 216 11.1.1 网络物理隔离概念 216 11.1.2 网络物理隔离安全风险 216 11.2 网络物理隔离系统与类型 217 ...

最新文章

  1. 不该被忽视的CoreJava细节(四)
  2. How program works
  3. c语言 python-C语言、Java语言和python语言的区别在哪里
  4. 有关接口 笔记 懒人版
  5. VS2005中,C#中跨线程访问控件问题解决方案
  6. 小分子蛋白Western blot 检测
  7. 智慧交通day04-特定目标车辆追踪02:Siamese网络+单样本学习
  8. Java垃圾回收机制概述
  9. Linux 命令 之 【stat】 查看文件状态。 (包括修改时间)
  10. 2014年辽宁省普通高等学校本科大学生计算机设计竞赛,2015年辽宁省普通高等学校本科大学生计算机设计竞赛结果进行公示的通知...
  11. 为什么用共有属性来封装私有变量
  12. 基于Ymodem协议的IAP上位机(C#)
  13. 华泰证券人工智能系列(1):人工智能选股框架及经典算法简介
  14. python全栈工程师培训_2018.03《Python3全栈工程师》_技术能力内训
  15. linux 内核网络中 RPS/RFS 原理Ⅰ
  16. 路由器的几种工作模式
  17. c++ 统计指定字母开头单词的数量
  18. 前端学起来特别吃力,新人入前端怎么学?
  19. [原创]记某app内购破解 – 安卓逆向菜鸟的初体验
  20. 阶梯博弈(Staircase Nim)

热门文章

  1. 平板电脑触摸屏行业研究及十四五规划分析报告
  2. 函数的傅立叶展开掐死我吧_如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧(二)...
  3. 树形选择排序(第十章 P279)
  4. 百度 LBS 开放平台,开发人员众測计划正式启动
  5. python中r 4.2f%r,006 Python中的 字符串String
  6. 进阶篇:3.4)机械加工件设计
  7. 事件的三个阶段:捕获阶段 目标阶段 冒泡阶段及防止冒泡和捕获
  8. Python之marshmallow
  9. 腾讯入局“低代码”赛道:无需敲码,快速生成一个完整系统!
  10. 七日杀 服务器不显示,七日杀进服务器不显示画面 | 手游网游页游攻略大全