搜索引擎经过几年的发展和摸索,越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展。搜索引擎的最新技术发展包括以下几个方面:

  一、提高搜索引擎对用户检索提问的理解

  为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言,为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“how can kill virus of computer?”。搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“virus”这个词来检索,结果中必然会包括各类病毒的介绍、病毒是怎样产生的等等许多无效信息,而用“how can kill virus of computer?”,搜索引擎会将怎样杀病毒的信息提供给用户,提高了检索效率。

 二、对检索结果进行处理\


     1、基于链接评价的搜索引擎

  基于链接评价的搜索引擎的优秀代表是Google,它独创的“链接评价体系”是基于这样一种认识,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与《科技引文索引》的思路非常相似,但是由于互联网是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。

  2、基于访问大众性的搜索引擎

  基于访问大众性的搜索引擎的代表是direct hit,它的基本理念是多数人选择访问的网站就是最重要的网站。根据以前成千上万的网络用户在检索结果中实际所挑选并访问的网站和他们在这些网站上花费的时间来统计确定有关网站的重要性排名,并以此来确定哪些网站最符合用户的检索要求。因此具有典型的趋众性特点。这种评价体制与基于链接评价的搜索引擎有着同样的缺点。

  3、去掉检索结果中附加的多余信息

  有调查指出,过多的附加信息加重了用户的信息负担,为了去掉这些过多的附加信息,可以采用用户定制、内容过滤等检索技术。

  三、确定搜索引擎信息搜集范围,提高搜索引擎的针对性

    1、垂直主题搜索引擎
  

网上的信息浩如烟海,网络资源以十倍速的增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高。作者认为,垂直主题有着极大的发展空间。

  2、非www信息的搜索

  提供FTP等类信息的检索

  3、多媒体搜索引擎

  多媒体检索主要包括声音、图像、视频的检索。关于图片搜索引擎的原理,《浅谈图片搜索引擎的实现》http://blog.minidx.com/2007/12/19/265.html 中提出了具有跨时代意义设计思路。

   四、将搜索引擎的技术开发重点放在对检索结果的处理上,提供更优化的检索结果

      1、纯净搜索引擎

  这类搜索引擎没有自己的信息采集系统,利用别人现有的索引数据库,主要关注检索的理念、技术和机制等。

  2、元搜索引擎

  现在出现了许多的搜索引擎,其收集信息的范围、搜索机制、算法等都不同,用户不得不去学习多个搜索引擎的用法。每个搜索引擎平均只能涉及到整个www资源的30-50%(search engine watch数据),这样导致同一个搜索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。

  元搜索引擎(metasearch enging)是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。

  3、集成搜索引擎

  集成搜索引擎( All-in-One Search Page),亦称为“多引擎同步检索系统 ”(如百度http://www.baidu.com)是在一个WWW页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便。

  集成搜索引擎无自建数据库,不需研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。

  4、垂直搜索引擎

  垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

   五、搜索引擎的分类

  网页 音乐(翻唱 MP3)影视(电影 电视) 视频 播客 软件 BT下载 硬件 图片 壁纸 相册 小说 文学 文档(论文 述职报告 思想汇报 演讲稿 入党申请书 作文 个人简历 毕业论文 法律论文 经济论文 教育论文 会计论文 计算机论文 毕业论文集 情书 调查报告 求职信 商业计划书 实习报告 就职演说 自荐信 企划方案 企业管理 年终总结) 新闻(资讯) 百科(知识 经验) 教育 人物 学校 专业 论坛 社区 博客 词典 翻译 地图 动漫 Flash 游戏 娱乐 笑话 汽车 家电 手机 广告 购物 商业 黄页 房产 招聘 财经 股票 基金 法律 国学 图书 政府 目录 学术 代码 公交 实用查询等几十个分类。

  六、搜索引擎的最后一步

  10年前我们要查阅资料,请教问题,更多想到的是请教专家,图书管查阅等传统方式。常常为了一个简单的问题而到处寻师,在图书馆翻着类似我的电脑桌抽屉里的检索卡片,苦苦寻找。曾几何时,互联网的普及与兴起,搜索引擎的出现,逐渐改变着我们的生活习惯和思维方式。很多问题“baidu一下,你就知道。” 就像这里用的“曾几何时”这一词,中文不好的我只有模糊的理解,还以为有“曾经”的意思,想用为第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“补官扬州,公得谢归。曾几何时,讣者来门。” 才知是才过了不久的意思。

  搜索引擎(search engine)是一个系统,能从大量信息中找到所需的信息,提供给用户。互联网出现到现今,信息量可以说成密指数的增长,大量信息就像Google的原本含义一样“1的后面跟着100个0”,这个数比宇宙所有的基本粒子的数量总和还要大。在这浩如烟海的信息中怎么才能找到自己需要的信息呢?搜索引擎就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。

  事物的发展往往遵循着合久必分,分久必合的规律,每一次的合与分都是代表着更高级更先进。同样搜索引擎从最初的Archie可以用文件名查找整个互联网中FTP文件的系统,发展到Yahoo早期一种手工录入的分行业的目录检索。随着搜索技术的发展,元标记搜索、全文搜索重新又把整个互连网的信息整合起来提供给用户,目前的Baidu、Google提供的就是一种整个互联网的全文搜索,这种整合信息的搜索也称为水平搜索。这种水平全文搜索固然可以把网络中的所有相关信息提供给用,但这种“所有”不代表着是用户所需的“所有”,往往夹杂着许多垃圾信息。问题出现就伴随着去解决,如果平常使用搜索引擎比较全面,你会发现Baidu、Goolge都有了“更多”的选项,其中出现了大学搜索、新闻搜索、图书搜索、图片搜索等等这些专业化,行业化的搜索,也称为垂直搜索。当前垂直搜索正在逐渐走向丰富化、专业化、行业化,将越来越满足人们的搜索需求。比如很多人在搜索问题时会到百度知道里搜索,因为那里更有针对性;搜索天气会到天气搜索中等等。

  那么搜索引擎的下一步发展是什么呢?让我们回想一下搜索引擎的定义:一个系统,能从大量信息中找到所需的信息,提供给用户。根据技术的不断发展和事物规律畅想一下,垂直搜索发展到一定程度会出现信息的单一专业化太强,整体信息综合化不好,而人们需要的不但要有专业信息,同样也要有整体联想信息。随着人工智能、神经网络、网格计算等搜索技术的发展,我们又将有一个能整合互联网信息,智能的提供用户确实所“需”的信息,而不简单只是所“要”的信息,因为很多时候搜索时,自己都不知道要什么。

  再回的现在的搜索引擎,它就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。这个引擎提供给用户的最后一步是什么?是一条清晰的检索路径。好的,注意这是一条检索路径,在这条路径的上的检索和信息提取是什么呢,是我们的阅读和大脑的判断。也就是做搜索引擎的最后一步是我们的大脑。得到的这条路径清晰但也并不简短,需要我们进行快速的浏览,呵呵,绕来绕去,得出一个结论,快速阅读也是搜索引擎中的一部分。

  随着搜索市场竞争的白热化,搜索引擎不仅开始深挖自己的战壕,还开始打起了口水战,而山寨搜索引擎在高举着“整合”的大旗,开始大摇大摆地进入这个本来只有巨头垄断的市场。国人充分发挥着其无比的想象力,准备让国内的互联网“步入搜索新时代”。

  下面就让我们看看什么是山寨搜索引擎

  “百google度”- baigoogledu.com

  最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。、

  “百谷虎”- baigoohoo.com

  由于某家新闻媒体的报道,最近声名大振,高举着“山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。

  “山寨文化”在每个人的心目中可能都有着不同的感觉,但随着这股风越刮越烈,可见草根对“山寨”的内涵还是有相当的认同,百度和谷歌的嘴仗打的不亦热乎,都指责对方结果不公正,山寨搜索却硬要把这两个冤家放在一起。也许很多人对“山寨搜索”嗤之以鼻,但是对于普通网民来说,是谁的搜索并不重要,是我们需要的结果才是最重要的么。如果是你,你会选择谁呢?

  搜索引擎优化(Search Engine Optimization,简称SEO) 搜索引擎优化即Search Engine Optimization,用英文描述是to use some technics to make your website in the top places in Search Engine when somebody is using Search Engine to find something,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。与之相关的搜索知识还有Search Engine Marketing(搜索引擎营销),Search Engine Positioning(搜索引擎定位)、Search Engine Ranking(搜索引擎排名)等。

搜索引擎的技术发展趋势相关推荐

  1. 2013年的技术发展趋势

    原文链接:http://blogs.sap.com/innovation/industries/2013-technology-trends-025415<?xml:namespace pref ...

  2. 科技论文----论搜索引擎现状及发展趋势

    搜索引擎现状及发展趋势 [摘要] 随着最近10年中国互联网的快速发展菜互联网已经彻底改变了人们的生活方式,而在互联网的发展过程中.搜索引擎发挥了巨大的推动作用.本文对搜索引擎的发展历史采用的技术,发展 ...

  3. 万维网Web自动搜索引擎(技术报告)

    万维网Web自动搜索引擎(技术报告) 邓雄(Johnny Deng) 2006.12 网络时代的信息量每8个月翻一番,如今的网页以100亿来计算:网络搜索已成为仅次于电子邮件的第二大网络应用.2005 ...

  4. 手机与Camera CCM技术发展趋势

    手机与Camera CCM技术发展趋势 CCM是CMOS Camera Module 互补金属氧化物半导体摄像模组的英文缩写,用于各种新一代便携式摄像设备的核心器件,与传统摄像系统相比具有小型化,低功 ...

  5. 全球大国人工智能实力大比拼与技术发展趋势

    何为人工智能(AI)技术?世界知识产权组织(WIPO)将AI技术分为三类:AI技术,即高级统计和数学模型,如机器学习.专家系统:AI功能性应用,即可用一种或多种AI技术实现的功能,如语音处理和计算机视 ...

  6. 2019年企业云呈现五大技术发展趋势

    纵观2018年的发展,2019年企业云及现代数据中心将面临机遇与挑战共存的格局.总体来看,五大技术发展趋势,值得重点关注. 1. Kubernetes无处不在,已成为企业云原生力量的重头戏 随着企业应 ...

  7. 【搜索引擎基础知识1】搜索引擎的技术架构

    转自:http://blog.csdn.net/hguisu/article/details/7955985 1. 搜索引擎的分类 搜索引擎按其工作方式主要可分为三种: 分别是全文搜索引擎(Full ...

  8. 防火墙未来的技术发展趋势

    随着新的网络***的出现,防火墙技术也有一些新的发展趋势.这主要可以从包过滤技术.防火墙体系结构和防火墙系统管理三方面来体现.     防火墙包过滤技术发展趋势     (1)一些防火墙厂商把在AAA ...

  9. 陈震学的什么计算机专业,一起来看看陈震学长为我们分享的前沿技术发展趋势及自己的思考吧!...

    原标题:一起来看看陈震学长为我们分享的前沿技术发展趋势及自己的思考吧! 这是 北航士谔书院的第 881篇推送 12月23日,士谔书院邀请了书院特聘导师.速感科技创始人,同时也是北航校友的陈震为同学们带 ...

  10. 高速信号传输约翰逊 pdf_高速数字电路仿真设计与测试技术发展趋势综述 (一)...

    近十多年来,数字集成电路和各种接口总线标准的发展令人眼花缭乱,目不暇接.各个总线标准通常由不同团队制订,其纷繁芜杂的测试和测量技术给从业人员带来许多困扰.本文将就当下的一些主要接口总线标准的仿真设计与 ...

最新文章

  1. Django缓存和信号
  2. 编译器是怎样工作的?用lex和yacc 写一个计算器(2)
  3. 完成登录与注册页面的前端
  4. valgrind 报告 ecpg内存泄露 (三)
  5. vsftpd匿名用户上传和下载的配置
  6. boost::python::def相关的测试程序
  7. 如何用git上传文件
  8. 【java】 从hotspot底层对象结构理解锁膨胀升级过程
  9. python3.x和python2.x唯一区别_Python3.x和Python2.x的区别 (转)
  10. iptables的详细介绍及配置方法
  11. Linux安装winetim简单教程,[转载]wine安装最新版TIM
  12. RTSP RTMP HLS HTTP全功能流媒体播放器SkeyeExPlayer开发计划
  13. leetcode刷面试题(面试题08合集)
  14. 经典上海弄堂线路攻略
  15. mybatis表不存在的解决办法
  16. opencv 中x,y,height, width,rows,cols 的关系
  17. Sentiment Word Aware Multimodal Refinement for MultimodalSentiment Analysis with ASR Errors
  18. ETW绕过PoC测试1--关闭你的ProcMon.exe
  19. 新粉色苹果CMS10视频站源码模板 仿APP内附教程
  20. Springboot——mybatis配置

热门文章

  1. Android 二维码的扫码功能实现(一)
  2. win7右键反应特别慢的问题
  3. 分享五个绝对称得上妖艳古怪精灵的前端代码效果
  4. 计算机应用基础IE浏览器设置,计算机应用基础IE浏览器设置学习笔记.docx
  5. 刷主板bios改变机器码_怎么为主板刷新bios
  6. 什么是传统企业电商洪水围城下的诺亚方舟
  7. 计算机编程语言排行榜—TIOBE世界编程语言排行榜(2020年4月份最新版)
  8. nu.xom:Serializer
  9. window终端光标消失
  10. 针对VC++ 上各种方法获取时间差,CSpanTime等