当你登录某一个网站,在互联网上搜索各个网站的某一类内容,比如,输入“WTO”,希望得到最新、最全面的信息,你能等待多长时间?

几年前,人们希望十几秒,最多30秒钟就能得到结果,而现在的期望值是1~2秒,也就是说,伴随点击鼠标的“咔哒”一声,显示屏的页面已经变了,排在最前面的十几、二十条信息的标题已经出现在你的面前。

哪个网站的搜索速度明显地变快了,那它一定是使用了先进的搜索引擎技术。搜索引擎是仅次于门户的互联网第二大核心技术,要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。伴随互联网的普及和网上信息的爆炸式增长,它越来越引起人们的重视。

成功的百度
要谈国内搜索引擎技术应用现状则不能不谈百度。美国的网络门户多是以搜索引擎起家的,国内搜索引擎的发展却一直不尽如人意,这种情况直到2000年下半年才结束:年轻的百度公司迅速地拿下了硅谷动力、Chinaren、搜狐、新浪、21CN、广州视窗、263、TOM等门户网站的全文搜索引擎服务,成为中文检索市场中的佼佼者。

百度的成功对中文搜索的贡献很大,不但提供给门户网站以质优价平的搜索引擎,使中国网民有更好的搜索体验,也因为百度的成功,激励了同行的进取心,使得国内中文搜索引擎的发展进入你争我赶的良性发展时代。最近一年来,中文搜索引擎的进步成了互联网行业的一个亮点。

老将出奇兵
在传统的网站分类目录搜索方面,新浪、网易、搜狐各出奇兵。新浪依托自身良好的技术实力和新闻优势,推出了综合搜索,省却了用户分门别类搜索的麻烦,只要输入一次想搜索的关键词,就能得到网站、网页、新闻、商品等常用信息,层次分明,一目了然,在保持快速、准确的基础上,给用户提供了更多的选择。

网易则利用它良好的网虫资源,网聚人的力量,做起了开放式目录。互联网上各行各业的高手纷纷加盟,使得网易的网站分类目录一天比一天好。网易还进一步挖掘搜索引擎的潜力,推出了把搜索结果通过手机短信发送的功能。而搜狐,则主要把大量的人力物力花在网站分类目录的整理上,成为分类合理的网站分类目录。

易易寻公司主要致力于发展多媒体搜索引擎,它推出了被业内人士推崇的中文图像搜索引擎,使互联网上的多媒体信息开始能被网友方便地利用。

由北大计算机系网络研究室开发的天网搜索引擎,收录了大量教育网内资源,使教育网内的资源也能被广泛利用起来,特别是它的FTP搜索部分,提供了非常丰富的下载资源。并且,经过今年春季的升级,检索速度有了明显提升。

Openfind(网擎)以“搜寻有价”的新观念,推出“CIA 网路情报员”实时信息付费订阅服务。用户可以付费订阅指定关键字的最新信息,这是开发搜索引擎的价值的另一种尝试。Openfind曾是一个优秀的中文全文搜索引擎,当它的搜索引擎客户被后起之秀一个个抢走时,曾有传言说它准备退出门户式搜索引擎的竞争,但事实证明,它仍在努力升级,如今某些方面已经跟领先的百度差别不大。

应用发展方向
百度搜索引擎这半年来除了一直是最大的中文搜索引擎,在搜索的相关性上也不断升级。它把门户网站用的搜索引擎技术应用于中小网站和企业的需要,开发了百度网事通Web和网事通Real搜索。特别值得一提的是网事通Real,其实是一个实时新闻搜索引擎,可以同时监控和检索几千个网站在一分钟前发布的新闻,也能被当做信息监控工具使用。据说某些企业购买来监控各大论坛里的信息,既能收集竞争情报,又能在出现不利企业的信息时及时处理。

目前国内搜索引擎对潜在价值的开发明显不够,在应用上,下一步的发展方向是:

1.网站内和企业局域网内搜索引擎的普及化
搜索引擎作为基础软件已经在国外得到广泛的认同,不仅大型门户网站如美国在线、雅虎、亚马逊等等每一个著名网站的首页都在显著位置放置了搜索框,就连迪斯尼、麦当劳、美孚石油这些传统企业也都无一例外地在它们的首页上放置了搜索框或搜索功能的链接。美国500强中使用搜索引擎的网站几乎达到100%。国内企业往这个方向发展是自然而然的事。

2.实时新闻检索(包括新闻订阅、监控、定向情报收集等)的广泛应用
Openfind推出“CIA网路情报员”,百度推出“网事通real”,慧聪推出“网神”都证明它们已经觉察到了这个发展方向。这其实也是互联网搜索引擎从提供无序低价值信息往提供高质高价值信息方向的转变。

3.搜索引擎统计数据的应用
搜索引擎拥有庞大的流量和特征明显的信息,CNNIC早已认识到了搜索引擎的价值,所以在最近一期的互联网状况调查中利用了百度搜索引擎的统计结果。而著名的yahoo干脆开始出售它的搜索引擎统计数据,这都是搜索引擎统计信息的价值反映。

4.搜索引擎收费登录服务
国内搜索引擎应用有很长一段时间都是搜索引擎独自在唱戏,只能亏本,而网站和网民只有看戏的份,这不是一个良性循环,不利于搜索引擎行业的发展。而近期,情况开始改观,搜狐、新浪焦点的商业网站收费收录服务、网易和263的搜索关键词定向广告、百度的搜索引擎竞价排名服务,有可能促使搜索引擎、网站、网民三者的需求取得和谐。
在技术上,国内搜索引擎在短期内还不会在以下方面有真正的进步,仅停留在美好愿望:自然语言检索、语音检索、视频搜索、用户个性化搜索引擎、交叉语言搜索引擎、具实用性的模糊检索。

但在以下这些问题,却可能在短期内取得明显的进展:网页数量、网页缓存、动态摘要、重复网页、数据库更新期、动态网页抓取、自动分类、定制搜索服务、BBS搜索、Frame网页、不可索引文件的链接索引、切词、死链接、网页搜索和分类目录的结合、错误关键字的提示、pdf/XML等特殊格式文件索引。

国内搜索引擎技术现状相关推荐

  1. 【转载】从百度、360、搜狗对新站态度看国内搜索引擎技术现状

    为什么80%的码农都做不了架构师?>>>    原文链接:http://blog.lmlphp.com/archives/3  来自LMLPHP后院 我从事互联网行业这么多年,一直没 ...

  2. 国内MySQL技术现状_1024不搬砖,谈谈自己2020剩余两月的学习计划

    前言 时间飞逝即去,这一年对我这一届来说变化还是挺大的,过1024节日的地点变了,有的奔赴岗位.有的升学深造.去年的1024我在考研,把仓库里憋着的唯一一篇文章发出去了为了获得一个1024的勋章-- ...

  3. 浅谈国内SLAM技术发展现状

    过去几年,扫地机的出现使得SLAM名声大噪,这个被业界认为是实现机器人自主移动的关键技术,已逐渐进入人们的视野,而随着无人驾驶.AGV等行业的兴起,又使其找到了另一片广阔天地. SLAM的前世今生 对 ...

  4. 国内SLAM技术发展现状大解析

    导语:被很多学者认为是实现真正全自主移动机器人关键的SLAM技术,已经开始逐步走入人们的视野,过去几年扫地机器人的盛行让它名声大燥,而AGV.无人机等行业的兴起则让其找到了更加广阔的市场.今天,我们就 ...

  5. 从SEO效果看谷歌百度360搜狗有道bing技术现状

    为什么80%的码农都做不了架构师?>>>    从SEO效果看谷歌百度360搜狗有道bing技术现状声音 maybe yes 发表于2015-08-20 16:52 原文链接 : h ...

  6. [转载]搜索引擎技术介绍

    转载声明:http://backend.blog.163.com/blog/static/202294126201252872124208/ 引言 早些时候分享过一份关于搜索引擎技术的PPT,这篇文章 ...

  7. 搜索引擎技术之概要预览

    搜索引擎技术之概要预览 前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索 ...

  8. 虚拟偶像主播的大致现状,数字人技术现状

    欢迎您关注沉睡者IT,点上面关注我 ↑ ↑ 虚拟偶像的生产时间带动了整个虚拟偶像的生产和消费模式.虚拟偶像的生产技术作为一种新兴的媒体创新,在社会上传播时,会被大胆尝试新技术.新概念.社会联系广泛的创 ...

  9. 搜索引擎技术的概要以及相关知识

    1)影响百度排名的几个因素 第一个因素,URL路径存在的时间长短. url的长短对搜索引擎还是有影响的,所以在做优化的时候要注意把url尽量做的短一点,对优化很有好处. 第二个因素,关键词出现的次数. ...

  10. 关于SEO与搜索引擎排名现状分析与SEO去向

    关于SEO与搜索引擎排名现状分析与SEO去向 网站优化不仅仅局限于搜索引擎排名? 有一个时间,一个关键字的排名第一是完全值得追求的胜利 - 一个时间,你可以建立一个关键字列表,制作300字的原创文章, ...

最新文章

  1. 无监督学习之RBM和AutoEncoder
  2. (转)json-lib 的maven dependency
  3. java的标准注解和元注解
  4. Linux命令行常用小结
  5. Qt加载RGB内存数据,并显示彩色图
  6. html风格的滚动条
  7. php pdf转为jpg 插件,php使用Image Magick将PDF文件转换为JPG文件的方法
  8. Ubuntu source list
  9. 自学考试-“软件开发工具”
  10. hdu 5755 Gambler Bo 高斯消元
  11. 在csdn中,如何获取积分
  12. 华为Ensp软件入门
  13. 香港证券监管机构呼吁加密监管以应对欺诈行为
  14. 可转债历史最低最高价格统计表
  15. 游戏服务器架构设计的一些整理
  16. 好的软文推广都使用了哪些方法?
  17. 《小米商城》--查看购物车
  18. YOLO系列 --- YOLOV7算法(四):YOLO V7算法网络结构解析
  19. LNMP一键部署基于PHP和MYSQL的网站
  20. [BJDCTF2020]Easy MD5 1

热门文章

  1. python装逼代码_能够让你装逼的10个Python小技巧
  2. java计算机毕业设计直播购物平台源码+数据库+系统+lw文档
  3. matlab 脉冲频域压缩,大作业-雷达线性调频脉冲压缩的原理及其MATLAB仿真.doc
  4. iOS开发值苹果手机各种尺寸详细表以及iPhoneX、iPhoneXS、iPhoneXR、iPhoneXSMax屏幕适配
  5. leetcode【链表—中等】707.设计链表
  6. 第6期:大学生应该选择哪种主流编程语言
  7. c# 角度和弧度的转换
  8. 方法重载和重写的区别
  9. 浏览器存储cookie
  10. vue结合element 输入框输入纯数字以及限制输入小数