导读:只要用户通过 360 浏览器访问过一个网页,无论是私人账号信息,还是公司内网机密数据,都会被 360 浏览器记录下来,并被 360 搜索爬虫抓取、上传到 360 服务器。

  一个是搜索引擎市场具有垄断地位的巨头,一个是颇具争议的闯入者,这场围绕搜索引擎的“3B 大战”进入了第二个回合:钓鱼。

  几天前,百度工程师放出“鬼节捉鬼”的钓鱼策略,将争论引向一直以隐私安全为底牌的 360。问题出在一个叫做 Robots 的协议上。360被指不遵守协议,直接用浏览器抓取用户浏览信息,可能致使用户信息泄露。“3B 大战”的对手百度等互联网公司发出了要求员工卸载 360 浏览器的号召,搜狗 CEO 王小川也表示应遵守 Robot 协议,担心 360 在安全上做裁判又做球员。

  CNNIC 最新的统计数据显示,360搜索覆盖中国网民比例已由上周的 13.04% 降为 11.61%,覆盖人数由 3420 万降为 3052 万,近一周时间,损失用户达 368 万。

  3B 大战第二回合,落在了浏览器端直接搜集网页信息的争议上。《每日经济新闻》在调查中发现,Robots 协议被浏览器开发人员视为“Google 自己制定的协议规范”,“连行业规范都算不上”,搜索引擎对用户隐私权的定义,目前还是空白。

  百度非原创式捉“鬼”

  8月 31 日,一则由百度工程师发布的微博引发了业内的广泛讨论。

  这位名叫赵明华的百度互联网数据研发部经理称,百度的工程师制作的几个特殊页面没有任何外链,由于搜索引擎爬虫只能通过链接爬行网页,因此这个网页是完全封闭的 “孤岛”,不可能被搜索引擎抓取到。但令人意外的是,百度工程师试着在 360 搜索中输入以上关键词,结果这个网页赫然出现在搜索结果第一行,并可以直接点击访问浏览网页内容。但再换百度、谷歌、搜狗、搜搜等其他浏览器搜索相同内容,却无法返回相应网页。

  为什么一个完全封闭的网页竟然能被 360 搜索引擎抓取到?赵明华的解释是,他曾用 360 浏览器打开过这个网页。在 360 浏览器的隐私策略中,注明了 360 安全浏览器会在用户的计算机上记录有关浏览历史记录的实用信息。

  百度认为,百度钓鱼流程揭示了 360 搜索存在安全隐患:只要用户通过 360 浏览器访问过一个网页,无论是私人账号信息,还是公司内网机密数据,都会被 360 浏览器记录下来,并被 360 搜索爬虫抓取、上传到 360 服务器。

  不过,360却有着自己的说法。360在官方微博上指出,百度以所谓的“孤岛”数据污蔑 360 泄露用户隐私。其实百度的做法很简单,只要通过外部链接引导 360 爬虫抓取页面,同时屏蔽其他搜索引擎,然后切断外链,就可以造成只有 360 搜索收录所谓“孤岛”的假象。

  9月 2 号,360董事长周鸿祎对此回应,“这是百度在滥用 Robots 协议,阻碍 360 进入搜索市场。”

  百度“鬼节抓鬼”的行为,在互联网界并非首例。2011年初,谷歌由于怀疑必应借鉴其搜索结果,也采取过这种做法。

  2010年 10 月份,谷歌注意到 Bing 的搜索结果越来越多地和谷歌重合,头条结果相同的趋势也越来越高,由此必应抄袭了他们的搜索结果。

  为了验证猜想,谷歌在去年 12 月进行了一场钓鱼行动。他们选择了 100 个异常钓饵进行手动搜索排名,将这些关键词的搜索结果指向毫无关联的页面。当时约 20 位谷歌工程师在电脑上使用 IE 浏览器来搜索这些关键词,然后通过 IE 在谷歌上搜索这些钓饵,诱使必应上钩。两周后,谷歌工程师再通过必应搜索当时的钓饵,预先埋下的结果就开始陆续出现在必应结果中,由此发现必应通过 IE 收集用户上网的隐私数据,直接记录上传了用户访问网址并随后放入搜索结果中。

  搜索引擎与商业网站博弈

  赵明华称,360绕过了 Robots 协议,利用浏览器记录并上传用户数据和上网行为,并形成自己的网址库,再用伪装和隐藏过的爬虫来抓取快照,生成搜索结果。

  那么,从浏览器端直接搜集网页信息是否正当?

  实际上,Robots 协议并非强制性法规,而是搜索引擎诞生后,互联网业界经过长期博弈,最终在搜索引擎与商业站点、公众知情权和用户隐私权之间达成的一种妥协。

  据《每日经济新闻》了解,早期的互联网主要是“用户-网站”模式。用户通过网站获取信息,网站通过吸引用户点击来实现广告收入。不过,当谷歌把搜索引擎变成一种成功的商业模式之后,很多网站原有的商业模式遭到了严重破坏。

  为了维护自身的利益,一些欧美大型网站联合起来与谷歌谈判,要求谷歌“有所为有所不为”,于是就有了 Robots 协议。该协议的核心思想就是要求 Robots 程序不要去检索那些站长不希望被直接搜索到的内容,并将约束 Robots 程序的具体方法规范成格式代码,就成了 Robots 协议。一般来说,网站是通过 Robots.txt 文件来实现 Robots 协议。

  国内使用 Robots 协议最典型的案例就是淘宝网拒绝百度搜索。此外还有大量的用户注册、邮件等信息,都利用 Robots 协议来防止这些内容在互联网上被搜索到。

  不过,绝大多数中小网站需要依靠搜索引擎来增加流量,因此通常并不排斥搜索引擎,也很少使用 Robots 协议。去年京东商城屏蔽一淘网抓取数据时,曾指责一淘网破坏了 Robots 协议。

  技术工程师 Joey 在接受《每日经济新闻》采访时表示,谷歌、百度是通过都是自己的服务器不停地在网上抓内容进行索引,而 360 的模式是让每个使用 360 浏览器的电脑成为 360 的蜘蛛爬虫,把浏览的内容上传到 360 服务器上做索引。

  Robots 协议约束力几何?

  此前,在多次“互联网大战”中,360的隐私问题均被竞争对手列为质疑的焦点。

  两年前,奇虎 360 公司两名网络工程师利用 360 公司系统收集的用户信息,通过 360 服务器云计算后台破解了市政一卡通系统的后台密码,并远程为自己和 3 位同事的一卡通恶意充值 2600 元。2011年 1 月,360收集隐私数据被谷歌爬虫抓取,结果包括网民在百度搜索的关键字、淘宝购物记录、金蝶等企业内部财务网络数据等链接数据“裸奔”于互联网上。

  对于此次业界的质疑,360认为纯系百度 “污蔑”。360方面表示,其网站后台、订单等敏感数据在每个搜索引擎中都是存在的。百度通过人为设置钓鱼陷阱网页来污蔑 360 上传用户数据,目的是为了阻止 360 进入搜索领域,维护其市场地位。

  不过,很多的中立行业观察人士认为,该事件的重心并不在口水仗,而是作为“行业自律”的 Robots 协议是否需要更强有力的法律约束?

  资深互联网观察家洪波指出,搜索引擎无视 Robots 协议,直接抓取未经授权的信息数据,这样的行为如果不能从法律和监管上及时制止,将引发行业大乱。”

  鉴于国内像 360 和搜狗这样既做浏览器又做搜索的公司比较少,可以对比同样既做搜索引擎又做浏览器的巨头:谷歌。

  一位浏览器技术人员对《每日经济新闻》表示,谷歌的 Chrome 浏览器也会根据用户访问的历史记录在首页给出“最常访问的网站”,但不会优先出现在搜索结果中。

  实际上,在“3B 大战”进入第二轮时,国内互联网大佬的态度已经发生了转变。

  搜狗 CEO 王小川表示,欢迎 360 做搜索,行业更加开放,给网民更多选择。而在此之前,王小川对“3B 大战”的态度是“进攻百度防范 360”。

  目前尴尬的是,Robots 协议并没有上升到一定的高度。此前有消息称,政府相关部门已找百度、360、搜狗各方了解事态进展,希望能够从中调停,并防范整个事件升级。从目前情况看,相关部门正在对 360 违反 Robots 协议的事件进行研究。

  “所谓 Robots 协议,其实就是谷歌自己制定的一个协议规范,并不是各大搜索厂商的共识或统一的协议,也从来没有任何一家国内搜索引擎服务商公开承诺遵守 Robots 协议或签署类似的协议或声明。”所以说,Robots 协议连个行业规范都算不上,更别说什么国际标准了,即便在美国,也只有 Google 把它当回事。“上述不愿意透露姓名的浏览器技术人员表示。

  “云”与“端”的较量

  主打云概念的搜索巨头百度,与以客户端为武器的 360 交战,颇具深意。

  事实上,百度之所以取得目前的搜索市场地位,一个很重要的原因就是其一直在布局中文内容平台,包括知道、百科、贴吧等。百度的“护城河”在“云”,本质上是一家媒体,其战略思路不是仅提供单纯的搜索,而是从具备分类、整理的搜索引擎转化为提供、组织内容的平台。

  “在单纯的搜索技术提高前景有限的前提下,提供大量的内容使百度具有了巨大的用户黏性和流量来源。即使用谷歌搜索,首页结果里也有大量的百度知道,百度百科与百度贴吧的内容。”曹悦平表示。

  事实上,早在 2009 年李彦宏就曾说过,百度不是搜索引擎,而是第一中文媒体平台。而在刚刚结束的百度一年一度的世界大会上,李彦宏首次将云存储、大数据智能、云计算三大核心云能力开放出来。

  在曹悦平看来,在云端发力的好处在于,直接获取的大量内容和用户数据对后来者筑起了“护城河”。但百度多年来在客户端领域一直缺乏具有影响力的产品,这恰好是 360 此次进攻百度的机会。

  相比之下,360的竞争优势完全在 “端”——靠浏览器和安全卫士来占领市场。

  “360的端模式,相对于百度的云模式,在产业链上处于下游。”曹悦平指出,360的风险在于,一旦再出来一个黏性比它更大的客户端,比如 Windows 8 如果内置了安全软件,那么 360 就危险了。

  在新进入的搜索领域,360的份额正在迅速下滑。CNNIC 最新的统计数据显示,8月 27 日~9月 2 日一周,360搜索覆盖中国网民比例已由上周 13.04% 降为 11.61%,覆盖人数由 3420 万降为 3052 万,用户减少 368 万。无论用户覆盖率、搜索次数和 PV 占比,360搜索都远低于搜狗、搜搜等。同时数据显示,360搜索用户搜索次数和 PV 值比例仅为2.22% 和1.47%,明显低于其他搜索引擎,表明使用 360 搜索的用户的使用频率和深度都很低。

自作孽?统计显示360搜索7天损失368万用户相关推荐

  1. 愚人节,360搜索和搜狗提前发动愚人攻略

    破锅网文:愚人节即将来临,呆板了一年的人们可以激发一下自己的娱乐细胞了,各种整人整蛊事件频发,各种极品.奇葩也都将降临人间.可能很多人对于IT人的印象是呆板的,比较死板的那种,其实也不完全是这样,这次 ...

  2. 360搜索是废了还是彻底商业化了?

    最近无聊时偶然进入了360搜索的站长论坛,发现论坛里面的内容全是关于网站收录问题,甚至做了几年的网站只收录了一个首页,有的甚至连首页都没收录,这是360准备退出搜索市场还是要彻底商业化?下面我们来看下 ...

  3. 【国内SEO大牛】网站统计显示被违禁词搜索进来原因

    哈喽,我是汉文博客创始人,我叫林汉文.今天我给大家分析一下网站统计显示被违禁词搜索进来原因. 今天我们的主题:网站统计显示被违禁词搜索进来原因 最近,很多网站中站长向林汉文简介反应,他们的网站统计工具 ...

  4. 如何让网站在360搜索结果中显示“官网”标志?

    如何让网站在360搜索结果中显示"官网"标志?很多同学都是按照标记的提示一步步的操作,接着就跳转到要第三方的认证平台了,其实我也是过来人,这些第三方都是开价一年3600的最低收费, ...

  5. 360搜索蝴蝶效应:与搜狗必有一战 百度先布防

    "红衣主教"又来了.如同当初进军安全.手机行业一样,360在搜索市场也掀起巨大恐慌.多家网站数据显示,360搜索显露出强劲流量增势,金山网络CEO傅盛甚至放言360搜索迅速拿下近1 ...

  6. android 360状态栏显示,如何从Android应用程序显示360全景(How to display a 360 panorama from android application)...

    如何从Android应用程序显示360全景(How to display a 360 panorama from android application) 我想从我的Android应用程序中显示一个全 ...

  7. 抓包分析360浏览器和360搜索配对使用的安全性-WEB服务端分析

    接上文 抓包分析360浏览器和360搜索配对使用的安全性-环境部署 根据:"360搜索会通过360安全卫士和360浏览器将用户平时浏览网页的信息反馈给360的搜索爬虫服务器,然后再由爬虫对相 ...

  8. 360搜索、UC浏览器等被3·15点名应用已下架;马斯克宣布通过NFT卖歌;美团App再发力社交,内测 “群聊”功能 |极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 丁恩华 出品 | CSDN(ID:CSDNnews ...

  9. 360搜索结果页html代码,360搜索抓取完全封闭网页揭秘

    第一步,百度工程师制作一个保存在服务器个人文件夹下的简单网页,没有任何外链,由于搜索引擎爬虫只能通过链接爬行网页,因此这个网页是完全封闭的,不可能被搜索引擎抓取到. 第二步,百度工程师用360浏览器打 ...

最新文章

  1. PKU ACM 1258 Agri-Net http://acm.pku.edu.cn/JudgeOnline/problem?id=1258
  2. jquery的each()详细介绍
  3. Python 技术篇-3行代码实现语音朗读,pywin32库实现语音朗读
  4. python教程答案十九章_Python 编程从入门到实践 第19章 注销一节问题
  5. 华为P30 Pro终极渲染图曝光:后置徕卡四摄颜值出众
  6. java 认证和授权_SpringSecurity一:认证和授权
  7. 【报告分享】2020年中过短视频+教育发展展望.pdf(附教育行业交流社群及报告下载链接)...
  8. 【论文复现】使用fastText进行文本分类
  9. 总结CMS常见面试题
  10. Bert模型冻结指定参数
  11. 服务器VM虚拟机更换序列号,修改vmware虚拟机硬盘序列号id 献给初学者:谈谈如何学习Linux操作系统(3)...
  12. 安卓手机android文件,安卓Android手机系统内文件夹目录解释
  13. 黑苹果以太网网卡已安装 无法上网
  14. 传智播客到底在坚持什么?
  15. linux netperf,Netperf性能测试工具
  16. C++实践之华氏温度转摄氏温度
  17. 基于python的博客设计_基于Pyt hon的博客设计
  18. 配置OpenLDAP使用TLS通信
  19. Jmeter的元件使用介绍:前置处理器详解
  20. 腹板拼接宽度_钢结构工程部件拼接一般规定

热门文章

  1. AJAX使用淘宝API查询手机归属地和运营商信息
  2. 快速找到win10的截图工具
  3. 联想Miix5安装Linux后WIFI设备无法识别问题
  4. 安装Docker、Harbor、Jenkins、Gitlab
  5. 入门指南:Google Go入门
  6. 使用Office Tool Plus下载Office和Visio
  7. 杭电2036——改革春风吹满地
  8. 生鲜配送系统有哪些功能?搭建生鲜配送系统有什么优势?
  9. 文法G[S]: S→AB S→bC A→ε A→b B→ε B→aD C→AD C→b D→aS D→c 求FIRST集,FOLLOW集。
  10. 网络安全基础知识笔记-1