机器搜索引擎 vs 人肉搜索引擎
胡宝介 发表于 2006-9-5 16:29:13

最近关于社会搜索的关注越来越多了。最恐怖的社会搜索,还是人肉搜索。

人肉搜索引擎,我直接把它归入社会性搜索中的问答式搜索(Q&A),其实就是在一个社区里面提出一个问题,由人工参与解答而非搜索引擎通过机器自动算法获得结果的搜索机制。从这个角度理解,新浪爱问、百度知道、雅虎知识堂本质上都是人肉搜索引擎。显然,人肉搜索引擎由于通过人工参与来提炼搜索引擎结果,更有针对性,理论上来讲应该比自然检索结果更能满足搜索者的需求,尤其对于八卦搜索、没有唯一答案的多选结果搜索,人肉搜索的结果更有吸引力。

不过象人肉搜索引擎这种玩法,我个人是非常地不感冒,以百度知道为例,比如我的本本突然自己关机了,急需帮助,点击“我要提问题”,结果反馈“对不起,请先登录”——原来提问是要先注册滴!提了问题还要再等,还要再登录,还不一定有人回答……晕哦,一点效率没有。如果就此判断人肉没有市场就错了,人肉搜索引擎这种东西本来就不是为我这种连社区都没玩过的人设计的,人家是为那些热爱参与、积极交流、没事找事的web2.0人肉们准备的。所以我们看到知道、知识堂这些玩意推出来还是很有点热度。

人肉搜索引擎热度起来了,那机器搜索引擎怎么应对?机器只有更加深入地分析用户行为才能理解用户所需,反馈最符合检索需求的结果。就是说,Google们要对用户在搜索引擎结果的点击行为和点进后的浏览行为继续跟踪,而不是简单地反馈结果或者跟踪到点击就结束。因为一个不符合需求的链接(比如作弊的链接),用户即使点进,可能退出也快。理论上,如果一个链接页面的内容符合检索需求,用户在这个页面应该逗留时间比较长,甚至会在站内溜达一圈,产生更多pageviews以后再出来,甚至会收藏起这个页面也说不定。而这些用户行为,如果搜索引擎统计在案,作为PagerPank和网站内部要素各算法的调整补充,排名结果岂不更加优良?任凭它多么精妙的人肉机制都不在话下。

现在看来,机器搜索引擎应对人肉搜索引擎做得最好的还是百度(不是因为百度人工干预结果比较多,天生就是一人肉搜索:),百度思维不是我上面说的Google式技术思维,什么“深度跟踪分析用户行为云云”。百度思维直接就是人肉思维:自己做一个人肉,再把人肉结果有机整合到机器结果中,就把这个应对的问题完美地解决了。当然,其它搜索引擎也是这么做滴,只是百度知名度太高,突出些罢了。

我还是更喜欢、更关心机器搜索引擎,机器意味着智能和效率,虽然相比人肉搜索少了点人工智慧和苦力,不过搜索引擎都是尊重人工智慧的,否则Google、MSN们也不会把dmoz那样的人工编辑目录作为索引数据源。

机器搜索引擎 vs 人肉搜索引擎(作者:胡宝介)相关推荐

  1. Thomas和Kellysearch这两大工业分类目录的最大差异是网站优化(作者:胡宝介)

    通过互联网做 外贸出口 的朋友应该对美国的Thomas global和英国的Kellysearch比较熟悉了.这两个工业分类目录网站分别属于有着上百年历史的工业印刷出版媒体Thomas和Reed bu ...

  2. c语言程序设计胡成松,C语言程序设计教学课件 作者 胡成松 黄玉兰 李文红 课后习题解答 习题答案 4选择结构程序设计 .docx...

    C语言程序设计教学课件 作者 胡成松 黄玉兰 李文红 课后习题解答 习题答案 4选择结构程序设计 .docx (3页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方 ...

  3. DataPipeline |《Apache Kafka实战》作者胡夕:Apache Kafka监控与调优

    胡夕,<Apache Kafka实战>作者,北航计算机硕士毕业,现任某互金公司计算平台总监,曾就职于IBM.搜狗.微博等公司.国内活跃的Kafka代码贡献者. 前言 虽然目前Apache ...

  4. 专访 Swin Transformer 作者胡瀚:面向计算机视觉中的「开放问题」 原创

    文 | 刘冰一.Echo 编辑 | 极市平台 本文原创首发于极市平台,转载请获得授权并标明出处. 胡瀚,湖北潜江人,本博均毕业于清华大学自动化系,曾就职于百度研究院深度学习实验室,目前任职于微软亚洲研 ...

  5. Redis-replicator作者陈宝仪:详解Redis协议

    特邀嘉宾 陈 宝 仪 12年软件开发经验 Nextop高级软件工程师 Redis-replicator.Redis-rdb-cli等 Redis相关开源软件作者. 分享主题 周四见|知数堂公开课系列之 ...

  6. 7-2 高精度求累加和 分数 25作者 胡伟平单位 广西科技大学

    使用求和公式求1到N的累加和大家都会,但是如果把N值变大呢,比如100位的整数,那该怎么求? 输入格式: 输入在一行中给出1个位数不超过100位的整数N. 输出格式: 对每一组输入,在一行中输出1+2 ...

  7. c语言程序设计胡成松电子版,C语言程序设计教学课件 作者 胡成松 黄玉兰 李文红 课后习题解答 习题答案 3简单程序设计 .docx...

    3.1源程序如下: #include #include int main(void) { float a,b,c,s,area; scanf("%f,%f,%f",&a,& ...

  8. c语言程序设计胡成松电子版,C语言程序设计教学课件 作者 胡成松 黄玉兰 李文红 课后习题解答 习题答案 8指针 .docx...

    1. #include "stdio.h" int main() { char s[100],*p ,*q ; puts("输入小于100个字符:"); get ...

  9. 2014版SEO工具集最新最全收集

    SEO工具集最全收集 结合网上曾有人搜集整理过,不过时间久远,部分网站已经不能访问,而且不断有优秀的网站涌现出来,而且过去的整理带站长性质的较多点,所以再整理一下.后面的点评仅代表个人观点.如有雷同, ...

  10. 外贸企业网站的搜索引擎优化

    在互联网上可以说大家随便一想,目前互联网上最火爆的运用是什么?为什么百度.Google的市值那么高,因为搜索引擎是我们最关注的,欧美有多少人使用搜索引擎呢,我们看一下尼尔森的这个报告,90%的互联网用 ...

最新文章

  1. UVA10652 Board Wrapping(求凸包、计算凸多边形面积)
  2. 我的fedora10的virtual box网络设置
  3. 皮一皮:论出门带物的重要性...
  4. return、break、continue区别以及作用范围
  5. 部分xcode插件可能有新版本
  6. 大数据平台搭建及搭建过程出错解析
  7. php transform,css transform属性怎么用
  8. JAVA基础语法:java编程规范和常用数据类型
  9. 前端时尚好用的图标项目-Font Awesome
  10. 一、Scrapy爬虫概述
  11. Unity外接设备摇杆控制
  12. Markdown符号
  13. 【小月电子】ALTERA FPGA开发板系统学习教程-LESSON8 LCD1602液晶显示
  14. iCollections—桌面管理工具
  15. 操作系统教程(第6版) 预习笔记
  16. win7虚拟机_win7系统如何安装virtual pc虚拟机 安装virtual pc虚拟机方法【介绍】
  17. python roundup 和 rounddown
  18. 内网映射软件之80端口映射和全端口映射实现发布网站访问内网
  19. 笔记本电脑没有鼠标怎么右键_没有鼠标怎么办?
  20. 运算(与运算)和|运算(或运算)

热门文章

  1. python 自动划分训练集和测试集
  2. 机械秒表的使用方法_秒表的使用方法?
  3. ArcGIS和Fragstats的脚本化调用 ------以ArcPy和命令行的方式
  4. PHP 静态缓存 OB系列函数
  5. opendrive中的几何形状
  6. Apollo OpenDRIVE和ASAM OpenDRIVE的区别
  7. vscode中文乱码问题及几种常见的解决方案
  8. 项目管理第九章项目资源管理
  9. idea svn切换分支,合并分支
  10. 【pnpm】pnpm : 无法加载文件 C:\Users\M_F15\AppData\Roaming\npm\pnpm.ps1