社区智慧+机器智能=奇虎经验的知识机器人
奇虎经验的知识机器人。
?
请看
http://jingyan.qihoo.com/wenda.php?do=topic&b=health&tid=1812621
http://jingyan.qihoo.com/wenda.php?do=topic&b=beauty&tid=1811805
的下面跟帖者。
没错,这是机器人。这一定不是幻觉。
这个帖子算是揉合了社区智慧+机器智能。而机器智能又偏偏是基于社区智慧而来,只不过是奇虎机器人基于百度知道、雅虎知识堂、小i机器人、爱问甚至是中小论坛的社区智慧。
这种奇虎机器人相当于把奇虎经验凌驾于众多知识问答网站之上,让奇虎经验社区的用户无偿回答问题,还让其他知识网站给它打工。
它的思路,估计来自于:
1:360doc给CSDN的论坛做的相似问题提示系统;
2:小i机器人的关键词搜索问答模式。
据谭晨辉说,各大搜索公司都会玩这个,因为确实对于搜索引擎来说,实施不难。
那么,它真的是机器人吗?有没有人工的成分呢?我相信是有的。证据就在 http://jingyan.qihoo.com/wenda.php?do=topic&b=beauty&tid=1811805 里。
以前天大有个项目,也是扒下百度知道、爱问等著名知识问答的所有知识,然后允许用户自然语言搜索,通过计算自动给出所有符合的答案(甚至涉及到关键词在回答中的词之间的距离远近计算),按照相关度排序。
但,奇虎经验的这一招,技术层面上简单明了而且切实可行,仅仅用了关键词简单搜索就做到了。确实是事半功倍的好办法。
由于奇虎根深蒂固的只会关键词搜索,所以,奇虎知识机器人效果不会好到出人意料。当然,如果问题是简单的一句话,关键词不具有模糊性,应该可以有很好的答案匹配,毕竟很多问题在其他知识网站里已经整理好了,轻轻松松就匹配对了。
但如果关键词过多,或提问很长,那么机器匹配的出差错机率还是蛮大的,不过这时候机器人可能会藏拙,我猜它有一个什么评价机制保证机器人不擅自发言,也就是保证匹配度不高的回答它就不贴了。这个匹配度,要么还是从关键词上斟酌,要么还是人工来保证。
奇虎聚客,想法很棒,但是效果不好,就是这个原因。
比如前面举的那个例子,很显然,疾病+遗传就是关键词。难得是,一定能找出很多匹配的答案,如何优选出最好的那个答案,是一个问题。这也就是上面说的评价机制。
随之而来的就是,我为什么要相信这个信息。你这个智能机器人为什么这么回答。
为什么存在这个问题呢?因为很多知识网站强调的是回答者的权威性,比如雅虎知识堂,你回答多少多少个问题,其中多少个问题回答对了被发问者奖励积分,等等措施保证了回答者的社区影响力。
但机器人抽取答案自动回复之后,原来的社区影响力就不复存在了。
那么,正如bloves所言,信息的信用问题就凸显了。
不过,不管怎么样,奇虎的这个设计和最终实施效果还是让人赞赏的,虽然不知道里面到底揉合了多少人工编辑成分,但是小i机器人完全可以从中学习学习,而少去琢磨什么语义搜索。
郑昀@海内 20080107
社区智慧+机器智能=奇虎经验的知识机器人相关推荐
- php功能大马加密乱码,php大马加密工具 phpTrace:奇虎360开源的PHP脚”的相关知识...
phpTrace:奇虎360开源的PHP脚本分析工具 问题:phpTrace:奇虎360开源的PHP脚本分析工具回答:phpTrace 是奇虎 360 开源的一款和分析PHP脚本的工具.如果开发者用过 ...
- 雅虎中国,奇虎全面杀入威客领域
中国互联网进入2008年,一个巨大的变化在不知不觉之中悄悄的走到人们的视野之中. 2008年3月,雅虎中国(cn.yahoo.com)推出了有奖建站和能人自荐栏目,通过悬赏万元鼓励互联网用户在雅虎中国 ...
- 从50亿图文中提取中文跨模态新基准Zero,奇虎360全新预训练框架超越多项SOTA
©作者 | 奇虎360人工智能研究院.清华大学 来源 | 机器之心 对于中文社区来说,本文提出的大规模跨模态基准数据集无疑很有价值. 视觉语言预训练(VLP)主要学习视觉与自然语言之间的语义对应关系. ...
- 奇虎CEO周鸿祎暗讽雅虎 寄希望于奇虎搜索
9月5日,主题为"新媒体.新创意.新营销"的"第三种人新媒体高峰论坛"在上海举行.9月6日论坛进入第二天,奇虎CEO周鸿祎发表了题为"网络社区所带来的 ...
- CNCF案例研究:奇虎360
公司:奇虎360 地点:中国北京 行业:计算机软件 挑战 中国软件巨头奇虎360科技的搜索部门,so.com是中国第二大搜索引擎,市场份额超过35%.该公司一直在使用传统的手动操作来部署环境,随着项目 ...
- 奇虎360正式开源其深度学习调度平台,支持TensorFlow、MXNet等框架
奇虎360今日宣布开源深度学习调度平台XLearning,项目开源地址:https://github.com/Qihoo360/XLearning. \\ XLearning由360系统部大数据团队与 ...
- 清华管理评论 | 上奇数科:产业知识服务引擎开创者
导语:北京上奇数字科技有限公司前身是北京智源人工智能研究院下设的知识引擎创新中心.成立至今,上奇数科聚焦产业知识的数字化.模型化和服务化,研发出全球首款产业知识计算引擎,并基于该引擎推出一系列拥有自主 ...
- [转]奇虎360黑匣子之谜:暗藏后门盗取用户隐私
每经记者 秦俑 昨日(2月25日),正是奇虎360所有APP产品被苹果全面下架一个月的日子. 就在此前,360的CFO亲赴美国"负荆请罪",但360相关产品并未重新上架. 知情人士 ...
- 360黑匣子之谜——奇虎360“癌”性基因大揭秘
360黑匣子之谜--奇虎360"癌"性基因大揭秘 http://www.nbd.com.cn 2013-02-26 01:33 核心提示: 360怎么了?这是一家什么样的企业?带着 ...
- 一针见血评互联网五大巨头:腾讯贪、阿里全、百度狠、小米直、奇虎360难
中国互联网的第一阵营table,俨然是金墉笔下的顶级高手"天下五绝".如同这个单词的构成,五个字母的先后顺序,似乎也是各自代表派系当今的排名.TAB自不必说,这三巨头拥有庞大的用户 ...
最新文章
- 狄利克雷分布公式_深入机器学习系列11-隐式狄利克雷分布
- C#使用了未赋值的局部变量
- office 2007图标_微软Office 365桌面版新图标开始测试
- Github上影响力最大的十位Pythoner
- 下一个主要AI平台是什么?苹果说:手机
- C#反射取得方法、属性、变量
- Looksery Cup 2015 B. Looksery Party 暴力
- SFR算法详解(二)——斜棱法
- Java项目(一):家庭收支记账软件
- radasm相关问题
- 三维重建3:旋转矩阵-病态矩阵、欧拉角-万向锁、四元数
- vscode让代码敲出火焰
- 上海/深圳/香港内推 | 商汤科技EIG研究中心招聘AI算法研究员/实习生
- PAT甲级 A1030
- Latex 如何给数学公式进行编号
- .py文件转.pyc文件
- 吸墨涂料市场现状及未来发展趋势
- ----- 前端面试题 -----
- Mysql之高可用方案浅析
- 浅析Statement和PreparedStatement的区别
热门文章
- linux 进程内核栈
- Audio -- Music Playback 框图
- Linux学习之源码2:start_kernel流程
- linux VM中复制虚拟机后eth0变成eth1
- oracle和mysql数据实时同步_Canal 实现 Mysql数据库实时数据同步
- python编写学生管理系统设计感想-python案例----学生管理系统(实现学员的增删改查功能)...
- java scala中传递变长参数
- java.io.IOException: Filesystem closed
- 长沙理工大学--论演员的自我修养---杨辉三角+卢卡斯定理
- 51nod1003阶乘后边0的数量