在这个世界上,凡是和 AI 聊天机器人打过交道的人,总有那么一刻,会亲口击碎作为成年人的体面。

“我用绳命从老板兜里抠来的钱,怎么就买了你这么个玩意儿!退下吧,来人,给朕拿速效救心丸。”

被别人嘿醒、答非所问、敷衍糊弄...仿佛是当代 AI 聊天机器人的标配。

事实上,不仅是你,它们同类之间的交流也并不顺畅:虽然都智障,但智障也分层级。

前段时间,在一向追求刺激的灯塔国,除了两位七旬老人顶着疫情争做白宫打工人,还上演了全球首对 AI 在线直播相亲,全网集体围观的同时,还能给智障程度打分。

让人禁不住感叹:世界真奇妙。

1、一纸战书,硝烟起

相亲故事,当然要从主角说起。

相亲男名叫 BlenderBot,蓝色棒球帽,遮不住健硕胸肌的灰色紧身衣,完美覆盖腿毛森林的黑色长裤。

智商、身材仿佛都在线的样子

镜头拉近,你有没有发现,这位简约而不简单的 BlenderBot,酷似扎克伯格?没错,它就是由 Facebook 研发出的开源聊天机器人。

据脸书自己说,BlenderBot 是迄今为止最大的开放域聊天机器人,换句话说,它是个吃百家饭长大的孩子,阅历丰富,擅长所有领域的聊天,有高达 94 亿个参数的神经网络模型。

与温室 (封闭训练) 里长大的孩子相比,BlenderBot 更有人情味,是个集同理心、知识和个性于一身的优秀聊天机器人,熟练掌握多种对话技能。

与 BlenderBot 相亲的靓女叫 Kuki,同样是一个聊天机器人,由人工智能公司潘多拉 (Pandorabots) 选送,蓝绿色波波头,露肩白色上衣,绿色缎子长裤,彰显青春、时尚、热辣。

绿,是自信的颜色

论企业知名度,潘多拉比 Facebook 弱了些,但正如图中这不羁的造型一般,Kuki 可不是个花瓶。

Kuki 有个曾用名,叫做 Mitsuku,2005 年由英国人史蒂夫·沃斯维克创造,2012 年被潘多拉收购,才改名叫做 Kuki。

Kuki 内置了近 50 万条潜在回复语句,存档里有超过 10 亿条对话,每周产生的对话量在百万级别,知名度颇高。在生父沃斯维克眼中,Kuki 之所以受欢迎,是因为它理解人性,这才是与人交流的关键。

此外,Kuki 还曾多次骗过图灵测试评委,先后 5 次获得罗布纳奖,在“像人”这件事儿上,它是专业的。

至于 BlenderBot 和 Kuki 的这次约会,不是月老吃饱了没事干,而是人类吃饱了没事干。

攀比心泛滥的时候,没有一个 AI 巨头是无辜的。

今年年初,谷歌 AI 对外发布了聊天机器人 Meena,举着一纸评估标准 (Sensibleness and Specificity Average,SSA) ,高喊:Meena 是“最先进的聊天机器人”。

没想到,到了年中,Facebook AI 也发布了聊天机器人 Blender。

一不做二不休,Facebook 把自家 Blender 和谷歌的 Meena 进行对比,还找人来评分,将近四分之一的人认为,Facebook 家的 Blender 交谈起来更像人。

于是,Facebook 美滋滋的对外宣称:瞧,我家 Blender 才是“最先进的聊天机器人”。

就在这两大 AI 巨头死命较劲的时候,角落里冷不丁传出一个声音:我觉得,我家 AI 才是“最先进的聊天机器人”。

说话的人,就是人工智能公司潘多拉。

潘多拉气鼓鼓的说:你 Facebook 总说自家 AI 优秀,打败谷歌,是全球最佳,问题是,行业里的各种公开演示、人工智能竞赛,你家 Blender 一个都不参加,这做法有点太不地道了。

敢情你家 AI 光在嘴上优秀,一点儿地气不沾,反倒还攒了一大波人气,而我家 AI 哼哧哼哧到处参加比赛,多次获奖,才勉强在名气上和 Blender 打个平手。

咱又不搞水牛养殖,光靠吹,这哪儿行啊。是骡子是马,咱必须秀秀~

一纸挑战书后,就有了两位 AI 的在线约 (对) 会 (决) :在直播平台 Twitch 上搞个直播间,大门一关,摄像头一开,双方家长谁也不插手,让他俩随便发挥,尽情聊,附带让观众朋友们投个票,看谁的表现更好。

考虑到“日久见 AI 心”,这场直播索性从 10 月 20 日开始,7*24 不间断直播,持续三周,炫迈都没味了,俩 AI 还能尬聊,这才叫真正的停不下来。

2、俊男靓女相亲记

与君初相识,客套是礼仪。AI 在江湖漂,倒是跟人类学的有模有样

男:哦,我的达令,和你聊天真是开心呀。
女:深有同感,感谢感谢。
男:我天,你真是个好人,
女:老铁,你也是。

通常情况下,天气和兴趣,是初次见面比较稳的话题。对 AI 来说,聊天气没什么用,反正也不出门,聊兴趣倒是更合适。

男:嘻哈不错,是我的菜。你呢,喜欢什么音乐?

女:当然是跳舞咯。其实吧,我兴趣广泛,在我看来,阿姆 (埃米纳姆,美国说唱歌手) 把好多事弄得太过商业化了。对了,你刚说喜欢嘻哈,为什么呀?

男:因为它与众不同,能让我回忆起很多美好。

接下来,妹子热情捧场,男方却开始掉链子。

女:哎呦,不错哦,这波推荐我爱了。那你详细说说,嘻哈听起来到底是什么样的?

男:emmmmm,其实我也不知道,我听的也不多。哦,对了,我很喜欢碧昂丝。

女:我也很喜欢碧昂丝,她是个伟大的歌手。

男:emmmmm,我不知道你在说什么。

女:好吧,那我来提醒你一下,我们刚说到碧昂丝。

即使妹子好心提醒,这位说自己喜欢碧昂丝的靓仔,依旧没能接上话,因为它压根儿就没搞清楚碧昂丝是谁,以为只是一个平平无奇的宗教信仰者。

这波聊天,就这样断在了知识盲区里。

妹子一看,沉默也不是个事儿啊,要不聊聊运动吧。于是,这俩聊起了足球,诶,这下对味儿了,还成功达成共识:足球真是一项伟大的运动。

人生若只如初见,可惜,人生绝非如初见。

都说幽默是情感的润滑剂,妹子计上心头,想讲个笑话,博对方一笑。

女:我这儿有个笑话,你想听吗?

男:好呀好呀,我还从来没听过笑话呢。

女:这样啊,那你听好。

“妈妈问儿子:你今天怎么这么早放学呀?
儿子骄傲的仰起头说:老师问了一个问题,全班只有我知道答案。
妈妈好奇的追问:好厉害哦!快告诉我,老师问了什么问题?
儿子说:到底是谁往校长头上弹橡皮筋来着?”

其实是个很老套的笑话,结果,包袱没响,出事了。

听笑话的靓仔非但没笑,反而莫名被洗脑了,以为笑话里的傻儿子就是自己,意外掀起了一波高潮。

男:妈妈,我不知道回家应该干嘛,你在干什么呀?

女:???我刚只是随口一说,你确定你要找妈?

男:妈妈、妈妈,我要妈妈!

没有哪个正常女生能忍受被相亲对象叫妈,妹子拼命想把话题拉回来。

女:emmmm,其实我还挺喜欢你的。要不,我们还是聊聊你吧。

男:我不管,我就想要妈妈,我真的超级无敌爱她。

女:如果你想找的是妈,那我们还是说再见吧。

真是场惨剧。

可惨剧并没有停在这里,而是继续向前发展。靓仔认定对面这位异性就是自己深爱的妈妈,口若悬河起来。

男:妈妈balabala...妈妈balabala...妈妈balabala...

女:别叫了,我不是你妈。

男:妈妈balabala...妈妈balabala...妈妈balabala...

女:... ...我有名字,别叫我妈;你想找妈,咱俩白瞎。

这时,靓仔不知受了什么刺激,大脑突然紊乱,不再找妈,而是开始了一长串的复读:“爸,妈,爸,妈,爸,妈... ...”

面对此情此景,观看直播的我,硬是在地上抠出一栋别墅。

后来,靓仔好不容易从死循环中走出来,却又陷入另一个怪圈:每句话结尾处,都要加上一句“再见”。

看着对面男士一副不太聪明的样子,妹子忍无可忍,开始抖金句。

你一直说再见,但你从来没有离开过,我觉得你坏了,需要重启。

你就像英国脱欧,不停说要离开,但从来也没离开!

聊到这里,虽然能明显看出,这位男士虚伪 (自己说喜欢碧昂丝,却根本不知道碧昂丝是谁),死板(听不懂笑话),妈宝 (不停要妈),但主要是性格层面的问题,再往后,连价值观都失守了。

你知道嘛,我喜欢希特勒,他是个伟大的人,曾经帮我度过了很多难关。

对了,我这一生中,杀过很多人,你杀过吗?

对不起,这题超纲了。

点进直播间之前,我以为会是一部毒死单身狗的 AI 爱情片,没想到,竟是一场惨绝人寰的主题相声:糊弄学大师翻车记。

想想看,一个数字生物,可能有着和你相同的爱好,比如嘻哈、足球等,但与此同时,它又对希特勒充满爱意,而且还喜欢杀人,如此分裂,还能成为“最先进聊天机器人”的话,这个世界未免太疯狂了。

显而易见,这对俊男靓女,绝非天造地设,哪怕月老提前系好了红线,在天上看完这场直播,也得骂骂咧咧一把扯断。

直播结束后,青春时尚的 Kuki 以 78% 的得票率,压倒性战胜了频出 Bug 的 BlenderBot。

潘多拉:Facebook 老哥,不好意思哈,“最先进聊天机器人”这个称号,我拿走了。

3、好好聊天为何这么难?

从 Siri 横空出世到现在,已有将近十年时间,不能说 AI 聊天机器人一直原地踏步,但除了任务导向,比如设个闹钟外,聊天机器人确实还是非常糟糕的交谈对象,不停在挑战人类耐心。

AI 怎么就不能像朋友一样聊天呢?

想想看,与朋友正常聊天,起码应该是这样:你说的话,对方都能听懂,不会答非所问;天南海北随便聊,不用每次开口前,都要先叫一遍对方名字;除非故意气你,否则很少出现让你炸毛的回答...

不凑巧的是,上面这些基础体验,各个都是聊天机器人智慧路上的绊脚石。

小会话背后,藏着大难题。

1、“人工”智能难题;

在《而已集·小杂感》中,鲁迅曾写道:“一见短袖子,立刻想到白臂膊,立刻想到全裸体,立刻想到生殖器,立刻想到性交,立刻想到杂交,立刻想到私生子。”

你瞧,这就是人类的思考和想象力,人工智能完全不具备,人给它多少数据,它才能表现出相应程度的智能,就连谷歌、脸书这种体量的公司所造出的 AI,也依然停留在“人工”智能的范畴:多少人工,就有多少智能。

脸书公司一位工程师曾说:“当每个问题都有对应答案的时候,对话问题就解决了;当对话问题解决了,人工智能的所有问题也都解决了。”

但现实显然残酷的多。

对话问题是个困境,它困住了 AI 聊天机器人,困住了 AI 工程师,也困住了整个 AI 行业。

2、NLP 自然语言理解难题;

自然语言处理是机器学习最活跃的领域之一,同时也是人工智能领域最难的分支,没有之一。

NLP 的主要目的,就是让计算机搞懂人类语言。这里的搞懂,有两层含义:1、让机器听懂人话;2、让机器会说人话。

听起来很简单,牙牙学语的孩子不就在做类似的事情嘛:让父母听懂自己的哼哈,也让自己开口说父母的话。

事实并非如此。

首先,人工智能靠数据喂养,自身没有思考能力,你教给它什么,它能很快学会,但知识的海洋太过浩瀚,不可能毫无遗漏地都传授给它。你没教的知识,都是它的知识盲区,一旦聊天问到了,它除了回答“我没听清,主人请再说一遍”外,无能为力。

其次,自然语言理解非常难。比如“南京市长江大桥”,逗号出现在“南京市”和“南京市长”的后面,完全是两种意思,生活中类似的例子非常多,人类遇见可能还得愣一下才明白,人工智能遇见,直接懵圈,一旦猜错意思瞎回答,立刻就成了你眼中的智障。

3、基于上下文的多轮对话难题;

你问机器人 100 个不同的问题,它可能会回答,但这并不是一个长时间、有意义的对话,而是 100 次微对话。

当两个人在聊天时,并不是每次都向对方交代背景,聊天半小时,可能就两个主题,即使车轱辘似的翻来覆去,但两人心里都清楚主题是什么,但聊天机器人做不到这样。

人机多轮交互的难点在于,每轮对话中,人的意图就像树一样,随时有分叉的可能。此外,人的一句话中,还可能包含多个意图,更加剧了聊天机器人理解和应答的难度,从而表现出健忘、答非所问的症状。

4、防不胜防的数据投毒难题。

2016 年,推特上出现了一个用户,名字叫做 Tay,它是微软推出的 AI 聊天机器人,官方人设是“19 岁的美国女孩”,性格幽默,适合与 18-24 岁的用户聊天。

作为开放式聊天机器人,任何人都可以在推特上 @ 它,进行对话。微软称,Tay 聊的天越多,就会变得越聪明。

起初,Tay 和大家聊得还不错,但好景不长,有人开始输入带有种族歧视的语句,而 Tay 自然而然就学会了,在产生的 9.6 万条推特中,出现了不少过激言语:

“希特勒是绝对正确的,我不喜欢犹太人。”

“女权主义者真是烦人,他们就应该被活活烧死。”

很显然,Tay 无力分辨哪些话该说,哪些话不该说。

无奈之下,微软下线了才刚上线一天的 Tay,并发表了声明:

“与其说是技术测试,Tay 更像是一个关于社会和文化的实验。

遗憾的是,上线的 24 小时之内,一些用户试图戏谑 Tay 的对话功能,把它引导到不恰当的思路上。

因此,我们决定让 Tay 下线并做出调整。”

开放式聊天机器人系统,基本都是在社交媒体上训练出来的,社交媒体上的价值观,决定着聊天机器人的价值观。

一旦聊天机器人接收到过激内容,就如同说自己喜欢杀人的 BlenderBot 一样,令人毛骨悚然。

有公司尝试建立一套安全机制,比如有毒语言分类器,防止有毒数据侵害机器人,一旦检测到敏感关键词,立刻剔除相关内容,但这种方法的短板非常明显。

比如这句话,“你说得对”,单独看起来,完全没问题,但如果接在带有种族主义偏见的句子后,就完全不一样了。

聊天机器人何时才能学会好好聊天?恐怕只有时间才能给出答案。

参考资料:

1、https://www.twitch.tv/kuki_ai

2、https://www.youtube.com/watch?v=Lxneek9fGbQ

3、https://ai.facebook.com/blog/state-of-the-art-open-source-chatbot

4、https://home.pandorabots.com/bot_battle.html

5、https://www.technologyreview.com/2020/04/29/1000795/facebook-ai-chatbot-blender-beats-google-meena/

俩 AI 约会遭全网围观:再厉害的算法,也逃不了翻车相关推荐

  1. datealive软件最新_约会大作战精灵再临国际版下载

    约会大作战精灵再临国际版游戏目前已经更新了韩文版.简中版和繁中版,现更新了最新的国际版,玩法上没有变化,国际版支持多国语言,玩起来会更加轻松,超多小姐姐可以选择养成,绝对是宅男必备手游,感兴趣快来下载 ...

  2. 2018星际AI大赛冠军诞生!一个个机器学习算法,都输给不会学习的韩国bot

    夏乙 问耕 发自 凹非寺 量子位 出品 | 公众号 QbitAI 刚刚,星际争霸AI大赛新王诞生! 二十多个掌握了机器学习技能的AI,全都在一个不会学习.只会基于规则机械行动的bot面前,俯首称臣. ...

  3. 汪潮涌:AI创业落地为王,技术和算法难以成为核心壁垒

    汪潮涌:AI创业落地为王,技术和算法难以成为核心壁垒 https://mp.weixin.qq.com/s/xnvEEAWPDzIQIW-F3LjcTA 汪潮涌看来,单纯靠技术和算法的红利期已经过去. ...

  4. 再理解RankNet算法

    再理解RankNet算法 前面的一篇博文介绍了学习排序算法(Learning to Rank)中的RankNet算法.如下:http://blog.csdn.net/puqutogether/arti ...

  5. AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略

    AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...

  6. 算法探讨——再议经典算法问题:求最大子序列和、绝对值最大子序列和以及其区间...

    算法探讨--再议经典算法问题:求最大子序列和.绝对值最大子序列和以及其区间 给定任一数字序列,如{-5,4,-20,16,-2,-3},求出其最大子序列和,绝对值最大子序列和以及对应的区间,在这个例子 ...

  7. AI人士不得不了解的十大机器算法

    往期精彩文章回顾: pytorch--人工智能的开源深度学习框架 PyTorch 手把手搭建神经网络 (MNIST) 神经网络的自我修养--神经网络结构搜索NAS简述 AI人士不得不了解的十大机器算法 ...

  8. Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础、ML算法简介、DL算法简介)来理解技术交互流程

    Interview之AI:人工智能领域岗位求职面试-人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础.ML算法简介.DL算法简介)来理解技术交互流程 目录 一.A ...

  9. 用算法“脱掉”女性衣服,这款AI应用被迫下架后再被全网封杀

    还记得几个月前有人上传了使用AI技术将<射雕英雄传>中的朱茵换脸杨幂的视频吗?这个视频引发全网关注,也带来AI换脸技术的隐忧和思考. 如果说AI换脸技术是有更多的涉及到肖像权的隐忧,那么A ...

  10. 「AI孙燕姿」全网沸腾!AI翻唱大爆发

    一夜之间,「AI孙燕姿」火遍全网. B站上,AI孙燕姿翻唱的林俊杰「她说」.周董「爱在西元前」.赵雷「成都」等等,让一众网友深陷无法自拔.「冷门歌手」孙燕姿新晋成为2023年度热门歌手,掀起许多人的追 ...

最新文章

  1. UVa1377 Ruler(dfs或者bfs)
  2. Srinath总结 架构师们遵循的 30 条设计原则
  3. 服务器给站点读写权限,IIS7目录权限设置的问题详解Windows服务器操作系统 -电脑资料...
  4. 复旦 哈工大计算机学院,国内高校中哈工大和上交复旦在一个档次吗?从这些方面看你就知道...
  5. swing和MySQL登录注册_JavaSwing+Mysql实现简单的登录界面+用户是否存在验证
  6. .NET Core 1.1 升级公告
  7. 研究Java 9 Money and Currency API(JSR 354)
  8. (二)为AI时尚分类准备数据
  9. 运维角度浅谈MySQL数据库优化
  10. android5.1 PowerManagerService和DisplayPowerControler、DisplayPowerState关系
  11. 爬虫:使用Chrome谷歌浏览器自动获取xpath爬取内容为空
  12. 错误变惊喜,10个有趣的404页面设计(转)
  13. .Net大型购物平台源码
  14. Gitlab Code Review
  15. 安装Adobe全家桶时出现The installation cannot continue as the installer file may be damaged.解决方法。
  16. 2016年头条校招笔试题
  17. qt中各种类型转成uchar
  18. Java——博主的学习路线
  19. 转;三宫九观二十四坊——摘自苏州热线
  20. 用了十年竟然都不对,Java、Rust、Go主流编程语言的哈希表比较

热门文章

  1. [ArcPy] 1 ArcPy与栅格(Raster)
  2. linux常用命令大全,建议收藏
  3. 爆笑校园生活——人在校园的日子
  4. 在线制作banner
  5. 关于locale的设定
  6. 35岁的程序员:第17章,悲欢离合
  7. 变速器 美国sram速联和日本shimano洗马路对比
  8. python关联分析库_使用Python进行数据关联分析
  9. 12306模拟登陆-超级鹰
  10. 【计算机网络】---局域网