1、To C艰难、To B突破:当前2C的产品全部没有达到用户的预期,智能助理看似比专业领域的AI更简单,但实际上恰恰相反。打败柯洁的围棋AI好做,通用的日常任务助理如订餐、行程安排却难做。这不是商业模式的选择,而是技术上的限制:To B,特别是限定领域的产品,封闭不容易发挥跑题,而且数据比较充分,相对To C领域的产品更加可行。

2、身着皇帝新衣的人工智能:不管是Sophia还是酒店银行的大堂机器人,都是带喇叭的木偶,他们回复的内容要么是人工撰写好,然后利用语音合成输出,要么是真人远程录音。

3、大佬的观点:Yann LeCun和Hinton认为当前基于统计的机器学习技术来实现“人工智能效果”是行不通的。因为主流的基于统计的机器学习特别是深度学习,是通过大量的案例对文本的特征进行归类,来实现语义识别的效果,这种做法只对现象进行统计和归纳,没有对原因进行推理,形同“罗素鸡”。

4、人工智能的现状:智能助理依然智障,大部分To B的人造机器人都无法规模化,对话方面没有像Alpha Zero在围棋领域那样让人震撼的产品,没有商业上大规模崛起的迹象。

5、对话系统的现状和本质:对话系统中,用人工来撰写内容,或者使用模板回复,这是现在技术的现状。虽然每个对话系统背后的“对话管理”机制都不同,每家都有各种理解、各种设计,但是万变不离其宗——“填表/填槽”是对话系统的本质。剩下的无非是产品设计、工程实现、如何解决体验和规模化的困境这类问题。

6、对话的黑箱:对话智能的交互是一个黑箱,终端用户能感知到自己说出的话(输入)和机器人的回答(输出)。其核心是两点:听人话(识别)+讲人话(对话管理)。

7、ASR和NLP:机器学习特别是深度学习带来的语音识别和自然语言理解主要解决的是识别人讲的话,其中的关键是“意图识别(intent)和实体提取(slot)”。由于机器学习领域的重要论文都是公开的,每家在自然语言识别这个领域的基础工具都差不多(intent和slot的准确率只有百分点的差异),因此听人话(识别)不是核心竞争力,讲人话才是(非控制类产品,任务型)。

8、对话流程:

  • ASR:讲用户的语音转化为文字(深度学习)

  • NLU:意图识别和实体提取,如图中intent是“订机票”,slot是“明天”(深度学习)

  • 填表:选择intent是“订机票”的这张表,将已知的slot“明天”填到表格中

  • “NLG”:表格中缺什么就回答什么,如表中缺“出发地”就问“从哪里出发”,缺“目的地”就问“你要到哪里去”,NLG打引号说明现在还没有真正意义上的自然语言生成,即真正思维的生成

  • TTS:把回复的文本合成语音播出去

9、不要用轮次来衡量产品水平:在任务型对话系统里,“轮数的产生”是由填表的次数决定的,以“轮数多少”来衡量产品水平的方法,在任务型对话里完全无意义。硬要有意义,应该是:在达到目的且不影响体验的前提下,轮次越少越好。

10、常识的重要性:很多推理都是基于世界知识(包括常识)的,缺乏常识就没有推理的基础。

11、对话系统更大的挑战不是NLU:深度学习在对话系统里面,能做到的只是识别出用户讲的那部分,回复用户的那部分是需要人来设计表格、编程实现的。在产品层面,一旦用户谈及到表以外的内容,就会出现人工智障的情形。每个人自身都是一个自然语言处理系统,各不相同,希望设计出一次就能处理所有场景问题的对话系统,目前都无解。

12、高维与低维:在信息丰富度上,语言是贫瘠的,思想要更加丰富,对话是思想从高维度向低维度的投影,用语言来描述思维,是用低维来表达高维。因此,为了让别人理解你的思维,你需要尽可能全面、多维度地描述并还原它。

13、利用常识进行交流:人与人之间的交流是基于双方的共识进行的,当人接收到低维度的语言之后,就会结合常识和自身经历来重构一个思维模型,通过这个模型来理解语言所代表的含义。当对话双方对一件事情的理解一致时不需要再讲,那些共识之外的东西才是沟通的重点。

14、无因果不智能:影响对话至少包含“明文(含上下文)”、“场景模型”和“世界模型”3部分,但是深度学习只能处理基于明文的信息,对于场景模型和世界模型的感知、生成、基于模型的推理都无能为力,这也是深度学习不能实现真正智能的本质原因,即不能进行因果推理。

15、DL+GOFAI:DL(Deep Learning)+GOFAI(Good Old Fashioned AI,专家系统)是当前一切智能产品的设计思路。

16、降低用户的期望:当前的闲聊机器人都是开放式的,导致用户会以为什么都可以聊,但实际上由于产品本身缺乏场景模型、对用户的常识一无所知,用户很快就会碰壁并丧失兴趣。因此,在选择产品的Domain时,尽量远离那些严重依赖世界模型和常识推理才能进行对话的场景,并且不要鼓励用户期望对话系统能够输出很多有价值的话。

17、对话系统的核心价值:AI的To C终极产品是智能助理,我们需要的是对话系统后面的思考能力、解决问题的能力,用来进一步替代用户的重复思考,而交互本身不是核心,它背后搭载的内容才是。技术不是对话智能类产品的壁垒,数据(非训练数据,而是服务数据、常识数据等)和设计才是。

PM需要站在人文和技术的十字路口来设计产品。

人工智能的窘境:对话系统相关推荐

  1. 中小企业集成AI人工智能的窘境

    中国的中小企业,占企业数量的90%以上.近几年,随着AI人工智能的高速发展,其正在产生一种革命性的力量,重构.升级原有的企业生产模式.不仅在企业效率上,带来了前所未有的提升,而且使工作模式也在转型升级 ...

  2. 探臻实录 | 戴琼海:搭建脑科学与人工智能的桥梁

    来源:探臻科技评论 人工智能作为21世纪最具有影响力的技术,正在包括诸如机器人.语言识别.图像识别.自然语言处理等诸多领域发挥着重要作用.脑科学被誉为"人类科学最后的前沿",认识脑 ...

  3. 下一代对话系统中的关键技术(上篇)

    6年前,人工智能AlphaGo战胜李世石,成为第一个击败人类职业围棋选手.第一个战胜围棋世界冠军的人工智能机器人. 如今,作为新一轮科技革命和产业变革的重要驱动力,人工智能正在对经济发展.社会进步等多 ...

  4. 会议邀请 | 中国中文信息学会暑期学校《前沿技术讲习班》

    ATT第13期 问答与对话-理论与基础 ATT第14期 问答与对话-技术与系统 会议时间: ATT第13期:2019年7月12~13日,ATT第14期:2019年7月14~15日 报到时间:2019年 ...

  5. 核心算法缺位,人工智能发展面临“卡脖子”窘境

    http://www.xinhuanet.com/politics/2019-04/30/c_1124435131.htm "徐匡迪之问"引发业界共鸣-- 核心算法缺位,人工智能发 ...

  6. 人工智能对话系统在VUI和GUI结合下对于控件调用的调研报告

    一.什么是控件 百度百科:控件是指对数据和方法的封装.控件可以有自己的属性和方法,其中属性是控件数据的简单访问者,方法则是控件的一些简单而可见的功能.控件创建过程包括设计.开发.调试(就是所谓的3Ds ...

  7. 摇橹船以“硬科技+人工智能”助推高质量发展

    12月13日和14日,2021雷克大会暨智能经济年会在线上成功举办,大会得到了专业观众和行业媒体的广泛关注,全网累计数万人次在线观看直播. 本届大会聚焦产业智能化.智能基础设施.智能产业化和机器人产业 ...

  8. 滴滴AI语音团队获国际顶尖智能对话系统竞赛世界第一

    出品 | AI科技大本营 头图 | CSDN付费下载于视觉中国 近日,在国际顶尖人工智能竞赛第九届对话系统技术挑战赛(DSTC9)中,滴滴语音和NLP技术团队参与端到端多领域面向任务型对话系统任务荣获 ...

  9. 求助贴:人工智能offer,阿里or腾讯,选哪个?

    笔者曾在脉脉上看到一条网友求助帖:拿到两个offer,一个腾讯,一个阿里,选哪个? 抛开"柠檬"这件事不说,笔者观察到另一件事:那就是他的offer都是视觉岗. 前一阵刚巧也看到一 ...

最新文章

  1. Python占位符总结:%方式和format方式
  2. 前端学习(2082):const得使用和注意点
  3. ocupload完成文件上传(一键上传)
  4. 正式环境docker部署hyperf_使用docker搭建hyperf环境连接mysql
  5. day16- django
  6. CCF201612-5 卡牌游戏(募集解题代码)
  7. C# string 转 bool
  8. html网页使用js连接mysql_html下利用javascript连数据库
  9. 单片机STM32入门——(2)按键控制
  10. html容器自定义宽高比,容器长宽比_aspect-ratio, 宽高比, 会员专栏 教程_W3cplus
  11. win10系统更新后文件丢失的解决办法
  12. Excel批量更改图片名称(无需下载其他工具)
  13. android平板电脑手写笔应用,四款最佳手写笔平板推荐
  14. 埃尔米特插值c语言编程,131张艳-埃尔米特(Hermite)插值逼近的C语言程序.doc
  15. Qt控件边框颜色设定
  16. 方便、免费的PDF在线处理网站汇总:PDF合并、文字编辑、页面提取与删除、格式转换…
  17. java中extends和implements的区别
  18. 100 道 Linux 常见面试题,慢慢读~
  19. Unity Text富文本(文本变得多姿多彩)
  20. Java字符串压缩(两种压缩方式)

热门文章

  1. android手电筒功能吗,android通过led实现手电筒功能
  2. 平安科技2017笔试题目
  3. 博客地址blog.geass.link
  4. C#获取字符串的长度
  5. Understanding parameters:理解参数(Parameter)
  6. php论坛mybb,MyBB
  7. sns.regplot 和 sns.distplot你知道多少
  8. 云基础架构安全_这是使您的云基础架构稳定,安全和可扩展的方法。
  9. 分治算法,逆序对,三维偏序与CDQ分治
  10. 手机共享电脑网络上网