点击上方,选择星标,每天给你送干货!


来自:李rumor

卷友们好,我是rumor。

人工智能对话系统一直是让我又爱又恨的存在,爱是因为一想到它的终极NB形态就令人兴奋,觉得自己在从事一门可以改变世界的技术,恨是因为现有的技术与期待相差太远,一旦框架搭起来了就陷入解case的死循环,让我怀疑我是谁我在干什么,我有生之年能看到强人工智能吗???

恰好最近看到Sebastian Ruder写了一篇QA的研究发展史,于是今天也来和大家唠唠QA研究以及国内的落地情况。

QA技术研究发展

如上图所示,Sebastian将QA的研究分为了5个阶段。

第一阶段是封闭域手工解析。这些系统的主要模块就是parser,和今天的semantic parsing任务很像,通过人工定义大量的规则,把句子解析成结构化的query后对数据库直接查询。1963年就有学者提出了Baseball系统来解答相关问题,之后是NASA在1972年提出的LUNAR,用于解答月球上岩石和土壤的问题。

第二阶段是开放域检索。这个框架也是当今大部分QA系统的解决方案,首先根据问题召回相关文档,再从文档中提取答案。不过考虑到速度与效果,现在的系统会提前把问题-答案对准备好,这就演变成了大部分智能客服使用的FAQ检索式问答。这种方法最早在1999年的TREC测评上被提出,2011年的IBM Watson也基于这个框架提出了更细致的pipeline。

第三阶段是阅读理解。研究者们开始把QA简化成阅读理解这样的监督学习问题,也就是给定一个文档和相关query,系统给出答案(也就是span抽取)。但这类数据集的构造基本都是看着答案写问题,直到最近(2019)才开始改成先写问题,再去找文档和答案,演变到了第四阶段的开放域检索+阅读理解

第五阶段是多轮、多跳、多语言、生成、多模态。随着单轮问答的效果提升,简单query都解的很好了,但离人类还有很大差距。目前的学术界就在解答各个细分的复杂问题。

虽然学术界的进展已经很多了,但研究所用的数据集是没法覆盖现实的复杂情况的,同时深度学习模型的鲁棒性也一直是个大问题,因此目前工业界还在封闭域问答挣扎,即使是封闭域也要先对问题进行分类,应对各种长尾case。

对话能挣钱吗

对话的变现能力主要看能不能产品化

产品化是指把能力打包成解决方案,首先要有需求,其次要有量,把一份东西卖给多个人,边际成本递减

这个问题想清楚,就知道为什么ToB不好做了。国内16年开始涌现大批做NLP智能客服的公司,但到现在没有几个能出头的,我认为主要原因就是因为技术发展的限制,无法把FAQ技术产品化,导致换一个客户(换一个封闭域)之后都要从新训模型适配,而模型肯定是不够的,还要针对性的解各种case,这样人力成本就上去了,报价高的话只有大企业买得起,而CEO不一定有大企业的人脉,报价低只能自己倒贴钱吃融资,陷入负循环。

从这个思路来看,ToC似乎是更好的选择,现在看来的确也是。

ToC起码可以做到一份东西卖多份,但切对需求这个点同样重要

国内最早最有名的莫过于小冰,但我个人感觉纯闲聊还是个伪需求,闲聊主要是情感上的交互,除了生理需要外,情感表达是需要信任和反馈的,如果明知道对方是机器,大部分成年人都不会进行深层交流,同时技术也不允许。

另一个需求就是目前比较成功的语音助理,一方面可以给用户提供信息,比如天气预报、时间,另一方面替用户完成任务,比如打电话、定闹钟、开关灯。国外做得好的有手机助手Google Assitant、Siri,以及亚马逊的智能音箱Echo。国内则有手机微软小娜、小米小爱、百度小度、天猫精灵。手机上的智能助理我有些存疑,但智能音箱我已经把自己说服了。

首先由于巨头前两年的补贴大战,音箱的普及一直在增长,而从使用感受来看,一旦习惯了“命令别人”,就真的很难改掉。比如我现在每天都需要某精灵给我放歌、定闹钟、预报天气,甚至还买了智能插座懒得自己关灯。另外随着国家政策支持(重点发展智慧家庭产品),一些新楼盘的精装交付都会带有智能家居,再加上自动驾驶的发展,大家会越来越习惯AI助理的存在

从大趋势来看,我们已经走过了PC时代、互联网时代、移动互联网时代,接下来自然而然地便是IoT,基础设施的发展会产生更多的软件应用,对话作为人机交互的接口也会有用武之地。

总结

一直都在做对话、自然语言搜索相关的落地,直到最近才想清楚。虽然从技术角度来看很多事情还做不好,但发展毕竟是个过程,用户也需要培养,长期看依旧是值得进入的方向。

不过对技术人来说,赛道的选择与自身能力都是成功需要的因素,没有选择到热门赛道的同学也不用心急,把能力磨练好总能抓住一次机会。

今天就唠到这里,以上都是个人观点,欢迎讨论。

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

【人机对话】对话的囧境?相关推荐

  1. 200块的烘干机 能破除潮湿天没内裤穿的囧境吗?

    本文来自太平洋电脑网 到处都湿漉漉的,墙上.窗户上.地板上,甚至是呼吸的空气中,都潮的很,雾海茫茫. 阳台上晒得衣服一直没干,家里的衣服也堆积了快一个星期了. 再这样下去,内裤都没得穿了,愁得人心里发 ...

  2. 【一些随笔】艰难存折,恨不睡觉:大话年轻人的钱包囧境与退休梦想

    一些随笔 1️⃣ 存钱难吗?难!它难在哪? 2️⃣ 关于年轻人如何攒钱理财的一点建议 3️⃣ 关于裸辞的一些经验及看法 4️⃣ 谁又不想攒够钱了提前退休呢?但要存够多少呢? 1️⃣ 存钱难吗?难!它难 ...

  3. 任务导向型对话系统——对话管理模型研究最新进展

    作者丨戴音培.虞晖华.蒋溢轩.唐呈光.李永彬.孙健 单位丨阿里巴巴-达摩院-小蜜Conversational AI团队,康奈尔大学 对话管理模型背景 从人工智能研究的初期开始,人们就致力于开发高度智能 ...

  4. 微服务囧途之BFF层登场

    从单体架构演化为微服务架构后,架构者的期望是"模块A"+"模块B" = "后端服务". 场景一 Web端和Mobile端都有一个详情页面,需 ...

  5. 囧时代的囧营销 营销 时代

    囧时代的囧营销 营销 时代 21世纪最牛的一个字是什么?囧!这个在中国康熙字典里才有可能查到的字眼,却成为2008年最火爆的网络流行语之一."囧"字的本意是光明,却被网民们赋予了完 ...

  6. 一文说清AI智能平台

    来源:海豚数据科学实验室 有一天,小李的领导说:"我们要做AI平台!". 虽然平台产品也不是新概念了,随着AI技术的成熟,AI平台产品也越来越多,但光凭做平台一句话,小李还是犯了难 ...

  7. 德国奇葩经历之护照丢失

    2018年11月份来德国参加Percona Live 会议,可能这辈子都难忘吧! 觉得有必要记录下,文笔粗鄙,凑合着看吧. 01 法兰克福 2018-11-4 到达德国法兰克福机场,从机场到住处希尔顿 ...

  8. 数字如潮人如水:在这个时代,你是要当算法,还是当数据?

    数字如潮人如水 社会学简介 定量研究 数据思维:用数据思考,让世界讲得通 一.感知数据 1.1 培养数据感:定性思考到定量思考 1.2 意义取决背景:输入看定义,输出看情境 1.3 让数据说话:如何发 ...

  9. 论 做 AI 芯片的正确姿势

    https://xie.infoq.cn/article/d5ab8bea53fa8a08406fabf9d 论做 AI 芯片的正确姿势 作者:flow 2020-08-10 本文字数:14908 字 ...

  10. 知识付费「四大天王」走下神坛?

    罗振宇们的"知识跨年"为何没看头了? Tech星球(微信ID:tech618) 文 |  杨业擘 "还是看了跨年演讲,不能说多期待认知升级,也许是潜意识中的学习仪式感在起 ...

最新文章

  1. 教程 | 理解和实现自然语言处理终极指南(附Python代码)
  2. 使用Docker Compose 部署Nexus后提示:Unable to create directory /nexus-data/instance
  3. float、double(浮点数)区别还有和decimal(定点数)的比较
  4. Python基础概念_9_输入输出
  5. python抓取中文网页乱码
  6. zabbix4.2 系列(二):agent配置
  7. Koa2+Mysql搭建简易博客
  8. 碳酸铈行业调研报告 - 市场现状分析与发展前景预测
  9. java经典源码 阅读_公开!阿里甩出“源码阅读指南”,原来源码才是最经典的学习范例...
  10. Keil软件的汇编使用
  11. Confluence 空间附件(Attachments )宏
  12. VS2010闪退的问题
  13. Mac电脑如何新建txt文档?
  14. Catalan Number(卡特兰数/卡塔兰数)
  15. 判断IE版本并给出提示升级浏览器
  16. linux僵尸程序,什么是僵尸进程(zombie)?
  17. 送小情人一个深海之声蓝牙耳机,樱花粉简直美得没朋友
  18. JAVA工具类(17)--Java导入导出Excel工具类ExcelUtil
  19. 如何获取本地IP(收藏)
  20. 软件测试工程师面试题及答案

热门文章

  1. 【读书笔记】segment routing mpls数据平面-2
  2. JNI学习积累之三 ---- 操作JNI函数以及复杂对象传递
  3. 【转】DataGridView之为每行前面添加序号
  4. 截取usb数据包,控制usb设备----Relay设备
  5. 广东地区电信官方DNS服务器
  6. MyEclipse 代码自动提示功能失效 提示No Default Proposals 或 no completions available 的解决方法 转...
  7. Android应用--简、美音乐播放器增加音量控制
  8. 一个很好的反选的例子
  9. 【接口测试】axios测试接口
  10. 深度学习网络架构(三):VGG