【人机对话】对话的囧境?
点击上方,选择星标,每天给你送干货!
来自:李rumor
卷友们好,我是rumor。
人工智能对话系统一直是让我又爱又恨的存在,爱是因为一想到它的终极NB形态就令人兴奋,觉得自己在从事一门可以改变世界的技术,恨是因为现有的技术与期待相差太远,一旦框架搭起来了就陷入解case的死循环,让我怀疑我是谁我在干什么,我有生之年能看到强人工智能吗???
恰好最近看到Sebastian Ruder写了一篇QA的研究发展史,于是今天也来和大家唠唠QA研究以及国内的落地情况。
QA技术研究发展
如上图所示,Sebastian将QA的研究分为了5个阶段。
第一阶段是封闭域手工解析。这些系统的主要模块就是parser,和今天的semantic parsing任务很像,通过人工定义大量的规则,把句子解析成结构化的query后对数据库直接查询。1963年就有学者提出了Baseball系统来解答相关问题,之后是NASA在1972年提出的LUNAR,用于解答月球上岩石和土壤的问题。
第二阶段是开放域检索。这个框架也是当今大部分QA系统的解决方案,首先根据问题召回相关文档,再从文档中提取答案。不过考虑到速度与效果,现在的系统会提前把问题-答案对准备好,这就演变成了大部分智能客服使用的FAQ检索式问答。这种方法最早在1999年的TREC测评上被提出,2011年的IBM Watson也基于这个框架提出了更细致的pipeline。
第三阶段是阅读理解。研究者们开始把QA简化成阅读理解这样的监督学习问题,也就是给定一个文档和相关query,系统给出答案(也就是span抽取)。但这类数据集的构造基本都是看着答案写问题,直到最近(2019)才开始改成先写问题,再去找文档和答案,演变到了第四阶段的开放域检索+阅读理解。
第五阶段是多轮、多跳、多语言、生成、多模态。随着单轮问答的效果提升,简单query都解的很好了,但离人类还有很大差距。目前的学术界就在解答各个细分的复杂问题。
虽然学术界的进展已经很多了,但研究所用的数据集是没法覆盖现实的复杂情况的,同时深度学习模型的鲁棒性也一直是个大问题,因此目前工业界还在封闭域问答挣扎,即使是封闭域也要先对问题进行分类,应对各种长尾case。
对话能挣钱吗
对话的变现能力主要看能不能产品化。
产品化是指把能力打包成解决方案,首先要有需求,其次要有量,把一份东西卖给多个人,边际成本递减。
这个问题想清楚,就知道为什么ToB不好做了。国内16年开始涌现大批做NLP智能客服的公司,但到现在没有几个能出头的,我认为主要原因就是因为技术发展的限制,无法把FAQ技术产品化,导致换一个客户(换一个封闭域)之后都要从新训模型适配,而模型肯定是不够的,还要针对性的解各种case,这样人力成本就上去了,报价高的话只有大企业买得起,而CEO不一定有大企业的人脉,报价低只能自己倒贴钱吃融资,陷入负循环。
从这个思路来看,ToC似乎是更好的选择,现在看来的确也是。
ToC起码可以做到一份东西卖多份,但切对需求这个点同样重要。
国内最早最有名的莫过于小冰,但我个人感觉纯闲聊还是个伪需求,闲聊主要是情感上的交互,除了生理需要外,情感表达是需要信任和反馈的,如果明知道对方是机器,大部分成年人都不会进行深层交流,同时技术也不允许。
另一个需求就是目前比较成功的语音助理,一方面可以给用户提供信息,比如天气预报、时间,另一方面替用户完成任务,比如打电话、定闹钟、开关灯。国外做得好的有手机助手Google Assitant、Siri,以及亚马逊的智能音箱Echo。国内则有手机微软小娜、小米小爱、百度小度、天猫精灵。手机上的智能助理我有些存疑,但智能音箱我已经把自己说服了。
首先由于巨头前两年的补贴大战,音箱的普及一直在增长,而从使用感受来看,一旦习惯了“命令别人”,就真的很难改掉。比如我现在每天都需要某精灵给我放歌、定闹钟、预报天气,甚至还买了智能插座懒得自己关灯。另外随着国家政策支持(重点发展智慧家庭产品),一些新楼盘的精装交付都会带有智能家居,再加上自动驾驶的发展,大家会越来越习惯AI助理的存在。
从大趋势来看,我们已经走过了PC时代、互联网时代、移动互联网时代,接下来自然而然地便是IoT,基础设施的发展会产生更多的软件应用,对话作为人机交互的接口也会有用武之地。
总结
一直都在做对话、自然语言搜索相关的落地,直到最近才想清楚。虽然从技术角度来看很多事情还做不好,但发展毕竟是个过程,用户也需要培养,长期看依旧是值得进入的方向。
不过对技术人来说,赛道的选择与自身能力都是成功需要的因素,没有选择到热门赛道的同学也不用心急,把能力磨练好总能抓住一次机会。
今天就唠到这里,以上都是个人观点,欢迎讨论。
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
整理不易,还望给个在看!
【人机对话】对话的囧境?相关推荐
- 200块的烘干机 能破除潮湿天没内裤穿的囧境吗?
本文来自太平洋电脑网 到处都湿漉漉的,墙上.窗户上.地板上,甚至是呼吸的空气中,都潮的很,雾海茫茫. 阳台上晒得衣服一直没干,家里的衣服也堆积了快一个星期了. 再这样下去,内裤都没得穿了,愁得人心里发 ...
- 【一些随笔】艰难存折,恨不睡觉:大话年轻人的钱包囧境与退休梦想
一些随笔 1️⃣ 存钱难吗?难!它难在哪? 2️⃣ 关于年轻人如何攒钱理财的一点建议 3️⃣ 关于裸辞的一些经验及看法 4️⃣ 谁又不想攒够钱了提前退休呢?但要存够多少呢? 1️⃣ 存钱难吗?难!它难 ...
- 任务导向型对话系统——对话管理模型研究最新进展
作者丨戴音培.虞晖华.蒋溢轩.唐呈光.李永彬.孙健 单位丨阿里巴巴-达摩院-小蜜Conversational AI团队,康奈尔大学 对话管理模型背景 从人工智能研究的初期开始,人们就致力于开发高度智能 ...
- 微服务囧途之BFF层登场
从单体架构演化为微服务架构后,架构者的期望是"模块A"+"模块B" = "后端服务". 场景一 Web端和Mobile端都有一个详情页面,需 ...
- 囧时代的囧营销 营销 时代
囧时代的囧营销 营销 时代 21世纪最牛的一个字是什么?囧!这个在中国康熙字典里才有可能查到的字眼,却成为2008年最火爆的网络流行语之一."囧"字的本意是光明,却被网民们赋予了完 ...
- 一文说清AI智能平台
来源:海豚数据科学实验室 有一天,小李的领导说:"我们要做AI平台!". 虽然平台产品也不是新概念了,随着AI技术的成熟,AI平台产品也越来越多,但光凭做平台一句话,小李还是犯了难 ...
- 德国奇葩经历之护照丢失
2018年11月份来德国参加Percona Live 会议,可能这辈子都难忘吧! 觉得有必要记录下,文笔粗鄙,凑合着看吧. 01 法兰克福 2018-11-4 到达德国法兰克福机场,从机场到住处希尔顿 ...
- 数字如潮人如水:在这个时代,你是要当算法,还是当数据?
数字如潮人如水 社会学简介 定量研究 数据思维:用数据思考,让世界讲得通 一.感知数据 1.1 培养数据感:定性思考到定量思考 1.2 意义取决背景:输入看定义,输出看情境 1.3 让数据说话:如何发 ...
- 论 做 AI 芯片的正确姿势
https://xie.infoq.cn/article/d5ab8bea53fa8a08406fabf9d 论做 AI 芯片的正确姿势 作者:flow 2020-08-10 本文字数:14908 字 ...
- 知识付费「四大天王」走下神坛?
罗振宇们的"知识跨年"为何没看头了? Tech星球(微信ID:tech618) 文 | 杨业擘 "还是看了跨年演讲,不能说多期待认知升级,也许是潜意识中的学习仪式感在起 ...
最新文章
- 教程 | 理解和实现自然语言处理终极指南(附Python代码)
- 使用Docker Compose 部署Nexus后提示:Unable to create directory /nexus-data/instance
- float、double(浮点数)区别还有和decimal(定点数)的比较
- Python基础概念_9_输入输出
- python抓取中文网页乱码
- zabbix4.2 系列(二):agent配置
- Koa2+Mysql搭建简易博客
- 碳酸铈行业调研报告 - 市场现状分析与发展前景预测
- java经典源码 阅读_公开!阿里甩出“源码阅读指南”,原来源码才是最经典的学习范例...
- Keil软件的汇编使用
- Confluence 空间附件(Attachments )宏
- VS2010闪退的问题
- Mac电脑如何新建txt文档?
- Catalan Number(卡特兰数/卡塔兰数)
- 判断IE版本并给出提示升级浏览器
- linux僵尸程序,什么是僵尸进程(zombie)?
- 送小情人一个深海之声蓝牙耳机,樱花粉简直美得没朋友
- JAVA工具类(17)--Java导入导出Excel工具类ExcelUtil
- 如何获取本地IP(收藏)
- 软件测试工程师面试题及答案
热门文章
- 【读书笔记】segment routing mpls数据平面-2
- JNI学习积累之三 ---- 操作JNI函数以及复杂对象传递
- 【转】DataGridView之为每行前面添加序号
- 截取usb数据包,控制usb设备----Relay设备
- 广东地区电信官方DNS服务器
- MyEclipse 代码自动提示功能失效 提示No Default Proposals 或 no completions available 的解决方法 转...
- Android应用--简、美音乐播放器增加音量控制
- 一个很好的反选的例子
- 【接口测试】axios测试接口
- 深度学习网络架构(三):VGG