近年来,智能机器人客服已经在各行各业发挥作用,替代人类更有效率地处理繁杂的事务。

但是,不可否认的是,目前市面上大多数智能客服并不能完美满足用户的需求,如难以处理未经过训练的场景问题,无法理解复杂的人类语言结构等。在技术和商业化应用上,智能客服背后的NLP和语音技术虽然已经取得了很多进步,近年来却鲜有突破性进展,成功的商业化应用仍然屈指可数。

如今,NLP和语音技术在商业化应用上遇到了哪些瓶颈?为何迟迟没有大的进步?解决问题的关键在于哪里?或许我们可以通过智能对话机器人的典型代表——腾讯知文问答系统,发掘当前智能对话机器人破解行业应用难题的答案。

知文背后的团队

经过腾讯最近一次组织架构大调整之后,知文团队从原来的SNG事业群归入了新成立的云与智慧产业事业群(CSIG),但服务和支持的相关产品和业务不变,包括腾讯云、QQ、QQ空间等。这一团队目前的研究重心,也依然放在自然语言智能交互,围绕智能交互的内涵和外延,学术研究则包括但不限于问答、对话系统、文本摘要、知识图谱、机器阅读理解等。

作为知文团队的技术负责人,钟黎主导了知文智能问答平台、知文NLP平台以及知文内容理解产品的研发工作。在此之前,他曾负责腾讯社交网络的文本分析与语义挖掘,为众多相关产品和业务提供语义分析能力。他拥有丰富的大规模机器学习应用经验,曾经在微软、PayPal、SoftBank AI Lab、IBM Research等公司任职,并参与过机器人NAO及Pepper的原型研发、Watson智能会议助理研发等。

知文系统技术架构与四次迭代

根据钟黎的介绍,腾讯知文问答系统主要可以分为四大层次:

第一层:应用层,包括智能客服机器人、智能外呼机、投诉引导机器人、任务查询机器人等各类具体业务场景机器人。

第二层:接入层,包括公有云、私有云、私有化部署等多种接入方式。

第三层:核心问答引擎,包括信息问答、知识图谱问答、任务型问答、文档型问答以及多轮交互等技术模块。

第四层:基础能力层,包括数据能力(行业与领域数据、知识库管理、迁移学习),NLP能力(基础NLP算法组件),深度学习能力(复杂模型优化、深度学习工程化),数据分析能力(自动分析与监控、趋势分析、问题预测)等。

经过数次迭代,知文不断调整优化知文的架构,以为用户提供更好的体验。钟黎告诉AI前线,知文的发展路径整体来看是实际业务需求驱动的。最开始是缘起内部业务关于客服的工单统计和分类的需求,辅助人工客服。之后,团队发现其实可以用问答技术去解决大量频繁、重复又比较简单的问题,以减少人工客服的问询量。随着时间的推移,知文团队又遇到新的业务需求,即没有工单,而是有比较多知识和文档的场景,因此又逐渐引入知识图谱技术、机器阅读理解技术。目前,知文的研究重点,一方面是在无标注数据或者少量标注数据下,知文问答平台可以快速高效冷启动的方案,另一方面是多轮会话下解决用户意图在多个机器人间来回跳转的问题。

在规模和应用上,知文系统已经支持了5大行业的智能客服,得到20多家行业头部客户的采用,包括中国银行的新一代客服机器人项目,以及由腾讯CEO马化腾亲自站台的“一部手机游云南”项目。

经过架构的不断优化,知文核心问答机器人架构至今已经过四次迭代。钟黎介绍道,这四大核心机器人主要是指信息问答机器人、文档阅读理解机器人、任务执行机器人以及知识图谱机器人,但具体的迭代路径、方法和思考,钟黎表示将会在AICon上揭晓。

知文在NLP和语音技术上的突破

NLP和语音在技术上仍然有很多亟待解决的问题,为解决这些问题,知文问答系统做出了诸多优化和创新。例如,在核心的问答匹配上,其匹配模型引入了ELMO表示、词图卷积、intra/inter-attention机制、位序损失、GLU通路等,比当前主流的匹配模型如MatchPyramid、AICNN、BiMPM等有更好的表现。在文档阅读理解上,知文问答模型引入了template answer guiding以及tree-based spanning,突破了大部分学术论文只能做答案在原文中完全匹配且完全基于监督数据的方法。在任务型问答上,知文问答模型在end-to-end的记忆网络上进行了知识增强,对于多轮的任务型场景,模型能够有效地记忆更长的会话信息和槽位状态。

对于一家企业来说,打造一个能够满足用户大多数需求的问答机器人绝非易事,在技术和落地上均会面临很多挑战。钟黎告诉AI前线,知文团队在打造智能问答平台的过程中遇到过很多技术难点,在业务落地上也是如此。

其中,知文在业务落地中常见的难点,第一个就是业务方往往没有大量的标注数据。智能问答平台里包含了多个算法模型,如果每个都是监督模型的话,意味着在上线之前需要“喂”进去大量的监督数据,这对于业务方来说是很大的标注负担。第二个问题,就是业务方往往没有特别地进行知识库管理,大多数是一些历史工单或者FAQ问题,这些数据的结构化程度还不够高,没有形成知识图谱或者层级关系。基于这些数据做多轮和反问交互,对知文来说是一个挑战。针对这些问题,知文平台在数据标注方面采用了few-shot learning的思想,并通过迁移学习的方式,如表征迁移、模型框架迁移等,极大地降低了业务接入的数据门槛;另一方面,在无结构知识库管理上,知文平台通过自动图谱构建、动态子图生成的方式,实现通用多轮和反问的交互方式。

NLP与语音未来趋势

NLP与语音交互融合协作

腾讯知文问答系统的背后,是NLP和语音技术相结合的技术在提供支持,这呼应了业界有人提出的观点:NLP与语音交互技术已然从独立技术,走向融合协作的道路。对此,钟黎认为,NLP与语音技术本身有着紧密的联系,语音技术的很多模型也在NLP里得到了广泛应用。一个完整的自然语言交互方案,必然需要同时融合语音和NLP的技术,例如一个典型的流程,从用户语音query进来,要经过语音唤醒、ASR、NLU、QA、NLG、TTS等最后返回语音回答给用户。腾讯知文的自然语言交互方案,现在也是正在从基于文本NLP技术,到融合语音的完整自然语言交互技术。未来,一个更加自然、功能强大的智能语音交互产品,必然是充分融合了NLP与语音技术的成果。

表征与框架层迁移学习:无标注数据也是宝藏

虽然,NLP和语音技术在最近几年在技术和应用上鲜有突破,但随着更多研究人员和企业、组织进入这一领域,相信在未来,这一领域将酝酿出新一轮爆发和突破。

关于NLP技术未来发展的趋势,钟黎认为近期NLP领域值得关注的趋势是表征与框架层的迁移学习,包括之前的word2vec、glove,Al2的ELMO,OpenAI的GPT, Fast.AI的ULM,以及Google的BERT,迁移学习从底层表示的迁移、语言模型的迁移,转变到了模型框架的迁移。

这其中,他重点强调了谷歌提出的BERT模型。“通过海量无监督数据的预训练,只需要在特定任务上对最后一层进行task-specific的修改,就能取得很好的效果,目前已经在数十个任务上验证了其有效性。这对于工业应用是很大的福音,尤其对于小数据的任务,我们只需要通过小数据来fine tune最后一层,也能取得很好的效果。在NLP领域,大量的无标注数据的潜力尚待挖掘,这些迁移学习的方法在一定程度证明了无标注数据也是宝藏。非常期待在自然语言领域无监督学习、小样本学习能够取得更多突破。”

新的落地场景:多模态内容分发、普适计算下的语言交互

落地,是所有技术最终的归属,无法落地,再好的技术也无用武之地。钟黎认为,NLP其实不是新事物,在互联网的落地应用上应该算是其他AI方向的“前辈”,从门户和搜索引擎时代开始,NLP就一直是核心技术。

现在来看,NLP技术有两个新的落地场景值得重点关注:一是多模态内容分发与内容消费,包括各种信息流、资讯圈等,大量的信息处理、聚合与触达,都广泛依赖NLP技术。另一个是普适计算下的自然语言交互,包括各种云+端的设备,例如手机、车载、音箱等等。

“人机交互的革命暗潮涌动,自然语言的方式将会在越来越多的场景发挥作用。”展望未来,钟黎如此说道。

福利时间

钟黎将会在12月份AICon大会上做精彩分享,想要跟他进一步交流的童鞋可到现场面基。

另外大会还邀请到了来自Google、微软、亚马逊、BAT、360、京东、美团、小米等40+国内外一线AI技术负责人前来分享他们的机器学习落地实践经验,除此之外,还有知识图谱、NLP、语音识别、搜索推荐、计算机视觉、AI架构等热门技术,干货满满。

目前大会8折售票倒计时2周,团购更优惠,点击这里了解更多详情。如有任何问题,可咨询票务小姐姐:18514549229[微信同号]

剖析腾讯知文,智能问答机器人路在何方相关推荐

  1. 报告 | 腾讯知文,从0到1打造下一代智能问答引擎【CCF-GAIR】

    图片来源于雷锋网 雷锋网: 关于自然语言处理NLP和自然语言理解NLU研究到底到了哪一阶段?还有哪些亟待突破的技术难点?接下来又将产生哪些服务于大众的应用? CCF-GAIR 2018 大会NLP 专 ...

  2. mxm智能教育机器人无法智能对话_零代码使用腾讯TBP打造智能对话机器人

    点击观看大咖分享 心疼你独自一人承担生活的苦难,寂寞夜里陪伴你的只剩无人倾诉的压抑和无处安放的焦虑.养个宠物,它却不能get到你的"宠言宠语".找个伴侣,还要浪费吵架的时间和精力. ...

  3. python知识点智能问答_基于知识图谱的智能问答机器人

    研究背景及意义 智能问答是计算机与人类以自然语言的形式进行交流的一种方式,是人工智能研究的一个分支. 知识图谱本质上是一种语义网络,其结点代表实体(entity)或者概念(concept),边代表实体 ...

  4. 基于知识图谱的智能问答机器人

    研究背景及意义 智能问答是计算机与人类以自然语言的形式进行交流的一种方式,是人工智能研究的一个分支. 知识图谱本质上是一种语义网络,其结点代表实体(entity)或者概念(concept),边代表实体 ...

  5. 开发一个智能问答机器人

    近期开发了一套基于自然语言处理的问答机器人,之前没有做过python,主要做asp.net,写这篇目的是给想要开发这类智能客服系统的朋友提供一个思路,项目已经上线,但在开发和设计过程中仍然有很多问题没 ...

  6. 实现一个微信公众号智能问答机器人

    前言 实现一个微信公众号智能问答机器人.(注:该项目开发并不复杂,但是需要的前提条件较多,需要有一定经验的开发人员才能吃透这篇文章) 1. 前期准备 注册一个微信公众号(如果没有可以用微信官方测试的公 ...

  7. 七月Z星月度速览 | Milvus 源码解析重磅来袭、学术直播间开播、Milvus 社区在线答疑会重启、智能问答机器人上线……...

    #July Z星月度速览 · 小 Mil 来了!Milvus 智能问答机器人上线 · Zilliz 合伙人.工程总监栾小凡与社区分享首期 Milvus 底层源码架构解析 · Milvus 社区发起首期 ...

  8. Android之智能问答机器人

    本文主要利用图灵机器人的接口,所做的一个简单的智能问答机器人 实现 由于发送与接收消息都是不同的listView,所以要用有两个listVeiw的布局文件 接收消息布局文件 <?xml vers ...

  9. 如何使用智能问答机器人服务

    以某企业的IT呼叫中心为例,此呼叫中心每天都要为企业内部员工解答大量的IT问题,其中包括大量重复回答的问题.为了降低运维成本,该呼叫中心开始使用华为云CBS智能问答机器人来问答IT问题. 本文介绍了购 ...

最新文章

  1. AMD规范:简单而优雅的动态载入JavaScript代码
  2. python画同心圆程序_python – matplotlib:如何在给定的半径范围内绘制同心圆
  3. 【剑指offer - C++/Java】7、斐波那契数列
  4. Docker,使生信分析更简单、可重复
  5. qt android 设备权限,QtScrcpy: Android实时投屏软件,此应用程序提供USB(或通过TCP/IP)连接的Android设备的显示和控制。它不需要任何root访问权限...
  6. Linux学习笔记---使用BusyBox创建根文件系统(二)
  7. c语言220程序,电赛必备220个C语言实例源码分享
  8. 【面试题】百度糯米java工程师面试
  9. 汇编语言和C语言单片机哪个更好用?
  10. 如何保持MacBook电池健康并延长其使用寿命?
  11. Opencv之高效函数convertTo
  12. 龙ol服务器维护补偿boss,龙OL低级稀有BOSS刷新点
  13. hough变换直线方程推导
  14. 中国步进电机市场现状研究分析与发展前景预测报告(2022)
  15. HTML班级网站实例(笔记2)
  16. 使用标准输出流(system.out)和打印流 (PrintWriter)来读取txt文件
  17. 磁滞回线magnetic hysteresis loop
  18. 虫子满屏爬_三bug多线程示例程序浅析
  19. linux服务器缓存环境memcached搭建及应用(java)
  20. 用java编写数组最小公倍数_java求多个数字的最小公倍数

热门文章

  1. 0814 LVGL汉字引入
  2. 翻译Stairway to SQL Server Security Level 3: Principals and Securables
  3. SQL学习经验总结(第一期)共6期
  4. 搭建恋爱话术库一个月赚5万,一年全款车!投入不到两千
  5. 中科呐喊WiFi热点广告机,WiFi营销及创意展示神器
  6. Nginx 实现OCSP Stapling
  7. JDBC之MySQL的URL
  8. 河南计算机二级报名的流程,2020年9月河南计算机等级报名程序是什么
  9. 女人最不动声色的诱惑招数
  10. ansible常用模块应用