分享 UNIT 核心技术的,是百度理解与交互技术平台(Understanding and Interaction Technology, UNIT)的技术负责人孙珂,他着重讲解了百度在理解与交互方面所做的工作,同时也介绍了背后的核心技术。

要明晰什么是 UNIT 技术,先看对话系统最简单的组成部分。

首先,当用户通过语音说出一条需求后,首先要经过 ASR 进行语音识别,转成文字,之后会进入语言理解(NLU)的部分,将文字中蕴含的”意图”和”词槽”提炼出来,并通过对话状态管理(DST)将其与历史的对话状态进行整合;此后计算机需要根据当前的对话状态,通过动作候选排序(POLICY)从后台用户配置的多个系统动作中,选择一个最符合当前状态的。得到应该执行的动作后,对话系统会再通过语言生成(NLG)和语音合成(TTS),与用户做出互动。

而在语言理解地部分,孙珂进一步解释道,要精准地让机器理解,重点是把握“意图”和其中的”词槽”。

通俗的来讲,要想理解一句话,光是看懂每个字是不够的,需要理解它背后所蕴含的需求和指令并将其转换为计算机能够识别的表达形式,这就是语言理解(NLU)。以“今晚六点帮我在全聚德预约一个包间,十个人”这句话为例,UNIT的NLU模型可以分析出来,其意图是要预定餐馆。同时其中还包含一些关键的条件信息,如餐厅是全聚德,时间是6点,这些叫做词槽。

除了语言理解之外,要想打造一个较为完善的对话系统,交互能力也是不可获取的。孙珂介绍了UNIT提供的两种交互能力:澄清与推荐。所谓澄清指的是,当用户的需求中缺乏一些必要条件时,需要对话系统主动发问,把必要条件全部集齐之后再去做最终的满足执行。而所谓推荐指的是,当用户订了餐厅后,机器还应帮他推荐打车的服务,例如把“您还需要叫车吗”这样的需求,主动引导出来,完成场景的关联。

UNIT 除了面向精确意图与词槽解析的对话能力之外,还提供了面向问答匹配的对话能力,可以满足对用户提供的问答资源进行直接匹配检索的需求。当然,对于一个完整的对话系统而言,问答匹配也不仅仅是理解,也需要有交互能力的配合。

例如,在智能客服的场景中,用户提出的第一个问题可能并不精确。他可能一开始只会说想贷款,这个时候,对话系统是不可能将所有贷款相关的问题都反馈给用户去做选择的,而是应该像电话客服一样,一层一层深入地将用户引导至他最想要了解的部分。

两种对话理解的能力,和与之配套的交互能力,构成了整个 UNIT 对话理解能力的全貌。

对开发者而言,更关心的可能是 UNIT 的整体框架。孙柯介绍道,UNIT 整体框架包括两个主要模块,一个是学习模块,一个是在线服务模块。

其中,学习模块包括有快速生效、持续优化、预置能力、对话逻辑四种能力。

从流程上来讲,开发者从学习模块开始,需要定义自己的场景、词槽等,并提供一定量训练样本等,并最终通过这个模块学习出自己的对话模型。对话模型学习好之后,可以推送到在线服务模块中。在这里,在线服务模块会整体理解用户的当前需求与历史状态,完成意图和词槽的解析工作,并通过后继的对话状态管理和候选动作选择模块完成对话动作的选择。最终得出的动作可以被开发者在本地用于完成函数的执行和资源的整合,并最终生产出对用户的回应。

具体到这背后的核心技术,孙珂首先讲解了多引擎驱动的 QUERY 理解与匹配技术,它能够让机器快速获得理解与匹配能力,并且持续优化。

孙珂解释说,目前UNIT提供的系统词槽识别能力有20多种,与之搭配的是词槽灵活的组装能力。举例而言,系统提供了一个识别“明星”的词槽,开发者有一个很喜欢的明星,但是机器不认识,这种情况下可以把名字作为词典或规则,与系统词槽进行组合并整体完成识别输出。此外,UNIT平台还预置有十余个对话场景,如天气、商超、地图、外卖等,预计近期会开放给第三方使用。

此外,UNIT还提供了基于海量用户数据的训练数据的扩展能力,并在其中整合了主动学习的能力,帮助开发者更加快速、精确的优化自己的理解模型。

基于一个传统的双向 GRNN 和 CRF 的意图识别网络,UNIT 进一步增强了对知识的整合能力。比如对于“北京明天下雨吗”这样的一条 QUERY,UNIT 会在词输入的基础上,将其进一步转化为知识,并融入到系统之中。目前,融合了知识的理解模型可以帮助开发者用更少的语料得到更好的理解模型,减轻开发者的数据标注成本。

什么是零门槛的训练师模式?

开发者定制一个任务机器人,用来与用户进行交流。但是UNIT在这其中,增加了响应用户反馈的逻辑,努力让对话变得更加顺畅,让用户更轻松的纠正任务机器人的错误,完成所求。同时也完成了对错误的学习,纠正一次,再也不会犯同样的错误。

雷锋网(公众号:雷锋网)了解到,UNIT 在对话流管理方面,也提供了大量的定制化功能。例如,对话单元与对话单元之间,对话单元与问答单元之间,都可以通过定制规则进行串联与引导。同时,UNIT 的对话管理也可以很轻松的完成意图切换、意图澄清、词槽切换、词槽澄清等对话功能。所有的对话流程管理,都被梳理为衔接规则,用户可以针对当前或历史对话、意图词槽去完成存在、包含、等于等对话跳转规则的定制。

孙珂最后说:

如果期望对话系统的效果达到预想中的智能程度,我们需要耐心的使用 UNIT 平台去一点点打磨自己对话系统的效果。通过 UNIT 提供的众多优化手段,开发者可以有选择地组合使用,通过提供相应的必要的数据,来完成理解效果从快速生效到持续优化并最终实现质变的突破。

百度 UNIT 技术负责人揭秘:如何让你的对话系统更智能相关推荐

  1. 百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率?

     百度语音识别技术负责人李先刚:如何利用Deep CNN大幅提升识别准确率? 机器之心mp 2016-11-04 14:24:34 技术 百度 阅读(440) 评论(0) 机器之心原创 作者:赵云 ...

  2. 每日新闻 | Google AI 负责人Jeff Dean:机器学习让计算机更智能

    点击蓝字关注我们更多精彩,请点击上方蓝字关注我们! 每日新闻播报 第07-10期 1 趋势洞察 Google AI 负责人Jeff Dean:机器学习让计算机更智能 7月10日下午消息,今日在&quo ...

  3. AI视频识别涉及哪些技术?多场景应用让视频监控更智能

    AI视频识别技术是计算机视觉中增长最快的领域之一,基于AI算法对视频内容进行检测分析,通过提取视频中的关键信息,进行标记或者相关处理,并形成相应事件的处理和告警. 一.AI视频分析技术的优势 基于AI ...

  4. 百度UNIT使用的步骤与自己的一点简单理解(下)

            最近项目需要语音上下文对话,找了几家都没有找到可以定制个性化上下文场景对话的技术,一般都是固定场景的对话,刚好,百度近期推出了UNIT技术,感觉刚好可以实现功能,可能需求与UNIT技术 ...

  5. 揭秘网站SEO快排中的百度发包技术的原理是什么?

    2019年SEO快速排名发包技术及原理,百度的<惊雷算法>明确的说到了禁止点击排名,对点击作弊大力度的打击.但依然有不少的商家在做这类快速排名的服务,2019年SEO快速排名发包技术及原来 ...

  6. 腾讯云机器学习平台技术负责人:揭秘深度学习平台DI-X背后的秘密

    本文转自:https://news.cnblogs.com/n/566061/ 腾讯正式发布了旗下深度学习平台 DI-X(Data Intelligence X),这是继今年 1 月推出 FPGA 云 ...

  7. PaddlePaddle应用于百度视觉技术的工程实践

    深度学习的出现,某种程度上改变了我们对计算机视觉的定义.而PaddlePaddle是百度开源的深度学习框架,它是如何支持百度视觉技术,有哪些工程实践,这篇文章将由百度视觉技术部主任研发架构师刘国翌为大 ...

  8. 腾讯研发总监王辉:十亿级视频播放技术优化揭秘

    QQ 空间在 2016 年日均视频播放量由年初的千万级迅速突破到十亿级,过程中也对整个视频播放技术的可靠性.性能.操作体验等方面提出严峻的考验,相关质量急需提升.经过多个迭代持续和各项优化,外网整体质 ...

  9. “集百度AI技术之大成的终极硬件形态”发布

    李根 问耕 发自 东三环 量子位 出品 | 公众号 QbitAI 2017百度世界大会主论坛刚刚落幕. 结尾迎来高潮. 今天上午的最神秘的发布,是百度的首款AI硬件产品. 这次的百度世界大会,为这款产 ...

最新文章

  1. HTML+CSS布局技巧及兼容问题【阅读季】
  2. 汇聚6年思想变迁:知识图谱报告幻灯片大全
  3. SAP Variant Conditions in Purchasing using reference characteristics【中英文双语版】
  4. 关于Python正则表达式的问题
  5. 访问外部扩展C语言编程,单片机C语言编程(系统扩展IC)8.ppt
  6. 初学者学python好还是c-学Python还是学C?
  7. HDFS依然是存储的王者
  8. 解决远程主机不能cv问题
  9. Directionally Localized Anti-Aliasing
  10. 多智能体深度强化学习——MADDPG算法代码分析(tensorflow)
  11. 【笔记】分布式网络与分布式账本
  12. J2Cache以RabbitMQ作为消息通知配置
  13. 完全java实现一款开源的报表工具简表(JOR)
  14. 假如斯诺登生活在2023年
  15. css交集选择器的使用
  16. [Android][sensor][mag]指南针方向偏差,软磁三轴调整
  17. 求极值函数-MATLAB
  18. Java课设设计-家庭财务管理系统
  19. SuperMap 产品安全白皮书
  20. 【为什么换了固态硬盘电脑会快?详解硬盘与内存的关系】

热门文章

  1. java selector 源码_基于selector的源码分析和理解、思想和应用实践
  2. figma导出android切图,谁再说Figma没办法导出标注和切图,你把这个插件转发给他...
  3. 计算机if函数and,excel if_EXCEL函数IF()+()和IF(and)区别是什么?
  4. 高性能mysql 第六章_高性能MySQL 第六章
  5. centos72安装mysql配置密码_MySQL数据库之170419、Centos7下完美安装并配置mysql5.6
  6. java正则表达式的基本语法以及不同环境的表单验证
  7. android opencv hu moment,学习OpenCV:hu矩
  8. C++ new和delete(C++动态分配和释放内存)
  9. pandas Series DataFrame 丢弃指定轴上的项(三)
  10. 深度学习核心技术精讲100篇(四十)-微信“看一看“内容理解与推荐,背后深层次的技术知多少?