转载自:对话模型,DialogBERT和DialogWAE优势何在? - 知乎 (zhihu.com)

多轮对话生成一直是一项典型的NLP应用,并且在众多任务上取得成功。多轮对话问题一直面临两大挑战,即如何准确地学习对话历史的向量表示,以及如何更好地学习应答与历史之间的关系,以保证对话的连贯性。

围绕这两大主题,讲者分别提出一种针对多轮对话生成的预训练模型DialogBERT和多模态应答生成模型DialogWAE,前者采用层次化BERT构建句子级的连贯关系,并提出两种预训练方法:掩藏句编码回归和分布式句子顺序预测;后者采用高斯混合先验生成对话,提高对话的多样性和丰富性;对比实验验证了讲者所提策略能更好的获得语义更丰富,更加连贯的应答。

一、对话模型面临的两个挑战

开放领域的对话生成是一项典型自然语言应用问题,可概括为基于对话历史(即,上下文),采用机器学习算法,预测下一句对话。目前解决该问题的方法主要围绕图1所示的框架展开研究,首先给定模型一段对话历史,然后采用深度学习的方法学习对话历史的语义向量,最后通过构建对话历史与应答间的语义关系实现应答生成。上述过程存在两个挑战:

a.由于对话历史通常很长,信息量大,这对将对话历史表示为精确的语义向量带来很大困难;

b.如何学习应答与对话历史之间的关系,以保证对话的连贯性。

图1.对话模型常用框架流程介绍

二、DialogBERT预训练策略

1、问题概述

针对第一个挑战,如何学习复杂上下文的语义向量?近期的相关研究是采用预训练语言模型来处理对话历史,比如,Transformer、GPT2等。

其缺陷之一在于:模型将对话历史看作一个较长的单词序列(通常,前句和后句间具有非常连贯的语义),但对话中句子间存在多种关系,比如转折等,因此很难将对话历史看作是很长的文本序列处理;

缺陷之二在于:基于自注意力机制的Transformer模型,关注的是单词层级的相关性,而不是学习句子间的连贯性。该策略难以准确获取句子层级的连贯关系,并且在时间上很低效。

基于此,讲者提出DialogBERT模型,即采用层次化BERT模型的思想,学习长序列对话上下文丰富的语义,如图2所示。首先使用句子级别的编码器学习每个句子的向量;然后将每句话的向量作为篇章级编码器的输入,从而学习句子间的语义关系。同时,讲者提出两种预训练策略:隐藏句子回归以及分布式句子顺序预测。

2、训练策略

训练任务一:隐藏句子回归。首先是对层次化BERT模型得到的隐藏变量进行解码,以生成目标应答,如图3所示。

图3.应答生成

然后随机mask一些句子,再通过训练编码器以复原被mask的句子。讲者提出从向量的角度做回归,即对mask的句子进行编码得到的向量,与经过预测得到的向量做均方误差。

图4. 隐藏句子回归

训练任务二:学习句子顺序。指将原始句子顺序打乱,然后预测句子的顺序,但现有的工作是将句子的每一种排序作为一类,通过分类模型进行训练。其局限性在于,对句子排列组合得到非常多的句子序列,且存在大量重复排序,比如,某两种排序中,只有最后两个顺序对调, 这两种排序仍然是高度相关的,而简单的分类模型难以捕捉这种相关性。

讲者提出分布式句子顺序预测方法,即将encoder得到的句子向量通过排序网络对每句话打分,然后按照分数对句子进行降序排列。在该过程中,训练目标是衡量由softmax得到句子顺序的概率分布与目标顺序分布间的距离,即采用KL散度表示。

图5. 分布式句子顺序预测

3、实验验证

实验所用数据集、评价指标以及baseline 模型如图6所示。

图6.实验数据集、指标以及baselines介绍

通过定量实验分析结果可知,将应答生成、隐藏句子回归以及分布式序列预测这三项组合,可以得到更好的效果。

图7.实验结果

进一步,讲者进行消融实验来验证不同模块对实验结果的影响,图8上表是对不同大小的上下文编码器进行对比实验,即取不同Transformer层数时的实验结果表明,层数大小对编码结果影响不明显,即上下文编码器很容易识别上下文的语义关系。

图8下表是指与其他预训练策略进行对比,实验结果表明采用分布式序列预测比全局分类具有非常大提升。

图8.消融实验对比结果

最后,随机选取200个对话,由Amazon的Crossing平台进行人工评估,结果表明讲者所提策略能学习到更连贯更具信息量的应答。

图9. 人工评估结果

从MultiWOZ数据集上的实验可知,讲者所提策略能得到更具信息量的回答;在DailyDialog数据集上的实验表明,所提方法能够生成更连贵,同时具有信息量的应答。

图10.示例研究

对话模型,DialogBERT和DialogWAE优势何在?相关推荐

  1. 30、40多岁的人互联网创业优势何在

    摘要 : 现在80后互联网创业已经OUT了,85后,90后直接上,那么70后80后的人互联网创业还有优势吗?还记得 facebook以10亿美金收购的Instagram吗?其创始人没有计算机学位,没有 ...

  2. MD毛豆新发现的优势何在?_彭世瑜_新浪博客

    有人问 我,现在又hao123还有360导航,我的导航优势何在?我也在思考这个问题,我的导航,我觉得我没有过多的负担,我不需要去花大量的篇幅去推广自己的产品,我可以做到没有立场,360导航放hao12 ...

  3. 解读红帽的云计算战略 云端之争优势何在(1)

    解读红帽的云计算战略 云端之争优势何在(1) 出处:CIOAge.com 文: 编译:赵哲婷 评论( 1 )条 论坛 博客 导读: 红帽的云产品并不会将你锁进这个云堆栈中.相反,它们允许你建立一个可以 ...

  4. 机器学习,就用Python!五大专家详解其优势何在

    编译 | AI科技大本营(公众号ID:rgznai100) 参与 | 林椿眄 编辑 | 明明 [AI科技大本营导读]Python 语言是机器学习领域最优秀的编程语言之一,现在它正挑战着 R 语言在学术 ...

  5. 【SVAC】国标SVAC对飙通行标准,优势何在?

    ###Date:2018.5.27 ==================================================================== 原文出自[安防知识网] 转 ...

  6. 国标SVAC对飙通行标准,优势何在?

    经过2.3年的筹备,H.265正式于2016年展开全面攻势,开始铺开了全产品线.与H.265的来势汹汹不同,SVAC 2.0仍在完善中,国产编码主要仍是通过SVAC 1.0坚守阵营.按说不同等级两个标 ...

  7. thymeleaf模板引擎的优势何在?

    如今spring boot 的火爆程度到了想避开,想不闻都不容易.几大主流IT资讯网,随便浏览下都能看到相关的资讯.还有一个特点就是某一技术.应用火爆了就铺天盖地的报道来了,各种花式赞誉.好像你不学, ...

  8. 港服优势何在?游戏公司为什么选择香港服务器?

    在人工智能.物联网和自动驾驶汽车的热潮中,电子游戏一直在以指数级的速度悄然增长.到 2022 年,该行业有望增长到 2000 亿美元,而竞争激烈的电子竞技赛事将同比增长 40%.然而,游戏创新和开发的 ...

  9. 北大青鸟网络工程师培训毕业生优势何在?

    北大青鸟网络工程师培训毕业的学员和大学毕业生做一个比较. 1. 理论知识 大学毕业生理论知识丰富,一直是大学生引以为傲的,其实说丰富不如说是广泛,的确,学的广泛,涉及到哪一方面都能有所了解,但是仅仅是 ...

最新文章

  1. angular.animation的使用
  2. ofo引入信用分评系统 ,0分将被禁止使用
  3. UI Component in CRM WebUI and Hybris
  4. Redis 再牛逼,也得设置密码
  5. 【对象程序设计面向】虚继承
  6. 深入理解css优先级
  7. xp做打印服务器 找不到驱动,XP系统安装打印机驱动提示找不到指定的模块怎么办...
  8. rsa php前台加密后台解密源码,使用RSA实现前端公钥加密后端私钥解密
  9. mooc作业怎么上传附件_中国大学MOOC最新考试系统(老师视角)增加学生作弊成本...
  10. JavaScript【面向对象】-静态方法-私有方法-公有方法-特权方法
  11. Linux下如何查找sqlnet.ora 和listener.ora 和tnsnames.ora 配置文件的目录
  12. SET-Priority_Queue
  13. 阿里云云计算 23 VPC的基础架构
  14. yuki翻译器钩子_YUKI游戏翻译工具下载 YUKI GALGAME翻译器v0.14 最新版
  15. 腾讯互娱面经-游戏客户端开发
  16. Qt编写自定义控件56-波浪曲线
  17. 2022-2027(新版)全球与中国鱼藤酮行业发展动态及前景展望报告
  18. 微信小程序合集源码I(机器人聊天+仿别踩白块儿小游戏+仿步步高电子词典+仿知乎+日记+汉字拼音+转盘抽奖)
  19. linux的批处理文件怎么写,Linux下批处理文件编写
  20. Java笔试的各种输入总结

热门文章

  1. 网络映射iscsi服务器,群晖iSCSI管理器连接网络硬盘详细介绍和配置使用说明
  2. Android计步器
  3. 密码就快要彻底消失了,没有人怀念它
  4. ca盘显示无证书_CA根证书无法识别
  5. python 判断是否有某个属性_python如何判断对象的某个属性
  6. MySql ORDER BY排序用法
  7. office2016、visio2016和project2016安装指针
  8. project下build.gradle文件和module下buil.gradle
  9. SAP的萨班斯法案SOA解决方案
  10. 详细介绍NLP对话系统