[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study?
摘要:
为了发现对话历史是否真的被有效的利用了,本文介绍了10种干扰来评测对话历史是否真正被利用。发现transformer-seq2seq 和rnn seq2seq并没有很好地利用这些信息
主要工作:
首先有一个前提:如果模型对于对话历史的改变不敏感的话,那么他基本上没有利用多少对话历史。
在之前的工作中已经发现:
- 1.lstm的作用范围只被周围的大约150个词所影响
- 2.无论是生成摘要还是机器翻译,生成并没有利用好前面所携带的信息
- 3.rnn长距离依赖要比transformer好,transformer适用于词义消歧
本文要测试transformer,rnn,以及是否加attention对于对话历史的利用
实验:
其中x1,x2,...xn是对话历史,如果是A,B两个人对话的话,相当于A的所有话,yi表示B之前说的话,现在要利用A说的所有话和B在第i句之前的所有话来预测第i句的概率。通过这个loss函数来优化。
扰动类型分别对于句子和词语有:1.随机打乱句子顺序 2. 将对话翻转顺序 3.随机删掉某些句子 4.保留最近的K个句子
实验结果:
结论:
- 在大多数情况下模型在困惑度上只有很小的改变,甚至当改变非常明显时也变化不大,这意味着模型使用的信息只是提供给他们的信息中很少一部分。
- transformer 对词序的变化不敏感,这意味着他们能学习词袋表示
- 注意力机制的使用使得模型使用更多的来自于对话早期的信息(当只使用一句话时困惑度增加的非常剧烈)
- 尽管 transformer 模型收敛更快且有着更低的困惑度,但是他们似乎不能捕捉到对话历史中的动态变化且对扰动不是很敏感
一句话总结:
用一系列实验证明了,当前的模型对于dialogue history的利用并不多。可以利用这些实验作为对NLG生成的一个eval。
[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study?相关推荐
- 《Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study》
https://zhuanlan.zhihu.com/p/73723782 请复制粘贴到markdown 查看器查看! Do Neural Dialog Systems Use the Convers ...
- CHAPTER 24 Dialog Systems and Chatbots
CHAPTER 24 Dialog Systems and Chatbots Speech and Language Processing ed3 读书笔记 Language is the mark ...
- 论文阅读笔记:Recent Advances and Challenges in Task-oriented Dialog Systems
提示:阅读论文时进行相关思想.结构.优缺点,内容进行提炼和记录,论文和相关引用会标明出处. 文章目录 前言 Abstract Introduction Modules and Approaches E ...
- 【任务型对话系统】Database Search Results Disambiguation for Task-Oriented Dialog Systems
链接:https://arxiv.org/pdf/2112.08351.pdf 简介 在任务型对话系统(task-oriented dialog systems)中,有时我们会遇到这样一个问题: 对于 ...
- 二值网络训练--A Empirical Study of Binary Neural Networks' Optimisation
A Empirical Study of Binary Neural Networks' Optimisation ICLR2019 https://github.com/mi-lad/studyin ...
- ICDM 2020 Workshop on Neural Recommender Systems
ICDM 2020 关于推荐系统的研讨会(Workshop)征稿 "推荐系统中的神经网络算法及理论"的国际研讨会将于2020年11月17日在意大利索伦托(暂定)与数据挖掘国际会议I ...
- Towards Emotional Support Dialog Systems论文笔记
文章目录 一,基调 二,情感支持框架 (一)情感支持和共情的区别 (二)情感支持的三个阶段 (三)情感支持的范例 (四)情感支持中的八大策略 三,情感支持数据集 四,方法.实验和结果 (一)方法 (二 ...
- AN EMPIRICAL STUDY OF EXAMPLE FORGETTING DURING DEEP NEURAL NETWORK LEARNING 论文笔记
摘要 受到灾难性遗忘现象的启发,我们研究了神经网络在单一分类任务训练时的学习动态. 我们的目标是了解当数据没有明显的分布式转变时是否会出现相关现象. 我们定义了一个"遗忘事件" 当 ...
- 《 Recent Advances in Deep Learning-based Dialogue Systems 》:Neural Models in Dialogue Systems
关注微信公众号:NLP分享汇.[喜欢的扫波关注,每天都在更新自己之前的积累] 文章链接:https://mp.weixin.qq.com/s/vsEH5wj9Y5dShnH42hCX_Q 前言 本文将 ...
最新文章
- 5个无聊透顶的 Python 程序
- java 部分类_为什么微软部分类和Java不?
- 一周一论文(翻译 总结)—— [DSN 18] RDMC A Reliable RDMA Multicast for Large Objects :一个面向大型对象的可靠的RDMA广播框架
- python exe运行报 编码错误_python运行显示编码错误
- android 支付宝和微信支付封装,Android支付宝和微信支付集成
- 六十六、Leetcode数组系列(中篇)
- mybatis-翻页
- 大学生如何转专业(自学/培训)到互联网行业
- unity 3d物体描边效果_从零开始的卡通渲染描边篇
- 直通输出设备 android kodi,【本地播放】利用Kodi媒体播放器轻松实现源码输出DTS到功放...
- python insert_Python列表| 带示例的insert()方法
- C++模版 (一) ----- 函数模版
- springboot异常
- 【OCP|052】OCP题库更新,052最新考题及答案整理-第10题
- 谈谈订单号和流水号的关系
- 让刷Q币者对爱机你无从下手
- 更新RDL文件中的数据集(DataSets)
- 目前myeclipse官网无法登录
- android如何区分模拟器和真机
- 宁畅g40系列服务器发布,基于第三代至强可扩展处理器,宁畅G40系列服务器正式发布...
热门文章
- 互联网用户账号信息真实性认证(阿里云身份信息实名认证API接口服务)
- git安装 perl ubuntu_【Git】Linux Ubuntu——源码编译安装Git 2.x 版本
- 根据经纬度计算地球两个坐标之间的方位角
- [2022软工第二次作业]软件评测——CSDN技能树
- SylixOS学习二—— SylixOS启程之旅_ SylixOS系统配置
- RHEL 5基础篇—linux的简介
- VoLTE的前世今生...说清楚VoIP、VoLTE、CSFB、VoWiFi、SIP、IMS那些事
- python get dummies_python – Pandas.get_dummies返回两列(_Y和_N)而不是一列
- Java用n种方法编写实现双色球随机摇号案例
- FPGA数字信号处理(24)数字相关器设计(简化结构)