论文笔记整理:潘锐,天津大学硕士。


链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425

来    源:AAAI 2020

论文简介

保持对话的一致性和避免内容重复是构建以知识为基础的多轮对话系统的两个关键因素。尽管一些工作倾向于将对话历史与外部知识(如个人背景信息)结合起来以提高对话质量,但它们往往忽略了将相同的知识多次融入对话会导致内容重复。这一现象的主要原因是缺乏对对话层面知识使用的有效控制。为此,本文设计了一种历史自适应知识融合机制,构建了一种有效的多轮对话模型,通过反复更新知识并逐步将其融入历史,来解决内容重复问题。

方法及模型

1、模型概述

模型由三部分组成:编码器层、历史适应层和输出层。

首先,编码器层使用Bi-GRU分别捕获外部知识、历史信息和候选答案的上下文信息。之后利用self-attention机制识别重要信息,忽略无关信息。在历史适应层中,反复更新外部知识,并逐步将其融入历史。这不仅有助于历史捕获知识,而且可以动态更新基于历史的知识。然后利用层次递归网络提取序列信息和上下文信息。最后,在输出层中计算历史记录和候选回复的相似度。

2、编码器层

编码器层负责提取上下文信息。具体地说,知识信息P、历史信息C和候选回答信息A分别由编码模块处理。编码模块由一个Bi-GRU组件和一个self-attention组件组成。在不失去一般性的情况下,,表示句子的嵌入矩阵,其中l是句子的个数,k 代表句子的长度,d 代表隐藏层的大小。

首先编码到, 然后用self-attention机制计算句子级表示。句子级表示更关注句子中的关键信息。对于每个句子

3、历史适应层

外部知识的控制和更新与对话的上下文紧密相关。本文设计了一种新的门控机制来控制外部知识信息向当前和下一轮对话的流动。一方面,该模块将知识信息集成到当前的对话中,获得知识感知的表示,这样有助于保持对话的一致性。另一方面,知识感知表示也有助于控制下一轮用于解决重复问题的知识更新。

历史知识更新

假设知识信息的初始状态为,然后根据历史信息循环更新知识。动态更新路径如下所示:

在步骤 t 更新外部知识如下:

这里使用U有两个目的:1)控制流向下一轮的知识信息。2)从话语层面选择语义相关的知识信息进行语境理解。

对于第一个目的,在和U之间进行非线性运算,得到新的表示形式。

然后,设计遗忘门来选择新旧知识表示,

设计这种架构是考虑到对话的一致性和重复性。通过运用门控机制鼓励选择与当前对话语义相关的知识,避免选择重复但不必要的知识。

对于第二个目的,将U标准化,对知识表示的每一个部分进行评分,得到知识感知的历史表示,这种表示将外部知识结合起来,以保持一致性。然后更新外部知识并逐步将其融入历史。

分层历史信息编码器

使用来自编码器层的不同GRU对上下文历史信息进行编码,并使用self-attention机制将重要信息提取到一个向量上。编码前,历史(其中)被送入GRU和self-attention结构。将最终有意义的历史表示表示为O。

4、输出层

输出层负责计算历史和候选回复的相似性,从候选回复中选择上下文一致的回复。

实验

数据集:Persona-Chat和CMUDoG dataset

Baseline:KV profile Mmeory (Zhang et al. 2018)和Transformer (Mazaré et al. 2018)

实验结果:

自动评价:用r@k和F1作为自动度量指标。

上表展示了在两个数据集上的自动评价结果,可以看到与基线相比,本文的模型有了显著的改进。r@k和F1的改进意味着所提出的模型能够更好捕获对话中的深层语义信息,并从提供的回复中选择更相关的回复。此外,模型对CMUDoG数据集的改进比Persona-Chat数据集的改进要大。原因可能是CMUDoG数据集包含更多的知识和更丰富的语义。历史自适应知识更新机制可以更好地训练,帮助对话有效地控制CMUDOG数据集上知识的使用。

人工评价:从重复性、一致性和相关性三个维度评价。

首先,本文的模型在人类评价方面优于基线,这表明了所提出的历史子女适应机制的有效性。第二,本文的模型有效减少了重复。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制相关推荐

  1. 小学英语教学与计算机结合论文,浅谈在小学英语教学中与信息技术的有效融合...

    浅谈在小学英语教学中与信息技术的有效融合 转载:佚名 小学信息技术论文 2020-01-03 [摘 要]在小学英语的教学中,将信息技术作为一种辅助工具和手段有效地融合在教师的英语教学中,以学生的学习过 ...

  2. 论文浅尝 - AAAI2020 | 从异质外部知识库中进行基于图的推理实现常识知识问答...

    会议:AAAI2020 论文链接:https://arxiv.org/pdf/1909.05311.pdf 摘要 常识问答旨在回答需要背景知识的问题,而背景知识并未在问题中明确表达.关键的挑战是如何从 ...

  3. 论文浅尝 - AAAI2020 | 基于知识图谱进行对话目标规划的开放域对话生成技术

    论文笔记整理:张傲,天津大学硕士. Knowledge Graph Grounded Goal Planning for Open-Domain Conversation Generation 来源: ...

  4. 论文浅尝 - AAAI2020 | 通过知识库问答改善知识感知对话生成

    论文笔记整理:胡楠,东南大学博士. 来源:AAAI 2020 动机 现在的将外部知识整合到对话系统中的研究仍然存在一定缺陷.首先,先前的方法难以处理某些语句的主语和关系,比如当语句中的相关实体彼此相距 ...

  5. 论文浅尝 - AAAI2020 | 多模态基准指导的多模态自动文摘

    论文笔记整理:刘雅,天津大学硕士. 链接: https://aaai.org/ojs/index.php/AAAI/article/view/6525 动机 近年来,随着计算机视觉以及自然语言处理技术 ...

  6. 论文浅尝 - AAAI2020 | 通过句子级语义匹配和答案位置推断改善问题生成

    论文笔记整理:王春培,天津大学硕士. 链接:https://arxiv.org/pdf/1912.00879.pdf 动机 本文主要聚焦问答系统(Q&A)的反问题---问题生成(Questio ...

  7. 论文浅尝 - IJCAI | Knowledge is NOT always you need: 外部知识注入预训练模型的利与弊...

    转载公众号 | 浙大KG 论文题目:Drop Redundant, Shrink Irrelevant: Selective Knowledge Injection for Language Mode ...

  8. 论文浅尝 - AAAI2020 | 利用自然语言推断生成人称一致的对话

    链接: https://arxiv.org/pdf/1911.05889.pdf 动机 虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功,但是这些数据驱动的对话系统仍然 ...

  9. 论文浅尝 | AAAI2020 - 多分量图卷积协同过滤方法

    论文笔记整理:郝凯龙,南京大学硕士. 来源:AAAI2020 链接:https://arxiv.org/pdf/1911.10699.pdf 动机 推荐系统实际上是在做用户-商品二部图上的链路预测,仅 ...

最新文章

  1. Android使用ImageView显示网络图片
  2. CSS之Flexbox制作CSS布局易如反掌
  3. JAVA多线程售票问题
  4. 目标检测java系统_5分钟!用Java实现目标检测
  5. 计算机网络—数据链路层的流量控制与可靠传输机制(思维导图)
  6. AutoPlay Menu Builder入门教程
  7. 高端物理学名词_物理名词大全
  8. linux tar 命令安装,Linux tar 命令 command not found tar 命令详解 tar 命令未找到 tar 命令安装 - CommandNotFound ⚡️ 坑否...
  9. python问卷星微信登录_Python填写问卷星
  10. 信息检索与搜索引擎:Simhash算法优化
  11. 微信小程序如何实现点击地图控件后位置移动到当前的定位点
  12. HDU 6078 Wavel Sequence
  13. 《Ivor Horton's Beginning Java》 Chapter1-7 读书笔记
  14. python爬微博超话图片_Python爬虫:《庆余年》人物图谱和微博传播路径
  15. 西部之旅之------相机的选择
  16. 工厂模式及什么时候用工厂模式
  17. 计算多边形(polygon)面积的算法原理和python实现
  18. 大白兔启动盘做好后重做系统
  19. 人人可以是好厨子:72招做饭技巧帮你变大厨
  20. 【Handshake】引发全硅谷投资机构额度大战的传奇项目

热门文章

  1. 快学好这个去给学妹修热水器
  2. vscode 使用 ssh 登录
  3. 解析一个C语言俄罗斯方块游戏,包你看了就会
  4. 安卓9.0Sensor框架
  5. Android Camera调用流程
  6. Redis核心配置_Redis高级数据类型使用
  7. 【Pytorch神经网络实战案例】25 (带数据增强)基于迁移学习识别多种鸟类(CUB-200数据集)
  8. LeetCode 355. 设计推特(哈希map+set)
  9. 程序员面试金典 - 面试题 16.24. 数对和(双指针/哈希map)
  10. 2018qs计算机科学专业,2018QS世界大学计算机科学专业排名.docx