笔记整理 | 韩振峰,天津大学硕士


链接:https://arxiv.org/pdf/1911.02707.pdf

动机

人类对话自然地围绕相关概念发展,并分散到多跳概念。本文提出了一种新的会话生成模型——概念流(ConceptFlow),它利用常识知识图对会话流进行显式建模。通过将对话建立在概念空间的基础上,ConceptFlow表示潜在的对话流,它沿着常识关系在概念空间中遍历。遍历由概念图中的图注意力引导,向概念空间中更有意义的方向移动,以生成具有更多语义和信息量的响应。在Reddit会话数据集上的实验表明,ConceptFlow的有效性优于以前的知识感知会话模型和基于GPT-2的模型,同时使用的参数减少了70%,证实了显式建模会话结构的优势。

亮点

论文的亮点主要包括:

(1)ConceptFlow利用常识知识图对会话流进行了显式建模,并对所有概念提出了一种新的注意机制来引导潜在概念空间中的会话流。

(2)ConceptFlow的在生成回复的结果优于其他模型的时,其模型参数更少。

(3)设置了丰富的实验对ConceptFlow相关的内容进行探讨,对ConceptFlow的优势给出了令人信服的证据。

概念及模型

为了模拟人类对话中的概念转换,本文提出了概念流(ConceptFlow),它利用常识知识图来模拟显式概念空间中的对话流。ConceptFlow明确地将对话建模为常识知识图中的遍历:它从基础概念(如“聊天”和“未来”)开始,并通过沿着常识关系跳转到相关概念(如“交谈”和“梦想”)来生成更有意义的对话。概念图中的遍历由图注意机制引导,该机制源自图神经网络以关注更合适的概念。概念流学会沿着常识知识图中更有意义的关系来模拟对话的发展。结果,该模型能够通过从对话话语沿着常识关系跳跃到遥远但有意义的概念来“增长”基础概念;这将引导模型生成更多信息和主题响应。

ConceptFlow具体由三部分构成:概念图构建、编码潜在概念流、使用概念流生成文本。

模型整体框架如下:

概念图构建

假ConceptFlow构建一个概念图G作为每次对话的知识。它从基础概念(零跳概念)开始,这些概念出现在对话话语中,并由实体链接系统进行注释。然后ConceptFlow用一跳概念和两跳概念扩展零跳概念。零跳概念和一跳概念以及它们之间所有的关系构成了与当前对话主题密切相关的中心概念图,一跳概念和两跳概念以及它们之间的关联构成了外部图

编码潜在概念流

构造的概念图提供了概念如何与常识知识相关的显示语义,概念流利用它来模拟对话并指导回复的生成。它从用户话语开始,通过中心图到达外部图。这是从用户话语编码中心和外部概念流来建模的。

中心流编码:使用图神经网络对中心概念图进行编码,图神经网络将用户话语H的信息传递到中心概念图,即将概念编码成表达

其中指概念的嵌入表示。

外部流编码:一跳概念到其连接的两跳概念的外部流通过注意力机制被编码为

注意力聚合三元组得到

使用概念流生成文本

为了同时考虑用户话语和相关信息,来自用户话语的文本和潜在概念流由解码器使用两个组件来合并:1)组合它们编码的上下文表示;2)从上下文表示中有条件地产生单词和概念。

上下文表示:为了生成第t步的回复字符,首先根据话语和潜在概念流的编码计算第t步的解码得到输出上下文表达:

指第t-1步生成的字符的表示,是基于文本的表示和基于概念的表示的拼接:

基于文本的表示用标准的注意力机制读取用户话语编码:

注意力为:

基于概念的表示是中心流和外部流编码的结合:

注意力加权于中心概念表示:

注意力加权于外部流表示:

字符生成:第t步输出表示包含来自话语文本、不同跳概念以及它们之间的注意力。解码器利用产生第t步的字符从而生成更有信息量的回复。它首先使用一个门通过选择单词、中心概念、外部概念集合来控制生成:

单词w,中心概念和外部概念的生成概率通过单词表,中心概念集合和外部概念集合计算:

实验

本文使用基于从Reddit的单轮对话数据集的多跳扩展对话数据集,使用预处理的ConceptNet 作为知识图谱。本文使用6个基线对比算法,它们来自3个类别:标准Seq2Seq、知识增强系统(MemNet、CopyNet、CCM)、微调GPT-2系统(GPT-2 lang、GPT-2 conv)。本文做个5个实验来评估从概念流生成的回复和学习到的图注意力的有效性。

回复质量

生成回复的质量用不同的度量标准从3个方面进行评估:相关性、多样性、新颖性。

表1评估回复的相关性,可以看出ConceptFlow的表现远远超过所有基线模型,ConceptFlow生成的回复更符合主题,与基本事实回复更匹配。

表2评估回复的多样性和新颖性。ConceptFlow在生成回复的多样性和新颖性之间有很好的平衡。GPT-2的回复更加多样,也许是因为它在解码过程中的采样机制,但是与ConceptFlow相比,它的回复不那么新颖和切题。

表1和表2都是自动评估,表3是人类评估的结果,人类评估关注恰当和信息量两个方面。可以看出ConceptFlow在所有的指标下都优于其他模型,并且与GPT-2相比,它只使用了30%的参数。

多跳概念的有效性

本实验是多跳概念的消融实验,通过不同的外部概念挑选方法的对比,验证了外部概念的有效性。虽然在a中本文提出的方法(Full)不如Distract方法的表现好,但是综合b和c可以看出本文提出的方法效果最好 。

概念图的跳数

本实验研究了概念图中跳数的影响。表5显示了覆盖的黄金概念的数量随着跳数的增加而增加,然而与此同时概念的数量也随着跳数的增加而急剧增加,为了在覆盖和效率之间的平衡,本文选择两跳,并使用ConceptFlow(选择)过滤大约200个概念来构建修剪的图。

实例研究

本实验展示了几个实例,从表6可以看出本文的ConceptFlow生成的回复比CCM和GPT-2更流畅、信息更丰富。图4展示了注意力的可视化结果。

在概念上学到的注意力

本实验研究ConceptFlow对不同组的概念学习到的注意力。a展示了中心概念的注意力权重,可以看出ConceptFlow更多的黄金和零跳概念,其中包含更多有用的信息。b展示了对两跳概念的注意力,可以看出与其它两跳概念相比,ConceptFlow更关注黄金概念。

总结

本文提出的ConceptFlow将会话结构显示地建模为潜在概念空间的转换,以便生成具有更多语义和信息量的回复。本文在Reddit会话数据集上的实验说明了ConceptFlow相对于以前的会话系统的优势。研究证实ConceptFlow的优势来自于高覆盖率的潜在概念流,以及它的图注意力机制,该机制有效地将概念流引导到高度相关的概念。我们的人类评估表明,ConceptFlow在使用更少参数的同时,产生了更合适和信息更丰富的响应。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 - ACL2020 | 利用常识知识图对会话流进行显式建模相关推荐

  1. 论文浅尝 - ACL2020 | 通过集成知识转换进行多语言知识图谱补全

    笔记整理 | 谭亦鸣,东南大学博士生 概述 预测图谱中缺失的事实(fact)是知识图谱构建与推理中的一个重要任务,近年来也被许多KG embedding研究的关注对象.虽然目前的KG embeddin ...

  2. 论文浅尝 - ACL2020 | 利用知识库嵌入改进多跳 KGQA

    论文笔记整理:吴畏,东南大学硕士研究生. 来源: ACL 2020 论文地址: https://www.aclweb.org/anthology/2020.acl-main.412.pdf 开源代码: ...

  3. 论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

    论文笔记整理:吴桐桐,东南大学博士生,研究方向为自然语言处理. 链接:https://www.aclweb.org/anthology/P19-1226/ 近年来,机器阅读理解已经逐渐发展为自然语言理 ...

  4. 论文浅尝 | 利用常识知识图增强零样本和少样本立场检测

    笔记整理:张嘉芮,天津大学硕士 链接:https://aclanthology.org/2021.findings-acl.278.pd 动机 传统的数据驱动方法不适用于零样本和少样本的场景.对于人类 ...

  5. 论文浅尝 | ERNIE-ViL:从场景图中获取结构化知识来学习视觉语言联合表示

    笔记整理:朱珈徵,天津大学硕士 链接:https://www.aaai.org/AAAI21Papers/AAAI-6208.YuFei.pdf 动机 现有的视觉语言预训练方法试图通过在大的图像文本数 ...

  6. 论文浅尝 - ACL2020 | 用于关系三元组抽取的级联二进制标记框架

    论文笔记整理:王中昊,天津大学. 来源:ACL2020 链接:https://arxiv.org/pdf/1909.03227.pdf 摘要 从非结构化文本中提取关系三元组是构建大规模知识图的关键.然 ...

  7. 论文浅尝 | Rot-Pro:通过知识图谱嵌入中的投影建模关系的传递性

    笔记整理:陈湘楠,浙江大学硕士在读. 研究背景 知识图嵌入模型学习知识图谱中实体和关系的表示,以预测实体之间的缺失链接(关系).它们的有效性深受建模和推断不同关系模式(如对称.不对称.逆向.组合和传递 ...

  8. 论文浅尝 - ACL2020 | 用于多媒体事件提取的跨媒体结构化公共空间

    笔记整理 | 王琰,东南大学 来源:ACL 2020 链接:https://arxiv.org/pdf/2005.02472.pdf 概述 本论文引入一项新任务:多媒体事件提取(M²E²),该任务旨在 ...

  9. 论文浅尝 | 基于置信度的知识图谱表示学习框架

    本文转载自公众号:PaperWeekly. 作者丨谢若冰 单位丨腾讯微信搜索应用部 研究方向丨知识表示学习 知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(head ...

最新文章

  1. 怎么样才可批量导出word文档中的照片 不再一张一张的另存为!
  2. ACM输入输出--多组测试用例--C、C++、Java
  3. Pyhton 一行代码求Fibonacci第N项
  4. 何恺明一作,刷新7项检测分割任务,无监督预训练完胜有监督
  5. TensorFlow笔记(3) TensorBoard可视化
  6. Vue终端取消vue、prettier警告warn
  7. hdu 1856 并查集——ac的不一定正确
  8. wpf image控件循环显示图片 以达到动画效果 问题及解决方案
  9. java获取时间戳单位秒,如何测试给定的时间戳是以秒或毫秒为单位?
  10. 最简单的P2P加密聊天软件开发完成
  11. ie浏览器html页面怎么清缓存,Web项目中,清理浏览器缓存的几种方式
  12. 新浪邮箱服务器设置,新浪企业邮箱|帮助中心
  13. 两种特殊卷积:转置卷积和空洞卷积
  14. 005_Sketch 工具使用手册
  15. php mysql 插入图片_mysql中怎样插入图片
  16. python-数据分析-pandas
  17. C# 把word转换成txt
  18. html如何拉伸一个图片,css怎么拉伸图片?
  19. 阿伟教学--VMWare装Mac
  20. c语言do循环函数,C语言do-while循环

热门文章

  1. WCF分布式开发步步为赢系列
  2. mysql配置环境变量(win 10)_mysql配置环境变量(win 10)
  3. STM32F7xx —— ADC
  4. 2017年12月计算机一级c,2017年12月计算机二级C语言考试操作题冲刺卷(2)
  5. php中goto另一个页面,php中goto操作符的详细介绍
  6. 爬虫实战学习笔记_2 网络请求urllib模块+设置请求头+Cookie+模拟登陆
  7. Mongoose 中使用 populate 实现关联查询
  8. 搞懂DEtection TRanformer(DETR)
  9. LeetCode 845. 数组中的最长山脉(中心扩展)
  10. LeetCode 207. 课程表(拓扑排序)