论文标题:

Boosting Factual Correctness of Abstractive Summarization with Knowledge Graph

论文作者:

Chenguang Zhu, William Hinthorn, Ruochen Xu, Qingkai Zeng, Michael Zeng, Xuedong Huang, Meng Jiang

论文链接:

https://arxiv.org/abs/2003.08612


抽象式文本摘要具有更加灵活的特点,然而,它也容易导致“文本事实偏离”——错误地提取了文章给出的基本事实。此时,尽管生成的文本很通顺,但是它包含了错误的事实,这就改变了原文的信息。

本文提出把知识图谱融入到文本摘要的过程中,通过显式地提取事实性知识,生成的摘要可以更好地利用这些知识,从而最大限度地保留原义。

抽象式文本摘要与事实性知识丢失

文本摘要是NLP中非常重要的一项任务,即给定一篇长文章,模型生成一小段文本作为对该文章的摘要。

总的来讲,文本摘要分为抽取式与抽象式。前者是直接从文章中选取片段作为摘要,后者是从头开始生成一段文本作为摘要。

显然,抽取式文本摘要的好处是它能保留文章的原始信息,但缺点是它只能从原文章中选取,相对不那么灵活。

而抽象式摘要尽管能更加灵活地生成文本,但是它经常包含很多错误的“事实性知识”——错误地生成了原文章本来的信息。

比如,原文章包含了一个重要事实(观点):“诺兰于2010年导演了《盗梦空间》,由莱昂纳多主演。”

但是,抽象式摘要模型可能就会生成:“莱昂纳多导演了《盗梦空间》。”这就是事实性知识的错误。

针对这种现象,本文在抽象式摘要中融入了知识图谱:

  • 首先使用知识图谱动态地提取文章中的事实性知识;

  • 把提取到的事实性知识融合到文本生成的过程中;

  • 使得生成的文本不再包含事实性知识错误。

除此之外,本文还训练了一个事实性知识评估模型,用于评估生成的摘要匹配原文事实性知识的程度。

通过在基准数据集CNN/DailyMail和XSum的实验与分析,本文证明了该方法(FASUM)可以取得显著更好的事实性知识度,同时也具有抽象式文本摘要的灵活的特点。

将知识图谱融入到文本摘要过程

首先定义一下抽象式文本摘要的过程。设输入是一篇文章,输出是对应的摘要。下图是模型结构示意图:

模型由三个部分组成:知识提取器(知识图谱)、编码器和解码器。知识图谱负责从文章中提取事实性知识,编码器负责编码文本信息,解码器负责融合编码特征和事实性知识从而生成摘要。

知识图谱构建

我们使用Stanford OpenIE从文章中提取事实性知识,每个知识表示为一个三元组

比如对句子“Born in a town, she took the midnight train”,那么三元组就是(she, took, midnight train)。

在得到三元组之后,我们需要把它编码为特征。为此,我们要首先构建一个基于文章的知识图谱。

对每个三元组,我们把视为三个结点,然后得到两条无向边。这样一来,通过对所有三元组构建边,我们就能得到一个无向图,这就是该文章的知识图谱。

之后,我们在该知识图谱上使用图注意力模型提取每个结点的特征。如此,我们就完成了事实性知识特征的提取。

注意到,图中的所有结点是文章的所有语言单元(如字、词或子词),如果涉及到事实性知识,它就有边连接,否则它没有边连接。

知识融合

编码器按照常规方法编码文章,之后在解码的时候把它和解码器特征、知识特征融合。

如上图所示,设编码特征和解码特征融合后的特征是,其中是已经生成的字(词)数,且是知识图谱中的结点的特征。那么,当前需要融入的事实性知识的特征就是:

这里增加了一个系数是因为知识特征和文本特征的尺度不一致,是当前解码层数。

在得到之后,就可以通过常规的自注意力机制、层归一化和残差连接,和前馈层将各知识融合在一起,如上图中间所示,得到该层最终的特征表示

摘要生成

为了生成下一个语言单元,我们结合拷贝机制:

从而,最终生成语言单元的概率是:

其中,是解码器最后一层对编码器的关注度。取最大的值作为生成的字符(词)即可。

事实性知识正确度评估

现在的问题是,我们该如何评估我们是否融入了事实性知识呢?我们可以用一个模型来表示摘要生成了文章的事实性知识的正确度。

模型可以是BERT,只需要把拼接起来,然后用[CLS]得到概率即可。然而,为了训练模型,我们还需要一些训练集。

训练集包含正例和负例。正例来自:原摘要训练语料、摘要的反译(Backtranslation)。反例来自:随机将摘要中的一个实体替换为文章中的同类实体。

在测试集上,该模型能实现最低的错误率——约26.8%。

实验

我们在文本摘要的标准数据集CNN/DailyMail和XSum上实验。事实性知识的评估使用上面训练的模型,其他的指标包括ROUGE-1,ROUGE-2和ROUGE-L。基线模型包括:TCONVS2S,BOTTOMUP,UNILM。其他设置详见原文。

下表是主要结果。可以看到,本文的方法(FASUM)在事实性知识评估上取得了和UNILM差不多的结果(后者使用了大规模预训练),同时,去掉知识图谱(KG)会显著减低其得分,说明了知识图谱提取事实性知识的作用。在ROUGH得分方面,FASUM稍低于基线模型。

为了检验抽象式摘要生成文本的“抽象程度”——生成新的n-gram的比例,如下图所示。可以看到,FASUM在所有方法中,可以生成更加新颖的摘要,同时保留了事实性知识。

下面我们想具体看生成的摘要中包含的事实性知识和原文章的事实性知识的匹配程度如何。假设摘要中的事实性知识是,原文章的是,那么中的每个三元组和比较就有三种情况:

  • ——correct hit(C)

  • ,但是或者——wrong hit(W)

  • 否则,为miss(M)

于是,我们可以计算匹配得分:

下表是计算结果。可以看到,FASUM在事实性知识匹配程度上显著优于基线模型,这说明在文本摘要中加入知识图谱的确可以保留事实性知识。

我们再来看看人工评测。如下表所示,在事实性得分上,FASUM毫无疑问取得最好结果;在信息度上,UNILM得分最高,其次是FASUM。

小结

在文本摘要中,提取事实性知识,即原文信息,是非常重要的一个环节。尽可能保留原文可以避免原义的曲解,对于鉴别当前互联网上随处可见的假新闻有重要的意义。

将知识图谱融入到文本摘要任务中是NLP发展的一大趋势,有助于加速NLP大规模落地应用的进程。

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

当知识图谱遇上文本摘要:保留抽象式文本摘要的事实性知识相关推荐

  1. 当知识图谱遇上推荐系统(总述和推荐)

    背景 来学校学习了两个星期了,总结一下,也可供学习这个方向的新人参考. 当知识图谱遇上个性化推荐,这篇文章可以从宏观角度来解释下面四个概念: 1.推荐系统的任务和难点 2.什么是知识图谱 3.知识图谱 ...

  2. 当知识图谱遇上推荐系统之DKN模型(论文笔记一)

    Deep Knowledge-Aware Network for News Recommendation 类别:依次学习 首先使用知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入推荐系统 ...

  3. 论文浅尝 - ISWC2021 | 当知识图谱遇上零样本视觉问答

    论文题目:Zero-shot Visual Question Answering using Knowledge Graph 本文作者:陈卓(浙江大学).陈矫彦(牛津大学).耿玉霞(浙江大学).Jef ...

  4. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  5. 当知识图谱遇上推荐系统之PippleNet模型(论文笔记二)

    RippleNet | Propagating User Preferences on the Knowledge 类别:联合学习 将知识图谱特征学习和推荐算法的目标函数结合,使用端到端(end-to ...

  6. 当知识图谱遇上推荐系统之MKR模型(论文笔记三)

    Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation 类别:交替学习 将知识图谱特征学习和推荐算法视为两个分离 ...

  7. 【知识图谱 Knowledge Graph】从它的起源看未来的研究方向。知识图谱——科普篇

    声明:仅学习使用. 注:来源在文末均已指出 目录 一.知识图谱的本质 1.数字时代降临,知识图谱前身 语义网络模型 初面世(20世纪50-60年代) 2.万维网广泛应用,图形化模型略展锋芒(20世纪8 ...

  8. 谁能解答我对知识图谱的上百个疑问?

    近日,我们采访了东南大学认知智能研究所所长漆桂林教授和复旦大学知识工场实验室负责人肖仰华教授,围绕知识图谱这两年在研究与产业应用道路上的一些进展与仍面临的问题.漆桂林教授提到,近两年,知识图谱的研究在 ...

  9. 知识图谱研讨实录10丨肖仰华教授带你读懂知识图谱的搜索推荐

    知识图谱是一种大规模语义网络,已经成为大数据时代知识工程的代表性进展. 知识图谱技术是实现机器认知智能和推动各行业智能化发展的关键基础技术.由复旦大学肖仰华教授策划的<知识图谱:概念与技术> ...

最新文章

  1. 人工智能重构下的金融场景
  2. TabHost.TabSpec中的标签实现图文左右排(默认上下排)
  3. HDU 3974 Assign the task(dfs时间戳+线段树成段更新)
  4. Ubuntu 16.04中iptables的工具简介(iptables/iptables-restore/iptables-xml/iptables-apply/iptables-save)...
  5. Codeforces Round #243 (Div. 2) Problem B - Sereja and Mirroring 解读
  6. Windows7删除休眠文件hiberfil.sys节省大量C盘空间
  7. Atitit.软件的建模种类and 建模语言选型and UML???
  8. 自动寻路之 --AStar算法
  9. iOS代码混淆工具-iOS混淆工具-4.3解决工具-4.3审核被拒
  10. Flash cs3教程-颜色安全
  11. ES7.14报错 Invalid receiver type interface org.apache.http.Header;not a subtype XX.http.NameValuePair
  12. 长图PDF如何分页打印?
  13. 【YOLOX训练部署】YOLOX训练自己的VOC数据集
  14. XML文档类型定义---XML Schema结构
  15. 微信小说域名被封-366tool在线解答微信屏蔽小说网页停止访问的解决方案
  16. mtk audio笔记
  17. SSD算法详解 及其 keras实现
  18. 如何像Python高手(Pythonista)一样编程
  19. 什么是函数?什么是无参函数?什么是返回值?函数的分类?
  20. eclipse快捷键及各种设置

热门文章

  1. 如何读群晖硬盘_更新教程:群晖下直接挂载WINDOWS的NTFS格式硬盘,试验通过......
  2. IDEA 每次运行项目时都提示源值1.5已过时,将在未来所有版本中删除
  3. 第三模块:面向对象(目录)
  4. 团队成员之间的对抗与互助的鼓励
  5. NOIP2010排队接水
  6. 「微信小程序免费辅导教程」24,基础内容组件icon的使用探索与7月26日微信公众平台的更新解读...
  7. HDU 5389 Zero Escape
  8. Hacked VisualSVN Server by PHP to allow user change password
  9. Cocos2d-js学习--helloword
  10. redhat linux 5.6安装图解