作者 | 叶宏彬,浙江大学博士研究生,研究方向:知识图谱、自然语言处理

接收会议 | AAAI2021

论文链接 | https://arxiv.org/pdf/2009.06207.pdf


摘要

在自然语言处理和知识图谱领域的信息提取中,三元组抽取是必不可少的任务。在本文中,我们将重新审视用于序列生成的端到端三元组抽取任务。由于生成三元组抽取可能难以捕获长期依赖关系并生成不忠实的三元组,因此我们引入了一种新的模型,即使用生成式Transformer的对比学习三元组抽取框架。

具体来说,我们介绍了一个共享的Transformer模块,用于基于编码器-解码器的生成。为了产生忠实的结果,我们提出了一种新颖的三元组对比学习训练框架。此外,我们引入了两种机制来进一步改善模型的性能(即,分批动态注意掩码和三元组校准)。在三个数据集(NYT,WebNLG和MIE)上的实验结果表明,我们的方法比基线具有更好的性能。我们的代码和数据集将在论文出版后发布。

论文动机

编码器-解码器模型是功能强大的工具,已在许多NLP任务中获得成功,但是现有方法仍然存在两个关键问题。首先,由于递归神经网络(RNN)的固有缺陷,它们无法捕获长期依赖关系,从而导致重要信息的丢失,否则将在句子中反映出来,从而导致模型无法应用更长的文本。第二,缺乏工作致力于生成忠实的三元组,序列到序列的体系结构会产生不忠实的序列,从而产生意义上的矛盾。例如,给定句子“美国总统特朗普在纽约市皇后区长大,并居住在那里直到13岁”,该模型可以生成事实“(特朗普出生于皇后区)”。尽管从逻辑上讲是正确的,但我们无法从给定的句子中找到直接的证据来支持它。

为了解决这些问题,我们引入了带有生成变压器(CGT)的对比学习三元组提取框架,该框架是一个共享的Transformer模块,支持编码器-解码器的生成式三元组对比学习多任务学习。首先,我们使用分隔符和部分因果掩码机制将输入序列与目标序列连接起来,以区分编码器-解码器表示形式。除了预先训练的模型之外,我们的模型不需要任何其他参数。然后,我们介绍了一种新颖的三元组对比学习对象,该对象利用真实的三元组作为正实例,并利用随机令牌采样将损坏的三元组构造为负实例。为了共同优化三元组生成对象和对比学习对象,我们引入了分批动态注意掩码机制,该机制允许我们动态选择不同的对象并共同优化任务。最后,我们介绍了一种新颖的三元组校准算法,以在推理阶段滤除虚假三元组。

这项工作的贡献如下:

  • 我们将三元组提取作为序列生成任务进行了重新介绍,并引入了一种新颖的CGT模型。考虑到增加的提取功能,CGT除了在预训练语言模型中发现的参数外,不需要其他参数。

  • 我们引入了两种机制来进一步提高模型性能(即,批处理动态注意掩码和三元组校准)。第一个可以联合优化不同的对象,第二个可以确保忠实的推理。

  • 我们在三个基准数据集上评估了CGT。我们的模型优于其他强大的基准模型。我们还证明,在捕获长期依存关系方面,CGT比现有的三元组抽取方法更好,因此,在使用长句子场景下依然可以获得更好的性能。

模型框架

这里我们展示了CGT生成式Transformer的总体架构。右上部分表示Transformer生成模块,右下部分表示三元组对比学习模块。这两个部分训练时共同优化。生成模块依靠部分因果掩码机制建模成序列生成任务,如右图中的示例所示,对于三元组序列生成,其中右上部分设置为-∞以阻止从源段到目标段的关注;左侧部分设置为全0,表示令牌能够参与第一段。利用交叉熵损失生成来优化三元组生成过程,获得生成损失。对比学习模块将输入文本与正确的三元组实例或者伪造的三元组进行随机拼接,依靠部分因果掩码机制建模成文本分类任务,其中mask矩阵的元素全为0,利用经过MLP多层感知机层的特殊token[CLS]表示来计算分类打分函数,鉴别是否为正确实例,从而增强模型对关键token的感知能力。我们利用交叉熵优化对比损失。生成损失与对比学习损失通过一个超参数权衡构成了我们最终的总体损失。我们的解码推理采用的是波束搜索和启发式约束。

实验结果

我们对三个基准数据集进行了实验:纽约时报(NYT),WebNLG和MIE。MIE是医学领域的大规模中文对话信息提取数据集。图2中中显示了这三个数据集的部分实验统计信息。


   

浙江大学知识引擎实验室


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 - AAAI2021 | 基于对比学习的三元组生成式抽取方法相关推荐

  1. 论文浅尝-综述 | 基于强化学习的知识图谱综述

    转载公众号 | 人工智能前沿讲习 论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264 摘要:知识图谱是一种用图结构建模事物及事物 ...

  2. 论文浅尝 - ICML2020 | 基于子图推理的归纳式关系预测

    论文笔记整理:陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习. 论文来源:ICML 2020 Introduction 当前在知识图谱上(KnowledgeGraph,KG)进行关系预测的 ...

  3. 论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答

    论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. 来源:WSDM '20 链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812 动机 知 ...

  4. 论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类

    论文作者:窦春柳,天津大学,研究方向:知识图谱 论文链接:http://arxiv.org/abs/2204.12111 代码地址:https://github.com/DOU123321/FAEA- ...

  5. 论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

    论文笔记整理:郝凯龙,南京大学硕士 链接:https://www.aclweb.org/anthology/P19-1522.pdf 动机 传统的 ACE 事件抽取任务依赖于人工标注的数据,耗费大量的 ...

  6. 论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

    论文笔记整理:耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 来源:AAAI2020 论文链接:https://arxiv.org/pdf/2001.02332.pdf 本文是发表在AAA ...

  7. 论文浅尝 - AAAI2021 | 从历史中学习:利用时间感知拷贝生成网络建模时态知识图谱...

    笔记整理 | 朱珈徵,天津大学硕士 链接:https://arxiv.org/pdf/2012.08492.pdf 动机 大型知识图通常会增长以存储时态事实,这些时间事实对实体沿时间线的动态关系或交互 ...

  8. 论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解...

    论文作者:吴林娟,天津大学,研究方向为自然语言理解 论文链接:http://arxiv.org/abs/2204.00996 代码地址:https://github.com/wulinjuan/SSD ...

  9. 论文浅尝 - CVPR2020 | 基于网格特征的可视问答系统

    论文笔记整理:李爽,天津大学. 链接:https://arxiv.org/pdf/2001.03615v1.pdf 动机 随着"自下而上"注意力的普及,基于边界框(或区域)的视觉特 ...

最新文章

  1. mysql命令参数详解_详解Mysql命令大全(推荐)
  2. 中国六个漂亮的古镇风景名胜区网站欣赏
  3. cadence软件_IC苦逼搬运工入职之——Cadence基本操作(1)
  4. boost::mp11::mp_with_index相关用法的测试程序
  5. elasticdump elasticsearch数据备份与迁移 导入导出
  6. Pyton学习—字符串
  7. MySQL View
  8. this compilation unit is not on the build of a java project
  9. excel小写转大写公式_喂!这边居然有演示的Excel快捷键!
  10. 异常值检测——绝对中位差MAD(median absolute deviation )
  11. LeetCode - 709. To Lower Case
  12. 微信小程序引入阿里矢量图标库
  13. html5设置视频背景颜色,HTML5设置视频背景的方法介绍
  14. 破解Photoshop cs6
  15. 初识云计算和DevOps
  16. linux lsiutil raid创建,使用Lsiutil在線管理Dell(R410,R610等)內置陣列卡SAS 6i/R
  17. ENSP—NAT综合实验
  18. 【转】情牵牛仔裤 情色一生
  19. 连接中间层加密服务失败,请确认中间层加密服务已启动
  20. 论文学习——StyleGan原文精读

热门文章

  1. var与dynamic区别
  2. 工作笔记-SDRAM的读写
  3. 记一次和摄像头的摩擦经历
  4. STM32项目(二) —— 车灯测试台架
  5. 计算机组成原理节拍分为几种,计算机组成原理习题答案第七章
  6. python将txt转json_Python控制乐高EV3,以及VSCODE环境配置
  7. LeetCode 1894. 找到需要补充粉笔的学生编号
  8. LeetCode 1776. 车队 II(单调栈)
  9. 天池 在线编程 分割数组
  10. 天池 在线编程 有效的字符串