点击下面卡片关注我呀,每天给你送来AI技术干货!

来自:浙大KG

论文题目:Contrastive Triple Extraction with Generative Transformer

本文作者:叶宏彬,浙江大学博士研究生,研究方向:知识图谱、自然语言处理

接收会议:AAAI2021

论文链接:https://arxiv.org/pdf/2009.06207.pdf

摘要

在自然语言处理和知识图谱领域的信息提取中,三元组抽取是必不可少的任务。在本文中,我们将重新审视用于序列生成的端到端三元组抽取任务。由于生成三元组抽取可能难以捕获长期依赖关系并生成不忠实的三元组,因此我们引入了一种新的模型,即使用生成式Transformer的对比学习三元组抽取框架。

具体来说,我们介绍了一个共享的Transformer模块,用于基于编码器-解码器的生成。为了产生忠实的结果,我们提出了一种新颖的三元组对比学习训练框架。此外,我们引入了两种机制来进一步改善模型的性能(即,分批动态注意掩码和三元组校准)。在三个数据集(NYT,WebNLG和MIE)上的实验结果表明,我们的方法比基线具有更好的性能。我们的代码和数据集将在论文出版后发布。

论文动机

编码器-解码器模型是功能强大的工具,已在许多NLP任务中获得成功,但是现有方法仍然存在两个关键问题。首先,由于递归神经网络(RNN)的固有缺陷,它们无法捕获长期依赖关系,从而导致重要信息的丢失,否则将在句子中反映出来,从而导致模型无法应用更长的文本。第二,缺乏工作致力于生成忠实的三元组,序列到序列的体系结构会产生不忠实的序列,从而产生意义上的矛盾。例如,给定句子“美国总统特朗普在纽约市皇后区长大,并居住在那里直到13岁”,该模型可以生成事实“(特朗普出生于皇后区)”。尽管从逻辑上讲是正确的,但我们无法从给定的句子中找到直接的证据来支持它。

为了解决这些问题,我们引入了带有生成变压器(CGT)的对比学习三元组提取框架,该框架是一个共享的Transformer模块,支持编码器-解码器的生成式三元组对比学习多任务学习。首先,我们使用分隔符和部分因果掩码机制将输入序列与目标序列连接起来,以区分编码器-解码器表示形式。除了预先训练的模型之外,我们的模型不需要任何其他参数。然后,我们介绍了一种新颖的三元组对比学习对象,该对象利用真实的三元组作为正实例,并利用随机令牌采样将损坏的三元组构造为负实例。为了共同优化三元组生成对象和对比学习对象,我们引入了分批动态注意掩码机制,该机制允许我们动态选择不同的对象并共同优化任务。最后,我们介绍了一种新颖的三元组校准算法,以在推理阶段滤除虚假三元组。

这项工作的贡献如下:

  • 我们将三元组提取作为序列生成任务进行了重新介绍,并引入了一种新颖的CGT模型。考虑到增加的提取功能,CGT除了在预训练语言模型中发现的参数外,不需要其他参数。

  • 我们引入了两种机制来进一步提高模型性能(即,批处理动态注意掩码和三元组校准)。第一个可以联合优化不同的对象,第二个可以确保忠实的推理。

  • 我们在三个基准数据集上评估了CGT。 我们的模型优于其他强大的基准模型。我们还证明,在捕获长期依存关系方面,CGT比现有的三元组抽取方法更好,因此,在使用长句子场景下依然可以获得更好的性能。

模型框架

这里我们展示了CGT生成式Transformer的总体架构。右上部分表示Transformer生成模块,右下部分表示三元组对比学习模块。这两个部分训练时共同优化。生成模块依靠部分因果掩码机制建模成序列生成任务,如右图中的示例所示,对于三元组序列生成,其中右上部分设置为-∞以阻止从源段到目标段的关注;左侧部分设置为全0,表示令牌能够参与第一段。利用交叉熵损失生成来优化三元组生成过程,获得生成损失。对比学习模块将输入文本与正确的三元组实例或者伪造的三元组进行随机拼接,依靠部分因果掩码机制建模成文本分类任务,其中mask矩阵的元素全为0,利用经过MLP多层感知机层的特殊token[CLS]表示来计算分类打分函数,鉴别是否为正确实例,从而增强模型对关键token的感知能力。我们利用交叉熵优化对比损失。生成损失与对比学习损失通过一个超参数权衡构成了我们最终的总体损失。我们的解码推理采用的是波束搜索和启发式约束。

实验结果

我们对三个基准数据集进行了实验:纽约时报(NYT),WebNLG和MIE。MIE是医学领域的大规模中文对话信息提取数据集。图2中中显示了这三个数据集的部分实验统计信息。

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

点击上面卡片,关注我呀,每天推送AI技术干货~

整理不易,还望给个在看!

AAAI2021-基于对比学习的三元组生成式抽取方法相关推荐

  1. 论文浅尝 - AAAI2021 | 基于对比学习的三元组生成式抽取方法

    作者 | 叶宏彬,浙江大学博士研究生,研究方向:知识图谱.自然语言处理 接收会议 | AAAI2021 论文链接 | https://arxiv.org/pdf/2009.06207.pdf 摘要 在 ...

  2. 直播预告 | AAAI 2022论文解读:基于对比学习的预训练语言模型剪枝压缩

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  3. 【自然语言处理】【对比学习】SimCSE:基于对比学习的句向量表示

    相关博客: [自然语言处理][对比学习]SimCSE:基于对比学习的句向量表示 [自然语言处理]BERT-Whitening [自然语言处理][Pytorch]从头实现SimCSE [自然语言处理][ ...

  4. AAAI 2022 | 北大 阿里达摩院:基于对比学习的预训练语言模型剪枝压缩

    近年来,预训练语言模型迅速发展,模型参数量也不断增加.为了提高模型效率,各种各样的模型压缩方法被提出,其中就包括模型剪枝. 然而,现有的模型剪枝方法大多只聚焦于保留任务相关知识,而忽略了任务无关的通用 ...

  5. NAACL 2021 | AWS AI 提出基于对比学习的端到端无监督聚类方法

    ©PaperWeekly 原创 · 作者 | 李婧蕾 学校 | 北京邮电大学硕士生 研究方向 | 自然语言处理 Abstract 无监督聚类的目的是根据在表示空间中的距离发现数据的语义类别.然而,在学 ...

  6. ACL 2021 | ConSERT:基于对比学习的句子语义表示迁移框架

    ©PaperWeekly 原创 · 作者 | 张琨 学校 | 中国科学技术大学博士生 研究方向 | 自然语言处理 Motivation 从 BERT,GPT 被提出来之后,自然语言处理领域相关研究进入 ...

  7. AAAI 2021 | 基于对比学习的聚类工作

    ©PaperWeekly 原创 · 作者|李云帆 学校|四川大学博士生 研究方向|聚类,无监督表示学习 论文标题: Contrastive Clustering 论文来源: AAAI 2021 论文链 ...

  8. PCL-SISR:基于对比学习的单幅图像超分辨率重建方法

    ©作者 | 高帆 学校 | 北京邮电大学 研究方向 | 计算机视觉 随着 Transformer 的提出以及在底层任务上应用的进一步探索,相信在很多底层任务数据集上可以取得新的 SOTA 成绩.但是不 ...

  9. 基于对比学习的目标检测预训练方法

    基于对比学习的目标检测预训练方法 参考链接:目标检测预训练模型(基于对比学习)相关论文梳理 本文主要记录以下几片论文: 1.DenseCL(CVPR21 oral) 2.DetCo(ICCV21) 3 ...

  10. MICCAI 2022 | CLFC:基于对比学习的多模态脑肿瘤分割与单模态正常脑图像的特征比较

    MICCAI 2022 | CLFC基于对比学习的多模态脑肿瘤分割与单模态正常脑图像的特征比较 Multimodal Brain Tumor Segmentation Using Contrastiv ...

最新文章

  1. MySQL案例-多源复制引起的内存泄漏
  2. SLAM基础:相机与图像
  3. 页面字符太长用.....表示
  4. c++基础_特殊回文数
  5. 数字表达_关于数字、日期及时间的英文表达方式,这里都齐全了
  6. 【深度学习】相当全面的深度学习环境配置指南!(Windows、Mac、Ubuntu全讲解)...
  7. struts2结果类型
  8. IntelliJ IDEA 配置文件位置
  9. response.end后抛了异常_(七)异常处理
  10. java 访问路径_java获取项目访问路径的相关方法
  11. Docker 镜像使用(拉取、查看、使用、删除)
  12. Github 开源趋势榜 TOP 1:英伟达升级发布二代 StyleGAN!
  13. TCS2010(中国标准编写模板)安装教程+解决三级标题条无法设置
  14. 八种实用的免费游戏开发软件工具
  15. 计算机主机硬件部分组成,台式电脑主机的硬件组成部分
  16. hdu 4565(推公式、矩阵快速幂)
  17. Java学习第一周(2.20~2.24)
  18. 用Python写个超级小恐龙跑酷游戏,上班摸鱼我能玩一天
  19. pcb线路板制作过程分析
  20. iphone快捷指令蚂蚁森林能量_如何快速偷取蚂蚁森林能量?这有一个捷径……

热门文章

  1. 20号:JAVA的值传递与引用传递的正确理解
  2. 2018.10.04 NOIP模拟 航班(tarjan+树形dp)
  3. 数据结构47:查找算法
  4. SharePoint 2013 的HTML5特性之响应式布局
  5. HTMLCSS 第五天 笔记
  6. 数据结构练习(20)和为n连续正数序列
  7. JQuery Form AjaxSubmit(options)在Asp.net中的应用注意事项
  8. C#图解教程 第二十四章 反射和特性
  9. Linux下vsftpd的安装,Java上传文件实现。
  10. Java IO输入输出流 字符数组流 ByteArrayOutputStream/ByteArrayInputStream