笔记整理 | 朱珈徵,天津大学硕士


链接:https://www.aclweb.org/anthology/2020.emnlp-main.132.pdf

动机

从自由文本中提取实体和关系是自然语言处理中的一项重要任务。它的目标是识别具有特定类型(实体)和这些实体(关系)之间的语义关系的文本。本文主要研究联合实体关系的提取。在这篇文章中,作者将跨域相关资讯整合到预先训练好的编码器中,以执行实体关系抽取作业。并在预训练网络中引入了一个span编码器和一个span对编码器,使得跨内和跨间信息更容易导入预训练模型,而不是使用通用的句子编码器(如现有的通用预训练模型)。为了学习编码器,作者从不同的角度设计了三个定制的预训练目标,分别针对token、span和span对。特别地,训练span编码器以恢复span中令牌的随机洗牌,并且训练span对编码器以使用对比丢失来预测来自相同句子的正对和来自不同句子的负对。实验结果表明,该预训练方法优于远程监督预训练方法,在两个实体关系抽取基准数据集(ACE05,SciERC)上取得了良好的效果。


亮点

该工作的亮点主要包括:

(1)引入了一个跨距编码器和一个跨距对编码器,将跨距内和跨距间的信息整合到预训练网络结构中,这在通用的预训练模型中是被忽略的。

(2)设计了三种新的目标,标记边界目标、跨度排列目标和对比跨度对目标来学习更好的编码器。

(3)实验结果表明,该方法不仅在实体关系抽取任务上超过了BERT,而且在ACE05数据集上取得了显著的改进,与SciERC数据集上的最新成果相当


概念及模型

给定一个输入句子 



























 和x中的一组跨度S(随机抽样),预训练模型的目标是获得每个跨度 






 的上下文向量表示,以及每个跨度对(s1,s2)的上下文向量表示。如下图所示,预训练任务优化了共享transformer网络、span级CNN和关于令牌边界目标、span置换目标和对比span对目标的注意参数。与通常的预训练语言模型不同,该网络包含了丰富的跨内和跨间信息。一旦该网络被预先训练,就可以为实体关系提取任务对其进行微调。

  • 句子编码器

为了获得句子x中每个标记的上下文表示hi,作者使用多层Transformer作为基本编码器,就像其他的预训练模型一样,如UNILM、BERT和XLM。多层Transformer的输出通过以下方式计算:

xi的单词表示xi跟随BERT的单词表示,并对相应的标记、段和位置嵌入求和。

  • 跨距编码器

给定句子中的Span  






 ,为了计算相应的上下文Span表示hs,作者使用了一个CNN(一个单一的卷积层,带有一个最大池化层,后面是向量 
















 上的MLP。如上图的右边部分所示。

  • 跨距对编码器

给定句子x中的跨度对p=(s1;s2),句子x被分成五个跨度,即左上下文(L)、s1、中上下文(M)、s2和右上下文(R)。为了获得相应的上下文跨度对表示 

















  ,作者首先使用跨度编码器来提取关于五个跨度的五个特征向量。设 





































 为span编码器计算的相应表示。为了使模型能够关注更多的信息广度,作者将跨度对p表示为一个位置感知注意机制的上下文广度表示的加权和:

其中注意力得分aj可以计算为:

  • 预训练目标

TokenBoundary Objective (TBO):提出了一个变体的MLM,具体地说,对于每个令牌,作者屏蔽除第一个子令牌之外的子令牌,然后用第一个子令牌表示和相应的位置嵌入来预测被屏蔽的子令牌。在实验中,为每个句子随机选择15%的子标记来实现这个目标。

SpanPermutation Objective (SPO):提出了一种不同的策略来将跨内信息整合到预训练模型中。SpanBERT仍然致力于增强单个标记的表示,而作者强调整个跨度的上下文表示。不是在SpanBERT中预测一个被屏蔽的span的每个标记,而是在span中洗牌这些标记,然后期望模型能够识别中断。

ContrastiveSpan Pair Objective (CSPO):提出了一种基于对比学习框架的跨对层次目标。受InfoWord的启发,它将跨度及其匹配的上下文(即同一句子中的上下文)视为正对。否则作为否定对。作者把这个想法推广到span对的层次上。

理论分析

实验

在这一部分,作者在ACE05和SciERC两个基准实体关系提取数据集上进行了实验。ACE05数据集为文档集合注释实体和关系类型。它是实体关系抽取任务的标准语料库。语料库中有7种实体类型和6种关系类型。SciERC数据集提供500篇科学摘要的实体注释、参考注释和关系注释,这些科学摘要均来自会议/研讨会的论文集。实验中只使用实体和关系的注解。语料包含6种科学实体类型和7种关系类型。实验像之前的工作一样将Fl评分作为评估标准。具体来说,如果一个输出实体的类型和边界是正确的,那么它就是正确的;如果它的类型和它的两个参数实体是正确的,那么输出关系就是正确的(即完全匹配)。

上表为模型在ACE05数据集上的实验结果,将这篇文章的方法与上表中以前的工作进行比较。总的来说,作者提出的预训练方法“SPE”在两种关系评价方法上都比现有的模型有了显著的改进。特别是,它比基于LSTM的GCN联合模型提高了4.1分,比基于bert的QA模型提高了3.0%;与多任务学习相比较在ELMO和BERT上也取得了显著的改善。值得注意的是,该模型的实体检测结果表现不佳,主要原因是在微调步骤中,作者不引入额外的监督信号,如参考解析和事件提取。然而,即使没有额外的多任务训练数据,该模型仍然获得了最佳的关系性能,证明
了所提出的训练前方法对于实体关系提取任务的有效性。

上表为模型在SciERC数据集上的实验结果,基线方法是使用ELMOembeddings学习多任务和使用BERT进行多任务学习。从上表的上面一部分来看,“BERT”和“SPE”在实体性能和关系性能上都显著优于ELMO。作者把这一现象归因于BERT的强大能力。“SPE”的性能优于“BERT”,表明所提出的目标在实体关系提取方面很有帮助,并且能够将跨度信息整合到预先训练的模型中。该预训练模型可以匹配先前最先进的BERT多任务学习方法,而无需额外的多任务学习数据。

总结

提出了一个具有三个目标的预训练网络体系结构,可以将跨内信息和跨间信息整合到预训练模型中。与通用的预训练模型相比,作者引入了一个跨度编码器和一个跨度画式编码器。通过设计三个预训练目标,作者可以更好地学习为实体关系提取任务定制的预训练编码器。在两个基准数据集上的实验验证了所提预训练方法的有效性。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 | 利用跨内和跨间信息的预训练实体关系编码器相关推荐

  1. 论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

    论文笔记整理:王狄烽,南京大学硕士,研究方向为关系抽取.知识库补全. 链接:https://arxiv.org/pdf/1903.01306.pdf 发表会议:NAACL2019 动机 现有的利用远程 ...

  2. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  3. 论文浅尝 | 利用 KG Embedding 进行问题回答

    论文笔记整理:吴杨,浙江大学计算机学院,知识图谱.NLP方向. http://research.baidu.com/Public/uploads/5c1c9a58317b3.pdf 动机 本文主要针对 ...

  4. 论文浅尝 | 利用常识知识图谱进行多跳推理的语言生成方法

    笔记整理 | 朱珈徵,天津大学硕士. 链接:https://arxiv.org/pdf/2009.11692.pdf 动机 尽管生成式预训练语言模型在一系列文本生成任务上取得了成功,但在生成过程中需要 ...

  5. 论文浅尝 | 知识图谱问答中的层次类型约束主题实体识别

    Citation:Qiu, Y., Li, M., Wang, Y., Jia, Y., & Jin, X.(2018). Hierarchical Type Constrained Topi ...

  6. 论文浅尝 | 利用边缘标签的网络嵌入强化方法

    链接:https://arxiv.org/pdf/1809.05124.pdf 本文主要关注Network embedding问题,以往的network embedding方法只将是网络中的边看作二分 ...

  7. 论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

    来源: IJCAI2018 链接: https://www.ijcai.org/proceedings/2018/0556.pdf 动机 近年来,随着多语言知识图谱嵌入(Multilingual KG ...

  8. 论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

    本文转载自公众号:机器之心. 选自arXiv 作者:Yue Zhang.Jie Yang 机器之心编译 参与:路.王淑婷 近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一 ...

  9. 论文浅尝 | 利用开放域触发器知识改进事件检测

    笔记整理 | 申时荣,东南大学博士 来源:ACL 2020 源码:https://github.com/shuaiwa16/ekd.git 摘要 事件检测(ED)是文本自动结构化处理的一项基本任务.由 ...

最新文章

  1. 跨网页的新手引导_IOS中新手引导页面的实现(新手引导,Guide)
  2. 由点到面(面试经验)
  3. python qcut_Python之Pandas库学习(三):数据处理
  4. requests库之处理响应
  5. 求余运算转换为位运算
  6. vue 使用了浏览器的刷新之后报错_98、解决vue-cli3项目运行时sockjs报错问题
  7. 基于HLS流媒体协议视频加密的解决方案
  8. matlab fft2 fftshift,matlab fft fftshift
  9. 基于微信小程序的校园论坛系统开发过程
  10. 出去锻炼还是不让数据科学决定
  11. VMware虚拟机使用记录
  12. STM32掌机教程8,背景音乐
  13. Cocos2d-iphone学习笔记
  14. 微信分享多个图片和文字到朋友圈
  15. 国际期货和国内期货的区别带招商
  16. 微信小程序测试点汇总
  17. 一度智信:拼多多探路知识普惠
  18. Mapbox Style 规范(中文)
  19. Revit二次开发之技能篇(二)———轴网尺寸标注
  20. 阿龙学堂-hdfs存储数据倾斜

热门文章

  1. [VC]旋转位图图片的算法函数
  2. boost.asio防止恶意空连接的方法
  3. 写flash,要不要加个判断?
  4. 这5个bug我不信你没有写过
  5. camera中文版软件 ip_ip camera网络摄像机
  6. python爬酷狗音乐_良心推荐!一个Python高手必读的库,真香!
  7. python bottle框架 运维_python bottle 框架实战教程:任务管理系统 V_1.0版 | linux系统运维...
  8. 天池 在线编程 求和查找
  9. LeetCode 1636. 按照频率将数组升序排序(哈希+排序)
  10. LeetCode 848. 字母移位(前缀和+取模)