目录

Abstract

Introduction

Related Work

Multi Module Multi Step(可以被理解成pipline方法)

Multi Module One Step(可以理解成联合抽取方法)

Task Definition

Method(Scoring-based Classifier)


Abstract

为了解决以往联合方法的导致的级联错误和信息冗余。本文提出了一种新的模型OneRel,将联合抽取转换为一个细粒度的三分类(即关系抽取的主体,关系类型,客体)问题。具体来说,我们的模型包括一个基于评分的分类器和一个针对特定关系的角标记策略。前者评估一个标记对和一个关系是否属于一个事实三元组。后者保证了一个简单而有效的解码过程。

Introduction

由于Pipline的方法忽略了实体抽取和关系抽取之间的交互,可能会导致出现错误传播问题。为了更好地开展复杂任务,我们通常将联合抽取分为多模块多步骤和多模块一步完成两种方法,具体详见下图1.

图1 图中虚线表示依赖

由上图可知,在多模块多步骤方法中,由于是分成三步去获取实体和关系,预测前期的实体如果产生错误会导致之后地预测错误。多模块一步骤方法分离地识别实体和关系,并且通过他们之间地隐藏关系将他们结合成一个三元组。但是,由于单独识别过程中实体和关系之间缺乏相互约束,这种方法容易产生冗余信息,导致装配三元组时出现错误。所以我们在这个方法中直接识别三元组地正确性。这样做地好出有三个,一是将头部实体,关系实体和尾部实体同时输入到一个分类模块中可以充分捕捉三个元素之间地依赖关系,从而减少冗余信息。第二,只使用一步分类,可以有效避免级联错误。第三,一模块一步的简单架构,使网络直观,易于训练。

Related Work

Multi Module Multi Step(可以被理解成pipline方法)

1. 识别句子中全部的实体,然后对每个实体对进行关系分类;

2. 先识别句子中的关系,不保留重复的关系;然后预测头部实体和尾部实体;

3. 首先识别句子中所有的头部实体,然后通过序列标注或者问答去推断相应的关系类型和尾部实体

缺点:会造成级联错误传播。

Multi Module One Step(可以理解成联合抽取方法)

1.  将实体和关系视作一个填表任务;

2. 将联合抽取任务视作一个集合预测问题,避免了考虑多个三元组的预测顺序问题;

缺点:但由于在单独的识别过程中,实体和关系之间没有足够的相互约束,这种多模块一步法不能完全捕获被预测实体和关系之间的依赖关系,导致在三元组构造过程中存在信息冗余。

Task Definition

对于给出的句子和预先定义的关系类型,从句子中找出所有可能的三元组,其中N表示的是三元组的数量,然后我们用来表示第q到第p个单词。

下面通过这个图来详细解释这个方法。

图2 Examples of the Rel-Spec Horns Tagging

由上图,每种实体关系类型对应着一个矩阵,图中一共有3个二维矩阵,也就是我们得到的是一个3维矩阵。我们使用BIE标签去标记单词在实体中的位置,其中H表示的头部实体,T表示的是尾部实体。HB表示的是头部实体的第一个单词,HE表示的是头部单词的最后一个单词,以此类推下去。其中矩阵a表示的是"New York City"和"New York State"之间的关系为"Located in"。对比矩阵b,c,我们只用了HB-TB,HB-TE,HE-TE三个标签来表示实体之间的对应。这样做的好处是仅使用3个标记可以在分类时有效的缩小搜索空间,且有足够的负样本,在解码的时候也会简单有效.

Method(Scoring-based Classifier)

1. 表示的时对应的token嵌入和位置嵌入之和。

2. 枚举所有可能的三元组,然后设计一个分类器去指定一个高信度标签,其中r_{k}表示的时随机初始化的关系类型。然后把三元组作为简单分类网络的输入。这样做可能有两个缺点,一个是简单网络无法学习到较多的信息,一个是这样做的时间复杂度很高,因为一个句子要有L*L*K次输入。

3.我们从知识图谱嵌入技术中受启发,创建了如下的分数函数,其中

,其中;表示concatenate,使用了ReLU激活函数。

4.最终的分数函数:

其中,同时计算token对对应的的显著性(salience),表示分数向量

5.将喂入softmax去预测相应的标签

6.损失函数

其中表示黄金标签。

OneRel: Joint Entity and Relation Extraction with One Module in One Step相关推荐

  1. 论文学习11-Adversarial training for multi-context joint entity and relation extraction(实体关系买抽取模型,对抗学习

    文章目录 1. introduction 2.相关工作 3.Model 3.1 Joint learning as head selection 3.2 AT 4.实验设置 5.结果 6.总结 实体关 ...

  2. 文献学习02-Effective Modeling of Encoder-Decoder Architcture for Joint Entity and Relation Extraction

    论文信息 (1)题目:Effective Modeling of Encoder-Decoder Architecture for Joint Entity and Relation Extracti ...

  3. 20-Joint entity and relation extraction based on a hybrid neural network(LSTM-ED+CNN),考虑长距离的实体标签之间的关

    文章目录 abstract 1.introduction 2.相关工作 2.1. Named entity recognition 2.2. Relation classification 2.3 联合 ...

  4. PURE(A Frustratingly Easy Approach for Entity and Relation Extraction)

    写作动机(Movitation): 假设驱动:作者认为现有的表征仅仅只学习到了实体和上下文之间的联系,并没有学习到实体对之间的依赖关系. 相关工作(Related Work): 联合学习的子任务: 1 ...

  5. 论文浅尝 | EARL: Joint Entity and Relation Linking for QA over KG

    Mohnish Dubey, Debayan Banerjee, Debanjan Chaudhuri, Jens Lehmann: EARL: Joint Entity and Relation L ...

  6. A Frustratingly Easy Approach for Entity and Relation Extraction 论文阅读

    一.概述 论文:https://paperswithcode.com/paper/a-frustratingly-easy-approach-for-joint 解读:https://mp.weixi ...

  7. 【论文解读】A Frustratingly Easy Approach for Entity and Relation Extraction

    Abstract 对于实体识别和关系抽取的联合任务,大多数使用结构化预测模型或共享参数. 而作者使用一个简单的流水线模型实现.方法使用两个独立的编码器,关系抽取的输入仅仅是实体识别的结果. 通过实验, ...

  8. 【论文】Awesome Relation Extraction Paper(关系抽取)(PART V)

    写在前面 之前介绍的关系抽取系列文章主要是属于pipeline形式的,即第一步用实体识别将关系对抽取出来,第二步才是对关系对的分类,这样的做法会导致误差的传递.另外有一种解决方案是端到端的joint ...

  9. 【实体对齐·HGCN】Jointly Learning Entity and Relation Representations for Entity Alignment

    文章目录 1.动机 2.输入输出 3.相关工作 4.模型 4.1 GCN 4.2 approximating relation representations 4.3 joint entity and ...

  10. 阅读分享:A Frustratingly Easy Approach for Entity and Relation Extraction-NAACL2021

    A Frustratingly Easy Approach for Entity and Relation Extraction 跳过背景.相关工作,直接来看方法 Ideas: different e ...

最新文章

  1. redis一般缓存什么样数据_门户数据展示_Redis缓存数据
  2. 【C语言运算符大全】快速学会C语言运算符
  3. 成功解决mod = importlib.util.module_from_spec(spec)ImportError: DLL load failed: 找不到指定的程序。
  4. python自定义函数画图_4.1-5 自定义函数
  5. 利用find同时查找多种类型文件
  6. 复练-面试的科技树-企业人才需求和招聘流程
  7. cad截图软件_AutoCAD电气制图协会线上CAD学习打卡活动结束
  8. 语音识别方案设计书.doc
  9. CSS3渐变——gradient
  10. 计算机组成原理第五章考试题,计算机组成原理第五章部分课后题答案(唐朔飞版).doc...
  11. uc android 4.2,uc网盘下载10.4.2 安卓版-uc网盘手机版西西软件下载
  12. linux终端解微分方程,解微分方程+ode求解器
  13. OllyDBG V1.10聆风听雨汉化版
  14. etc 文件夹下放什么内容
  15. js实现雪花飘落效果
  16. 统信UOS系统桌面回收站图标删除
  17. java web自动生成编号_2013-8-6 10:56:07 JAVA_WEB:员工号自动生成源代码
  18. 《卸甲笔记》-基础语法对比
  19. 浏览器--搜索操作符15个实例
  20. 【前端实例代码】使用 HTML CSS 和 JavaScript 实现具有彩色发光霓虹灯效果的数字时钟|前端开发 网页制作 基础入门教程

热门文章

  1. 【历史上的今天】12 月 12 日:英特尔创始人出生;PSP 发布;双十二购物狂欢节
  2. 荣耀8青春版android,华为荣耀8青春版有几个版本?荣耀8青春版低配版/标准版/高配版区别对比评测...
  3. 使用Java串口操作RXTX,报错 no rxtxSerial in java.library.path thrown while loading gnu.io.RXTXCommDriver解决方案
  4. ERP系统,是管理意志的体现
  5. 我裸辞 转行软件测试 然而没有人要我
  6. WSNs的SMAC协议的研究
  7. Swagger界面丑、功能弱怎么破?用Postman增强下就给力了!
  8. 使用Apache-ANT进行jar包合并
  9. (转帖)-对乒乓球的思考
  10. 赶紧用微信查询一下你的身份证,是否有人盗用你信息!