论文介绍:

《Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy》[1]

《A Novel Cascade Binary Tagging Framework for Relational Triple Extraction》[2]

《Entity-Relation Extraction as Multi-turn Question Answering》[3]

《TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking》[4]

ETL-span: Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy

方法:

标记方案(Tagging Scheme)

本文使用了联合抽取的方法,使用了标记策略对实体和关系进行抽取。本方法分为两个阶段,第一个阶段抽取头实体(HE),第二个阶段抽取尾实体和关系(TER)。作者将第一个阶段的头实体抽取分解成两个独立的子任务,第一个任务标注HE的第一个词,第二个任务标注HE的最后一个词。对于已经抽取出来的HE,对其进行尾实体(TE)和对应关系抽取。例如下图,对于抽取出来了的实体“Trump”,我们对其进行尾实体和关系类型抽取,这一阶段本质上类似于命名实体识别,即第一阶段。这里可以注意到已经解决了SEO问题,但是没有解决EPO问题且没有识别客体的实体类型。

总的来说,就是第一阶段抽取头实体及其类型,第二阶段抽取客实体及其关系类型。我们使用t表示抽取的目标,l表示抽取的类型(第一阶段是实体类型,第二阶段是关系类型),下面的公式表示抽取目标。其中s_t表示抽取目标的开始位置,e_t表示抽取目标的结束位置。

层级边界标记器(Hierarchical Boundary Tagger, HBT)

在具体的实现部分,使用了一个BiLSTM编码器来编码信息,得到了每个token的表征,公式如下

h_i = BiLSTM_{sha}(x_i)

HE Extractor

在头实体抽取部分,把训练得到的token隐向量和全局向量g串联起来作为HE部分的embedding(即x_i = [h_i;g]),输入到HE抽取器中,得到最终所需要的实体位置,如下图左边的左半部分,其中公式中的H_{HE} = \{x_1,x_2,\dots,x_n\}

R_{HE} = HBT_{HE}(H_{HE})

TER Extractor

对于尾实体和关系抽取部分,作者仍然把token embedding和全局向量g串联作为表征,但是简单的串联不足以检测实体和关系。所以作者把上一步中的得到的头实体的头向量和尾向量串联起来作为头实体特征h^{h}。此外,还融入了token位置信息p_{i}^{ht}。具体公式如下。

x_i = [h_i;g;h^h;p_{i}^{ht}]

R_{TER} = HBT_{TER}(H_{TER})

实验结果

A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

方法

本文采用了联合抽取,对句子首先抽取主体词,然后根据主体词和关系去找客体词。作者提出了一种关系函数,将提取出的主体词作为因变量,去输出客体词。

主体词标记器(Subject Tagger)

本文采用了Bert Encoder,对于Bert训练得到每个token的表示x_i,对每个token进行两次变换,得到每个token为实体开始位置和实体结束位置的概率,公式如下。

p_{i}^{start\_s} = \sigma (W_{start}x_i + b_{start})

p_{i}^{end\_s} = \sigma (W_{end}x_i + b_{end})

其中,p表示概率,如果概率超过了某个阈值,那么那个token的tag会被标记为1,反之标记为0。\sigma表示sigmoid激活函数。

客体关系标记器(Relation-specific Object Taggers)

在客体抽取部分,作者对每个抽取出的主体,进行不同关系的客体抽取,和主体抽取不同的是,客体部分融入了上一阶段抽取出的主体表征,具体公式如下。

p_{i}^{start\_o}=\sigma (W^{T}_{start}(x_{i}+v_{sub}^{k})+b_{start}^{r})

p_{i}^{end\_o}=\sigma (W^{T}_{end}(x_{i}+v_{sub}^{k})+b_{end}^{r})

其中,p表示概率,v_{sub}^{k}表示上一阶段抽取出的第k个主体表征

实验结果

Entity-Relation Extraction as Multi-turn Question Answering

方法

本文使用了基于阅读理解的方法,将实体关系抽取转化成多轮问答,抽取实体和关系被转化成识别答案片段的形式。

本文主要使用了两个问题模板来抽取,分别是实体问题模板和关系链式模板。实体问题模板用于从文本中找出所有可能在关系中的实体,接着对每个被找出来的实体进行关系提问。具体算法如下图。

问题模板设计如下

实验结果

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking

(9条消息) TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_hithithithithit的博客-CSDN博客https://blog.csdn.net/qq_38901850/article/details/124991788?spm=1001.2014.3001.5501

方法

本文将实体和关系抽取进行统一编码,主要策略是对所以token pair进行打标签。

References:

[1] Bowen, Yu, Zhenyu Zhang, Jianlin Su, Yubin Wang, Tingwen Liu, Bin Wang and Sujian Li. “Joint Extraction of Entities and Relations Based on a Novel Decomposition Strategy.” ArXiv abs/1909.04273 (2020): n. pag.

[2] Zhepei Wei, Jianlin Su, Yue Wang, Yuan Tian, and Yi Chang. 2020. A Novel Cascade Binary Tagging Framework for Relational Triple Extraction. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1476–1488, Online. Association for Computational Linguistics.

[3]Xiaoya Li, Fan Yin, Zijun Sun, Xiayu Li, Arianna Yuan, Duo Chai, Mingxin Zhou, and Jiwei Li. 2019. Entity-Relation Extraction as Multi-Turn Question Answering. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 1340–1350, Florence, Italy. Association for Computational Linguistics.

[4] Yucheng Wang, Bowen Yu, Yueyang Zhang, Tingwen Liu, Hongsong Zhu, and Limin Sun. 2020. TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking. In Proceedings of the 28th International Conference on Computational Linguistics, pages 1572–1582, Barcelona, Spain (Online). International Committee on Computational Linguistics.

关系抽取论文阅读笔记相关推荐

  1. 关键字抽取论文阅读笔记

    刘知远老师博士论文-基于文档主题结构的关键词抽取方法研究 一.研究背景和论文工作介绍 关键词抽取分为两步:选取候选关键词和从候选集合中推荐关键词. 1.1. 选取候选关键词 关键词:单个词或者多个单词 ...

  2. [论文阅读笔记53]2021深度神经方法的关系三元组抽取综述

    1. 题目 Deep Neural Approaches to Relation Triplets Extraction: A Comprehensive Survey Tapas Nayak†, N ...

  3. [论文阅读笔记52]深度学习实体关系抽取研究综述

    来源:软件学报 2019 1.摘要: 围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系 抽取研究进展,并对未来可能的研究方向进行了探讨和展望. 2.经典的实体关系抽取方法 ...

  4. 关系抽取论文整理,核方法、远程监督的重点都在这里

    来源 | CSDN 博客 作者 | Matt_sh,编辑 | Carol 来源 | CSDN云计算(ID:CSDNcloud) 本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用. 笔 ...

  5. 论文阅读笔记——VulDeePecker: A Deep Learning-Based System for Vulnerability Detection

    本论文相关内容 论文下载地址--Engineering Village 论文中文翻译--VulDeePecker: A Deep Learning-Based System for Vulnerabi ...

  6. 论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning

    论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning 本文通过神经网络利用了减少轮数的 Speck 的差分性质.为此,作者对神经网络 ...

  7. 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络

    论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...

  8. 虚假新闻检测的论文阅读笔记——sigir2021:User Preference-aware Fake News Detection

    文章目录 1.虚假新闻检测的相关简介 2.本篇论文引言 3.模型介绍 3.1.内生偏好编码器 3.2.外生内容编码器 3.3.二者信息融合 4.实验 4.1.各模型的实验结果 4.2.消融实验 5.结 ...

  9. [论文阅读笔记36]CASREL代码运行记录

    <[论文阅读笔记33]CASREL:基于标注与bert的实体与关系抽取>https://blog.csdn.net/ld326/article/details/116465089 总的来说 ...

  10. Recognition Emotion Cause in Conversations 论文阅读笔记

    Recognition Emotion Cause in Conversations 论文阅读笔记 1.第一遍阅读 1.1 标题 Recognition Emotion Cause in Conver ...

最新文章

  1. 后APP时代的破局之路 :阿里技术“三大容器五大方案”亮相,百川开放全面升级...
  2. 如何识别数据中心的能源浪费?
  3. 今日小程序推荐:香蕉打码-二维码随意生成
  4. 给年薪不到48w的程序员提个醒!!
  5. 如何做一名出色的屌丝码农?
  6. 收获,不止SQL优化——抓住SQL的本质--第九章
  7. Python批量修改Word文档中特定关键字的颜色
  8. 【小工匠聊Modbus】07-错误响应
  9. Chrome扩展推荐
  10. 网站采集软件,全自动网站文章采集器,一键网页数据抓取
  11. 这可能是最简单易懂的机器学习入门(小白必读)
  12. 国际贸易基础(一)找客户
  13. SL4A apk 编译生成
  14. 找出水王 java_寻找水王1
  15. 美股投资指南 – 网上美股开户其实很简单
  16. 顺芯ES8374单声道codec音频解码芯片,集成功放IC
  17. 如何配置一台深度学习的主机
  18. RuntimeError: a view of a leaf Variable that requires grad is being used in an in-place operation.
  19. B2B的商务模式主要存在哪些缺点?
  20. 代码审查(Code Review)

热门文章

  1. sqlserver 日期与字符串之间的转换
  2. 一起学爬虫(Python) — 22 自动化详解
  3. 在word文档中插入代码_如何在自动更新的Word文档中插入当前的月份和年份
  4. 用js实现建议绘图板
  5. python qt5开发实例_python GUI库图形界面开发之PyQt5简单绘图板实例与代码分析
  6. 【网络】如何判断网络达到瓶颈
  7. 普度大学计算机科学博士,普渡大学计算机系 Yongle Zhang课题组招收全奖博士生...
  8. 【第十八题】填坑I(北理工/北京理工大学/程序设计方法与实践/小学期 )
  9. html5 边框效果图,图片边框border-image的用法
  10. ABtest用于推荐系统性能衡量