https://zhuanlan.zhihu.com/p/342300800(https://zhuanlan.zhihu.com/p/342300800)
https://zhuanlan.zhihu.com/p/346897151(https://zhuanlan.zhihu.com/p/342300800)

Pipeline方式

联合抽取主要分为2种范式:

多任务学习:即实体和关系任务共享同一个编码器,但通常会依赖先后的抽取顺序:关系判别通常需要依赖实体抽取结果。这种方式会存在暴漏偏差,会导致误差积累。
结构化预测:即统一为全局优化问题进行联合解码,只需要一个阶段解码,解决暴漏偏差。

暴漏偏差:指在训练阶段是gold实体输入进行关系预测,而在推断阶段是上一步的预测实体输入进行关系判断;导致训练和推断存在不一致。

每个关系都是单独的两个矩阵

上图给出了一个完整的标注和编码示意图,标记有“0、1、2”三种。

编码部分实际上是将原始的Span矩阵会展开为一个[公式]序列进行编码,也就是将token pair的每一个token编码拼接在一起。

TPLinker的解码过程为:

1、解码EH-to-ET可以得到句子中所有的实体,用实体头token idx作为key,实体作为value,存入字典D中;
2、对每种关系r,解码ST-to-OT得到token对存入集合E中,解码SH-to-OH得到token对并在D中关联其token idx的实体value;
3、对上一步中得到的SH-to-OH token对的所有实体value对,在集合E中依次查询是否其尾token对在E中,进而可以得到三元组信息。
结合上图的具体case,我们具体描述一下解码过程:

解码EH-to-ET中得到3个实体:{New York,New York City,De Blasio}; 字典D为:{New:(New York,New York City),De:(De Blasio)}

以关系“mayor”为例,

1、解码ST-to-OT得到集合E:{(City,Blasio)};解码SH-to-OH得到{(New,De)},其在字典D中可关联的subject实体集合为{New York,New York City};object集合{De Blasio};
2、遍历上述subject集合和object集合,并在集合E中查询尾token,发现只有一个实体三元组{New York City,mayor,De Blasio}
以关系“born in”为例,

1、解码ST-to-OT得到集合E:{(Blasio,York),(Blasio,City)};解码SH-to-OH得到{(De,New)},其在字典D中可关联的subject实体集合为{De Blasio};object集合为{New York,New York City};
2、遍历上述subject集合和object集合,并在集合E中查询尾token,可得到2个实体三元组:{De Blasio,born in,New York}和{De Blasio,born in,New York City}
由于关系live in与born in一样,所以我们最终可得到5个三元组:

(New York City, mayor, De Blasio), (De Blasio, born in, New York), (De Blasio, born in, New York City), (De Blasio, live in, New York), (De Blasio, live in, New York City)

其实,只要TPLinker的解码过程,对这篇论文就会有深刻的理解了!大家一定要多看哦~

TPLinker实体关系抽取新范式TPLinker:单阶段联合抽取,并解决暴漏偏差~相关推荐

  1. 【关系抽取】TPLinker:单阶段联合抽取,并解决暴漏偏差

  2. 一人之力,刷爆三路榜单!信息抽取竞赛夺冠经验分享

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达文 | JayLou娄杰 在现如今的NLP竞赛中,信息抽取(IE)任务已占据半壁江山.来 ...

  3. [实体关系抽取]TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Link

    2020.10.26|COLING-2020|中国科学院大学|原文链接|源码链接 TPLinker: Single-stage Joint Extraction of Entities and Rel ...

  4. 文献阅读6-Entity-Relation Extraction as Multi-turn Question Answering(实体关系联合抽取,层次标签依赖关系,multi-turn QA)

    文章目录 abstract 1.Introduction 3.相关工作 2.2MRC(机器阅读理解) 2.3 非QA->QA 3.数据集和任务 3.1别人的数据集 3.2我们建立的数据集RESU ...

  5. 基于主体掩码的实体关系抽取方法

    点击上方蓝字关注我们 基于主体掩码的实体关系抽取方法 郑慎鹏1, 陈晓军1, 向阳1, 沈汝超2 1 同济大学电子与信息工程学院,上海 201804 2 上海国际港务(集团)股份有限公司,上海 200 ...

  6. 论文浅尝 | 使用位置敏感的序列标注联合抽取实体和重叠关系

    论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱.自然语言处理. 链接:https://wvvw.aaai.org/ojs/index.php/AAAI/article/view/4591 动机 ...

  7. nlp中的实体关系抽取方法总结

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要35分钟 跟随小博主,每天进步一丢丢 来自:知乎 地址:https://zhuanlan.zhihu.com/p/77868938 作者:Jay ...

  8. 论文阅读04:使用序列标注的方式解决实体和关系的联合抽取

    公众号:数据挖掘与机器学习笔记 Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme 1.摘要 实体和关 ...

  9. ​达摩院文档级关系抽取新数据集和五元组抽取新任务

    ©PaperWeekly 原创 · 作者 | 邴立东.谭清宇等 单位 | Alibaba DAMO, NUS, SUTD 关系抽取(RE)是 NLP 的核心任务之一,是构建知识库.事件抽取等下游应用的 ...

最新文章

  1. 两种方法动态加载外部原生JS文件
  2. 清华、北大、中科院六位专家同台论道:生物智能的本质与下一代类脑AI
  3. 实战:在远程网络配置DNS转发
  4. 《C语言点滴》一1.5 内功修炼
  5. Code Review效率低?来试试智能语法服务
  6. 户外lisp导向牌如何安装_安装案例|户外标识牌常用安装方法
  7. Microsoft Visual C++ 2005 SP1无法安装
  8. Oracle Flash Storage System新版手册集
  9. 鸡啄米VS2010/MFC编程入门教程——学习3(安装VS2010)
  10. 盘点10种局域网联机游戏
  11. 记下js dom动态添加事件的解决方法
  12. 2016年ios公开可利用漏洞总结
  13. SpringCloud项目搭建(六) —elastic-job的使用,以及consul的配置使用(衔接上篇)
  14. 绘制热力图seaborn.heatmap,cmap设置颜色的参数
  15. 陈式太极拳小架一路拳谱(陈鑫拳架)
  16. docker 容器设置自动重启
  17. 【大数据】RAID介绍
  18. 100元的C++软件开发培训班
  19. 熊猫阿波的故事及C++保留小数点的问题
  20. android 3大内核,Android EX Kernel Manager(内核管理器) v3.57内购版

热门文章

  1. IPFS和梅克尔森林
  2. 如何写一封好的情书?Python三步爬取全网情诗信息
  3. 机器学习之聚类算法:K均值聚类(一、算法原理)
  4. GitHub标星90K,这份持续霸榜的Leetcode刷题手册到底有多强?
  5. Microarchitecture: HyperThreading(超线程)
  6. 技术解析:一文看懂 Anolis OS 国密生态
  7. windows10下用PowerShell命令(Get-FileHash)校验文件的Hash值(MD5、SHA1、SHA256等)
  8. 在Android上应用PhoneGap和Dojo Mobile
  9. 连接GitHub提示远程主机关闭连接
  10. 伦敦国王学院计算机申请要求,伦敦大学国王学院计算机科学与管理本科申请条件.pdf...