SSAN 关系抽取 论文笔记
20210621
https://zhuanlan.zhihu.com/p/353183322
[KG笔记]八、文档级(Document Level)关系抽取任务
共指id嵌入一样
但是实体嵌入的时候 可能是不同的表述 所以取上述的方式
- 抽取全局信息
我们通常可以把句子内部(intra-sentence)的特征信息称之为局部特征,而把跨句子(inter-sentence)的、篇章级的特征信息称之为全局信息。
对于局部信息的抽取基本等同于句子级别关系抽取的encoding model,比如可以使用Word2Vec/ GloVe+Bi-LSTM,BERT等。可以得到与token序列等长的特征序列。
在编码方面,现在的方法基本比较统一:使用GloVe或BERT得到token level embedding,使用可训练权重对token的类别(实体类别,无类别等)进行映射得到type embedding,使用可训练权重对相对位置映射得到relative position embedding。总体上来说token level的信息源就是自身语义、类型及相对位置信息。
由于sigmoid输出存在一个阈值选择的问题,文献[14]使用了一种特殊的任务构建方式实现了sigmoid输出层的自适应阈值。
^ Zhou W, Huang K, Ma T, et al. Document-Level Relation Extraction with Adaptive Thresholding and Localized Context Pooling[J]. arXiv preprint arXiv:2010.11304, 2020.
Relation Fact Alignment 问题
消息传播(Message Passing)就是每个节点的邻居所携带的信息通过一定的规则传播的该节点上。
依存关系分析,又称依存句法分析(dependency syntactic parsing),简称依存分析(denpendency parsing),作用是识别句子中词与词之间的相互依存关系。
依存关系用一个有向弧表示,叫做依存弧。依存弧的方向为由从属词指向支配词
https://zhuanlan.zhihu.com/p/369851456
本文主要是复现论文《Named Entity Recognition as Dependency Parsing》
重点
- 实体构造
考虑以下两种结构
共现结构: 两个词是否在同一个句子中
共指结构: 两个提及是否指向同一个实体
这两种结构都可以TRUE FALSE来描述
对于共现结构,我们将文档分割成句子,并将它们作为显示提及交互的最小单元。我们分别表示它们是内部的和句子间的。
在共指结构中,“True”表示两种提及指的是同一个实体,因此需要一起进行研究和推理;“False”意味着在某些谓词下可能相互关联的一对不同的实体。
我们将它们分别表示为coref和relate。
综上所述,这两种结构是相互正交的,导致了四种不同的无向依赖关系,如表1所示。
除了提及之间的依赖关系之外,我们进一步考虑实体提及与其句子内非实体词之间的另一种依赖关系。我们称它为intraNE。
对于其他句子间的非实体词,我们假设不存在关键依赖关系,并将其归类为NA。
因此,整个结构被表述为一个以实体为中心的邻接矩阵,其所有元素来自一个有限依赖集: (问题 邻接矩阵中的元素不是0,1吗 怎么这里有几种状态)
{intra+coref, inter+coref, intra+relate, inter+relate, intraNE, NA}
- SSAN
SSAN继承了Transformer 编码器的架构,它是一堆相同的块,用前馈网络、残差网络和层归一化包裹起来。作为其核心组成部分,我们提出了带有两个可选的转换模块的结构化的自我注意机制。
(这里的结构性是指 规定的几种实体减的关系类别)
基于这些输入和实体结构,我们计算非结构化注意分数和结构化注意偏向,然后将它们聚合在一起来指导最终的自我注意流。
非结构化注意分数是由Q-K在标准自注意力产生。
使用一个额外的模块,建模Q-K之间的结构性依赖。
这里的transformation 是什么意思 下面有解释
公式中,这三项分别代表:
基于Q向量的偏差
基于K向量的偏差
早期偏差
结构化自注意力的整体计算公式为:
根据上下文,由于Transformation层自适应地对结构性依赖进行建模,我们不会在不同的层或不同的注意头之间共享它们。
早期,Transformer提出输入token对的相对位置信息模型。
他们首先将相对距离映射到embedding中,然后将它们与K向量相加,然后计算注意力得分。
从技术上讲,这种设计可以看作是我们所分解的线性变换的简化版本,只包含查询条件偏差。
- SSAN for Relation Extraction
该模型以文档文本为输入,在整个编码阶段的实体结构指导下构建其上下文表示。
模型用交叉熵损失训练模型。
我们形式化实体结构的文档级关系提取。在此基础上,我们提出了SSAN来有效地整合这些结构先验,同时交互式地执行实体的上下文推理和结构推理。
在三个数据集上的性能验证了实体结构的有效性和SSAN模型的有效性。
https://blog.csdn.net/li_jiaoyang/article/details/113975711
【论文阅读】Entity Structure Within and Throughout: Modeling Mention Dependencies for Document-Level Relation
SSAN 关系抽取 论文笔记相关推荐
- 关系抽取论文整理,核方法、远程监督的重点都在这里
来源 | CSDN 博客 作者 | Matt_sh,编辑 | Carol 来源 | CSDN云计算(ID:CSDNcloud) 本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用. 笔 ...
- 关系抽取论文总结(relation extraction)不断更新
2000 1.Miller, Scott, et al. "A novel use of statistical parsing to extract information from te ...
- 关系抽取论文整理——早期文献
说明 本文是个人阅读文章的笔记整理,没有涉及到深度学习在关系抽取中的应用. 笔记中一部分来自个人解读,一部分来自原文,一部分来自网上摘录.[由于文章是分开做笔记,很多参考链接没有及时保留,还请谅解.如 ...
- 实体关系抽取学习笔记
1 关系抽取概述 1.1 简介 信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息.关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系. 关系抽取对于很多 ...
- EMNLP2021 | DeepBlueAI团队少量数据关系抽取论文被录用
近日,EMNLP 2021在官网提前公布了今年的论文审稿结果,DeepBlueAI团队的论文<MapRE: An Effective Semantic Mapping Approach for ...
- 深度学习实体关系抽取研究综述笔记
鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述.软件学报,2019,30(6): 1793−1818. http://www.jos.org.cn/1000-982 ...
- 远程监督关系抽取漫谈:结合知识图谱和图神经网络
远程监督关系抽取是一种用知识图谱去对齐朴素文本的标注方法,属于半监督学习算法,自然而然提取特征的时候就会出现很多噪声.比如两个实体之间还有别的关系或者是没有关系,这样的训练数据会对关系抽取器产生影响. ...
- 3种基于深度学习的有监督关系抽取方法
摘要:本文对几种基于深度学习的有监督关系抽取方法进行了介绍,包括CNN关系抽取.BiLSTM关系抽取以及BERT关系抽取. 本文分享自华为云社区<基于深度学习的有监督关系抽取方法简介>,作 ...
- 入门文档级关系抽取_数据集DocRED、CDR、GDA
作为学习文档级关系抽取的短暂总结与记录.主要是相关数据集问题,如果能帮助到其他人,我也是很开心的. 文档级关系抽取论文 网上有很多文档级关系抽取的综述,他们会告诉你有哪些经典文献需要阅读,我就不再搬运 ...
最新文章
- 多项式拟合缺点_曲线拟合方法的选择
- 小肚皮最新版本_小肚皮官方版下载_小肚皮app - Win7旗舰版
- status_code想要得到302却得到200_中考200天倒计时!教你高效规划!抓紧抢报预留座位!...
- 点分治经典_动态点分治
- webpack联邦模块之consumes方法
- 新加坡教育(20181101)
- python绘制动态心形_python绘制动态爱心
- AJAX简单使用介绍
- php discuz 定时计划,为什么discuz这个功能计划任务功能不用事件调度呢?
- 嵌入式Linux系统编程学习之三十一线程的属性
- 苹果全面封杀Facebook:原因不能忍
- 如何在symfony 控制器里面创建soap web service
- Spring Cloud分布式微服务系统中利用redssion实现分布式锁
- PS颜色校正(Photoshop颜色显示偏色)
- (二三)计算机组成原理笔记整理之系统总线(总线判优方式,标准传输率,数据总线,地址总线与MDR,MAR的关系等)
- Java-TreeSet与Comparable的详讲与实现
- 学会生命倒计时法,就是精彩生活的开始
- MNF最小噪声分离变换
- C语言scanf函数用法详细解释!!!
- 公司打卡签到活动小程序,打卡更轻松,管理更便捷JavaScript 错误 - throw、try 和 catch