论文笔记 EMNLP 2020|Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation
文章目录
- 1 简介
- 1.1 动机
- 1.2 创新
- 2 背景知识
- 3 方法
- 4 实验
1 简介
论文题目:Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation
论文来源:EMNLP 2020
论文链接:https://arxiv.org/pdf/2002.10757.pdf
代码链接:https://github.com/cuishiyao96/eegcned
1.1 动机
- 目前的基于GCN的事件检测的方法没有考虑依赖标签的类型。
1.2 创新
- 提出了EE-GCN模型,同时融合句法结构和依赖标签的类型,通过依赖上下文的方式,学习和更新关系表示。
2 背景知识
在ACE 2005数据集中,“nsubj”,“dobj”,"nmod"占触发词相关的依赖标签的32.2%。(每个关系在全部40个依赖关系中平均占2.5%)
3 方法
模型的整体框架如上图所示,总共分为下面三部分:
- 输入层:拼接词编码wiw_iwi和实体类型编码eie_iei,然后通过BiLSTM编码上下文信息。
- 图卷积层:EE-GCN是GCN的扩展,将邻接矩阵表示为E∈Rn×n×pE\in{R}^n×n×pE∈Rn×n×p,Ei,j,:∈RpE_{i,j,:}\in{R}^pEi,j,:∈Rp是结点i和结点j之间的p维关系表示。EE-GCN的每层分为两部分,分别更新结点表示(H)和边表示(E)
结点更新模块:通过邻接矩阵聚合邻居信息。公式如下(Pool为平均池化):
边更新模块:由于相同的依赖标签在不同的上下文中可能传递不同的信息,因此需要根据结点上下文更新边的表示。公式如下(hijh_i^jhij为第j层结点i的表示):
- 分类层:对每个word进行分类。
loss函数如下:(α\alphaα为偏差权重,I(O)I(O)I(O)为开关函数,如果标签为“O”等于1,否则为0):
4 实验
实验数据集为ACE 2005数据集,使用Stanford CoreNLP toolkit进行依存句法分析,句子的最大长度设置为50,通过padding短的句子和切断长的句子。在ACE 2005的实验结果如下:
消融实验的结果如下图:
不同边维度的实验结果:
依赖标签的消融实验:移除类型依赖的标签在测试集上的F1=75.51%,分别添加nmod、nsubj、dobj依赖标签,F1值分别提高为77.09%,77.22%,76.69%。
不同事件类型的表现:EE-GCN显著提升了END-ORG、Start-ORG的F1值,在ACQUIT、ETRADITE和NOMINATE上表现较差。
不同层数GCN的实验结果:
效率分析:
个案的可视化结果:
论文笔记 EMNLP 2020|Edge-Enhanced Graph Convolution Networks for Event Detection with Syntactic Relation相关推荐
- 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning
文章目录 论文概况 摘要 1 介绍 2 方法 2.1 特征表示 2.1.1 蛋白质的图表示 2.1.3 边特征表示 2.2 EGAT的结构 2.2.2 边缘聚合图关注层 2.2.3 预测概率 2.2. ...
- 论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein In
文章目录 一.摘要 二.方法 (一).蛋白质图的表示 (二).节点级特征表示 (三).边级特征表示 (四). EGAT结构的主要特点 (五).边缘聚合图关注层 (六).在计算注意力分数时使用边缘特征 ...
- Graph Embedding学习笔记(3):Graph Convolution Networks
笔记 从Graph的视角看CNN,上图左右两个部分是等价的.左子图每个网格的通道,对应右子图每个节点的一个属性,左子图卷积核的参数相当于右子图边的权重.所谓3x3卷积就是右子图9个节点属性的加权平均( ...
- 论文笔记 EMNLP 2020|Graph Transformer Networks with Syntactic and Semantic Structures for Event Argument
文章目录 1 简介 1.1 创新 2 方法 3 实验 1 简介 论文题目:Graph Transformer Networks with Syntactic and Semantic Structur ...
- 论文笔记 EMNLP 2020|Resource-Enhanced Neural Model for Event Argument Extraction
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Resource-Enhanced Neural Model for Event Argument Extrac ...
- 论文笔记 EMNLP 2020|Event Extraction by Answering (Almost) Natural Questions
文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Event Extraction by Answering (Almost) Natural Questions ...
- (论文笔记)An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition
An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition 文章目录 An ...
- 交通预测论文笔记《Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting》
AAAI2019 0 摘要 交通流数据通常有很高的非线性和很复杂的特征.目前很多交通预测的方法缺乏对交通数据时空相关性的动态建模. 本文提出了一种基于注意力的时空图卷积神经网络(ASTGCN)来解决交 ...
- 论文笔记:Semi-Supervised Classification with Graph Convolutional Networks
Semi-Supervised Classification with Graph Convolutional Networks 1.四个问题 要解决什么问题? 半监督任务.给定一个图,其中一部节点已 ...
最新文章
- matlab matlabpool,Matlab matlabpool函数undefined
- 世界顶级赛事百万座位如何做到票务限时匹配?
- Qt之两种初始化QListWidget的方法
- python快速入门 pdf-十分钟快速入门python
- c语言socket原理,Socket底层原理
- Bochs调试Linux内核初级入门2、bochs调试断点和单步指令、0x7c00、关中断和开中断指令
- Android触摸事件源码分析:Activity-ViewGroup-View
- oracle product文件,快速修复Oracle参数文件的另类方法
- Power Transmission
- 深度学习(三十九)——深度强化学习(2)概述, Deep Q-learning Network(1)
- javaeye怎么打不开了?当前!2010,10,24,23:08
- 设置UITableView的separatorInset值为UIEdgeInsetsZero,分隔线不最左端显示的问题
- Python密码生成器
- CentOS7中安装PostgreSQL客户端
- 猿题库高中同步微博运营策划
- DCMTK实现Dicom CT图片读取CT值图像
- 2011年分形艺术国际大赛比赛规则
- 干货!JNPF快速开发平台功能一览
- 太原学院计算机科学与技术在哪个校区,太原学院有几个校区及校区地址
- Flutter项目插件整理