Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction
Introduction
大多数现有的事件提取(EE)方法仅提取句子范围内的事件参数。但是,此类句子级的EE方法难以处理来自新兴应用领域(例如金融,法律,健康等)的大量文档,其中事件论元分散在不同的句子中,甚至多个事件实例在同一文档中同时存在。为了应对这些挑战,本文提出了一种新颖的端到端解决方案 Doc2EDAG,该解决方案可以有效地生成基于实体的有向无环图,以实现文档级事件抽取。
下面是论文中举出的一个文档例子,左边是一个事件表,右边是该事件表所在的文档。这篇文档有两个股权质押事件记录,其参数分散在多个句子中,使用ID表示句子索引,用相应的标记代替实体,将关键事件语句范围之外的事件参数颜色显示为红色。
Related Work
论文提到了之前的一个文档级事件抽取模型DCFEE,DCFEE采用句子级和篇章级两个级别的抽取过程,句子级的SEE的使用序列标记模型,找出触发词、事件论元等关键信息,然后文档级DEE使用卷积网络将句子级的事件元素进行组合得到一个事件的完整信息。作者分析了DCFEE的不足:
1)在多事件任务下,尽管 DCFEE-O 可以正确地识别关键语句,但它无法决定此语句表示多少事件,DCFEE-M 会产生多个部分正确的事件,但是 DCFEE-M 的论元补全阶段是上下文无关的;
2)对于不同的句子多次提及同一事件的环境下,DCFEE 模型的关键句子检测模块无法有效地区分重复的事件实例,造成抽取事件冗余;
3)当一个文档由多个简单的句子片段构成时,事件的论元散落在各个句子中,DCFEE 模型无法有效地将这些零碎的信息整合起来识别完整的事件论元及事件角色。
针对DCFEE的不足,作者提出了Doc2EDAG模型,Doc2EDAG使用Transformer 和序列标注进行进行SEE句子级实体抽取,得到事件的参数。在DEE阶段,Doc2EDAG通过构建DAG有向无环图的方式将事件论元不断加入到事件表中,完成事件的抽取。
Model
下图是Doc2EDAG的模型结构图,模型的处理流程可以分为四个阶段:
1)预处理模块:
通过词嵌入矩阵将文档中的句子序列 [s1; s2; · · · ; sNs ] 转化为词向量表示的嵌入矩阵 si∈Rdw×Nwsi ∈ R^{d_w}×N^wsi∈Rdw×Nw,并采用 Transformer 作为上下文编码器对实体单位进行编码训练,hi=Transformer−1(si)hi = Transformer-1(si)hi=Transformer−1(si)。在训练过程中,使用事件论元的角色信息作为实体标签,使用经典的BIO(Begin,Inside, Other)方案,并用 crf 层将其封装起来,以获得实体识别 Loss 函数。
2)文档级信息融合模块:
为了有效地解决论元分散的挑战,必须利用全局上下文来更好地识别一个实体是否扮演特定的事件角色。因此,该文档级别实体编码阶段的目标是用这样的上下文对提取的实体提及进行编码,并为每个实体提到的内容生成大小为dw的嵌入。由于涉及的实体通常包含多个可变长度的token,因此采用注意力加权平均AWA模块,为每个实例获得一个固定大小的嵌入ei∈ Rdw,对于每一个句子,也用另一个AWA模块来获得每个句子的固定大小的嵌入ci∈Rdwc_i∈ R^{dw}ci∈Rdw。为了提高对文档级上下文的认识,作者使用了第二个 transformer 模块,以方便所有实例和句子之间的信息交换。模型中还增加了句子的嵌入位置来指示句子的顺序。在转换器编码之后,作者还使用一个AWA模块将相同实例的嵌入聚合到单个嵌入中。在这个阶段之后,获得了文档级上下文有关的实例和句子表示,并对每种事件类型进行事件触发分类。
3)文档级信息记忆模块:
在依次生成基于实体的有向无环图EDAG时,必须同时考虑文档级上下文和路径中已经存在的实体。因此,作者设计了一种内存机制,初始化为句子的嵌入向量。更新 EDAG 时需要追加已经识别的实体嵌入或零矩阵向量(假如识别的是NA argument)。
4)路径扩展模块:
当扩展事件路径时,对每个实体进行二进制分类,展开(1)或不展开(0),结合当前路径状态、历史上下文和当前角色信息。首先连接记忆张量m和实体张量$ e^d$,然后用event-role-indicator 嵌入它们,并将它们送入第三个 transformer 模块。然后,从 transformer-3 的输出中提取出丰富的实体张量 ere^rer,并在此基础上进行路径扩展分类。
Experiments
本文的作者发布了一个ChFinAnn 数据集,ChFinAnn 数据集与 DCFEE 使用的数据集相比,ChFinAnn 要大十倍,其中约 30% 的文档包含多个事件记录。文中实验表明,当面对DEE(文档级事件抽取)任务时,Doc2EDAG 获得当前最好的结果。
总结
本文的贡献包括:
1)提出了一种新颖的解决方案 Doc2EDAG,该解决方案可以在给定文档的情况下直接生成事件表,以有效应对 DEE 的独特挑战。
2)重新设计了无需触发词的 DEE 任务,以简化基于 DS 的文档级事件标记。
3)为 DEE 建立了一个大规模的现实世界数据集,它面临着事件论元分散和多事件的挑战,并进行广泛的实验证明了 Doc2EDAG 的优越性。
Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction相关推荐
- Multimedia Event Extraction From News With a Unified Contrastive Learning Framework论文解读
Multimedia Event Extraction From News With a Unified Contrastive Learning Framework 论文:Multimedia Ev ...
- 【论文复现】MDCSpell: A Multi-task Detector-Corrector Framework for Chinese Spelling Correction论文复现
文章目录 本文内容 环境配置 全局变量 模型构建 损失函数 模型训练 构造Dataset 构造Dataloader 训练 模型评估 模型使用 参考文献 代码地址 :https://github.com ...
- 论文解读:DCSpell:A Detector-Corrector Framework for Chinese Spelling Error Correction
论文解读:DCSpell:A Detector-Corrector Framework for Chinese Spelling Error Correction 简要信息: 序号 属性 值 1 模型 ...
- MDERank A Masked Document Embedding Rank Approach for Unsupervised Keyphrase Extraction阅读笔记
这两年对比学习很火,尤其是在CV领域,所以有人尝试将对比学习的思想引入到关键词抽取任务中,虽然最后的结果并没有大的提升,但是这篇论文还是值得看一下的.这篇文章中了2022年ACL Findings. ...
- SAP ABAP实用技巧介绍系列之 关于View framework处理Before save event的讨论
Created by Jerry Wang, last modified on Jul 17, 2014 点击New Entries后, [外链图片转存失败(img-0Co1I8jG-15622098 ...
- 【论文笔记】MDCSpell: A Multi-task Detector-Corrector Framework for Chinese Spelling Correction
文章目录 论文内容 论文思路 模型架构 损失函数 训练细节 实验结果 个人总结 论文复现 : https://blog.csdn.net/zhaohongfei_358/article/details ...
- 【SCIR笔记】文档级事件抽取简述
作者:哈工大SCIR 胡振宇 来自:哈工大SCIR 1. 简介 事件作为信息的一种表现形式,其定义为特定的人及物在特定的时间特定的地点相互作用的事实.事件的组成元素包含触发词.事件类型.论元以及论元角 ...
- 篇章级的事件抽取——阅读笔记
一.<DCFEE> <DCFEE: A Document-level Chinese Financial Event Extraction System based on Autom ...
- 自然语言处理和计算机视觉相关论文总结
自然语言处理 命名实体识别 论文名称 期刊/会议 时间 解读 特点 代码 Unified Named Entity Recognition as Word-Word Relation Classifi ...
- 英文事件抽取论文整理
不知不觉,研究英文事件抽取两年了,是时候将看过的paper做一个总结了 目前事件抽取仍然集中于基于表示的神经网络方法,但基于特征的方法仍然值得去领悟,因此我主要按这两个类别进行分类: 基于特征的方法 ...
最新文章
- smart pointer in gamedev
- 文巾解题 67. 二进制求和
- xcode7,AFN不能使用的问题
- RHEL 6.0安装Qt
- ios jsonkit 报错_iOS开源项目:JSONKit
- C++primer习题--第3章
- group by rollup | cube 学习
- Shark为何被抛弃?
- MobileNet-SSD网络解析
- 精细加工领域中超快激光的应用
- 高端内存的由来(为什么需要高端内存)
- Android 获取位置信息
- 华为服务器rh2285v2重装系统,安装Windows_Server_2012_R2(RH2285_V2).doc
- VBS+迷你QQ,实现机器远程休眠和电驴的自动休眠
- window系统下添加路由的方法
- 【读书笔记】Java并发编程的艺术
- 验证Hu矩的旋转不变性
- 02-SA8155P ADB数据传输
- html5复合选择器,传智播客解读Css基本选择器与复合选择器
- 怎样使程序开机自启动和程序挂掉自动重启
热门文章
- 充电枪cp信号控制板_比亚迪E5无法交流充电故障检修
- python统计频数_python统计单词出现次数
- HTML:页面布局和背景
- 面向对象(Python):学习笔记之单例模式
- mysql数据库维护重要性_建立MySQL数据库日常维护规范
- 论文笔记_S2D.67_CamVox: 一种低成本、高精度的激光雷达辅助视觉SLAM系统
- kinect相机标定参考教程
- 从零开始搭二维激光SLAM --- 总结
- Unity学习笔记(一)——C#语法基础
- LeetCode之有效的字母异位词