本文介绍事件抽取,并引出篇章级事件抽取任务及一个较新的研究课题。

文章目录

一、任务定义

二、事件抽取任务的发展历史

1.基于规则的特征工程方法(~2015)

2.基于神经网络的深度学习方法(2015~2019)

3.基于PLM的特征表示方法(2019~)

三、事件抽取任务的数据集

1.ACE2005

2.金融领域中文数据集

四、前沿工作

1.GIT

2.DE-PNN

总结

五、个人工作


​​​​一、任务定义

事件抽取作为NLP中信息抽取领域的研究热点之一,要求从半结构化、非结构化的文本数据中,将与目标事件相关的重要元素识别出来。事件抽取的目标可概括如下4个子任务:

  1. Event Detection(事件检测)​​​​​​

    1. Classify event types
    2. Identity trigger words
  2. Event Argument  Extraction(事件要素抽取)
    1. Identity arguments
    2. Classify arguments' roles

我们首先阐述事件抽取任务的相关概念,如下表所示:

名称 描述
1 Event Type(事件类型) 根据数据集所预定义的事件类别,如金融领域的“股权冻结”事件类型
2 Argument(事件要素) 用于描述事件的属性,如时间、地点、犯罪嫌疑人、受害者等
3 Role(事件要素的角色) 描述Argument的类型
4 Event Mention(事件描述) 描述事件的短语或句子
5 Span Span类似于Event Mention,是包含Arguments的短语
6 Trigger(触发词) 标志、触发事件的短语,一般为动词

下图为一个简单的例子:

给定一条文本:CNN's Kelly Wallace reports on today's attack in Netanya.我们需识别出袭击事件类型、Attack触发词、today等事件要素、Time-within等要素角色。

上述例子中仅用单条文本描述了一个事件,可称之为单文本单事件,对应的任务为句子级的事件抽取。但在实际情况中,一篇新闻报道中的多个句子共同描述一或多个事件,即单文档多事件,篇章级任务本身的特点是篇章级事件抽取任务的难点之一。

二、事件抽取任务的发展历史

1.基于规则的特征工程方法(~2015)

此阶段主要通过手工方式来建立模式,抽取时只需通过各种匹配算法找出符合约束条件的信息即可。显然,其核心是抽取模式的构建。

还可以采用经典机器学习中的方法识别事件,通过将事件类型和事件要素的抽取任务视为多分类问题,即可引入传统文本分类任务中的模型。此类思路的核心问题在于分类器的构造和特征的选取。

2.基于神经网络的深度学习方法(2015~2019)

随着以CNN为代表的深度学习方法的兴起,以15年为切点,事件抽取任务开始引入深度学习模型,典型代表为DMCNN(ACL, 2015),它提出一种基于动态池化的卷积神经网络模型以处理事件抽取任务。MOGANED(EMNLP, 2019)则提出一种基于图神经网络的模型。

3.基于PLM的特征表示方法(2019~)

随着BERT论文于18年发表,一系列的预训练语言模型被相继提出,它们借助大量相关训练数据的铺垫,能够大幅提升下游任务中模型的表现。以DMBERT(ACL, 2019)为代表的工作将BERT类模型引入事件抽取领域。

三、事件抽取任务的数据集

1.ACE2005

ACE2005定义了8种事件类别以及33种子类别,如下图所示。每个事件类型和子类型都有自己的Arguments,并用模版的方式进行描述。

到目前为止,大多数基于监督学习的方法皆采用 ACE2005作为数据集,作为一个公布于2006年的小样本数据集,它仅包含1800个英文、阿拉伯文和中文混合体裁的文本文件。再者,ACE2005大多以单个句子描述一个事件,对应的方法基本为句子级的事件抽取模型。此外,作为开放域下的综合型数据集,ACE2005不具备特定领域(如金融、医疗等)数据集的丰富信息。

2.金融领域中文数据集

Doc2EGAG(EMNLP, 2019)公布了迄今为止最大规模的金融领域中文数据集Chinese Financial Announcement(CFA)。该工作从我国股票市场的上市公司公告中提取出结构化与非结构化数据,使用了远程监督的思想完成数据集的自动标注,并进行了提高标注质量的相关工作。CFA数据集的简要描述如下:

CFA数据集共包含32040篇文档,共定义了5中事件类型,分别为股权冻结、股权回购、股权减持、股权增持和股权质押,共包含35种事件要素。据统计,每个样本含约20个句子、912个词、3个事件。

CFA作为大样本数据集,训练难度大,事件类型与事件要素丰富,单文档多事件与论元分散的特点亦大幅提升了事件抽取的难度。

四、前沿工作

CFA数据集提出至今,仅有三份工作围绕其展开。分别是Doc2EGAG(EMNLP,2019)、GIT(ACL,2021)、DE-PNN(ACL,2021)。因GIT与DE-PNN均是在Doc2EDAG模型上的改进框架,下面简要介绍后二者。

1.GIT

GIT可以理解为句子编码、Event与Argument的信息融合以及序列预测的过程。

具体而言,首先使用Transformer对文档中的子句进行编码,然后通过NER识别每个子句中的事件要素。NER过程使用了经典的Transformer+CRF方式。

第二,在信息融合过程中,GIT将事件的Mention与子句表示视为无向图中的节点,将子句与子句视为一种边、子句与Mention视为另一种边,通过图神经网络GCN进行交互。如此,Mention便与sentence捕获了依赖关系,也完成了事件;类型的检测。

第三,此过程可简单视为按照给定顺序(即role)预测事件要素的过程。

2.DE-PNN

DE-PNN实际上也是句子编码、Event与Argument的信息融合以及序列预测的过程。

论文原文中未指明NER所用的方法,但不难猜测,应该是经典的Transformer+CRF,识别出所有的事件要素Arguments。

第二,对得出的事件要素Arguments与子句的特征表示,使用Transformer进行信息融合,将新的子句表示进行分类。至此,完成事件类型的分类。

第三,将一个可学习的权重矩阵引入与上一步中的字句表示进行拼接,使用完整的Transformer Encoder-Decoder结构进行处理。讲故事时,论文借用了Attention中的Query向量的概念。沿用此模式,对第二步中的Arguments进行处理,并对字句特征表示与Arguments依然使用此方式处理。至此,完成了对Arguments和子句的特征融合。个人认为,为每种特征及其组合都引入可学习的权重矩阵进行处理,是一种不折不扣地过度拟合。

第四,共同运用第三步得出的蕴含综合信息的特征与Arguments,进行多标签分类任务,即按顺序预测事件要素。

总结

在序列建模层面,三者均使用了Transformer+CRF,这是一种经典的做法;就信息融合角度而言,GIT首先定义节点与边,进而使用图的方式进行特征融合,而DE-PNN运用了完整的Transformer Encoder-Decoder,具备了生成式方法的特点;在最后的标签解码过程中,三者皆为按照预定义的role次序以完成多次二分类任务。

五、个人工作

对此课题,笔者会从以下四个方面进行展开。一方面可以对序列标注部分进行改进尝试使用其他的BERT类模型进行编码;再者,从篇章级事件抽取本身的难点(即单文档多事件与论元分散)作为切入点;此外,还可以构造新的特征,如组合的方式;最后,可以设计新的信息交互框架,如基于依存句法分析等。

篇章级事件抽取任务拾遗相关推荐

  1. 论文浅尝 | 基于异质图交互模型进行篇章级事件抽取

    笔记整理:娄东方,浙江大学 & 恒生电子股份有限公司博士后,研究方向为事件抽取 来源:ACL2021 链接:https://arxiv.org/abs/2105.14924 GitHub项目地 ...

  2. 知识图谱公开课 | 详解事件抽取与事件图谱构建

    现有知识图谱大多关注于以实体为核心的静态知识,缺乏对于以事件为核心的动态知识的刻画和构建.如何从非结构化文本中抽取结构化的事件知识已成为眼下热门研究课题. 本次公开课中,我们邀请到了中科院自动化所模式 ...

  3. 知识图谱(七)——事件抽取

    文章目录 一.任务概述 1.事件的定义 2.事件抽取的定义 3.相关评测和语料资源 二.限定域事件抽取 1.基于模式匹配的事件抽取方法 1)有监督的事件模式匹配 2)弱监督的事件模式匹配 3)优缺点: ...

  4. PaddleNLP实战——LIC2021事件抽取任务基线(附代码)

    PaddleNLP实战--LIC2021事件抽取任务基线 目录 PaddleNLP实战--LIC2021事件抽取任务基线 一.篇章级事件抽取基线 评测方法 1.1 快速复现基线Step1:数据预处理并 ...

  5. 事件、事件抽取与事理图谱

    事件.事件抽取与事理图谱 人类社会是一个静态事物进行动态活动所创造形成的世界,人类的命题记忆是以"事件"为存储单位的,存储的是组成事件的概念及其之间的关系以及事件及其之间的关系,以 ...

  6. 事件抽取与事件图谱构建

    公众号 系统之神与我同在 知识图谱是下一代人工智能的基础设施, 是实现可解释人工智能的重要手段. 事件图谱的意义:通用领域 丰富现有的知识图谱 支撑其它信息获取引擎 事件图谱构建的关键技术:事件抽取 ...

  7. NLP事件抽取顶刊顶会模型汇总-2021

    SpERT(基于span)(使用BERT) Span-based Joint Entity and Relation Extraction with Transformer Pre-training ...

  8. 篇章级的事件抽取——阅读笔记

    一.<DCFEE> <DCFEE: A Document-level Chinese Financial Event Extraction System based on Autom ...

  9. 知识图谱入门知识(二)事件抽取(EE)详细介绍

    学习内容 本文主要详细介绍事件抽取EE的概念: 装载自:李景鹏 啥是事件抽取(Event Extraction)? 同时这里关于事件抽取的介绍也可以作为补充: 分层网络用于事件参数抽取 事件抽取 = ...

最新文章

  1. 让vim不要自动添加新的注释行
  2. [转]opensuse vim 的语法高亮
  3. 什么是前端开发中的 mobile first 策略
  4. linux oracle 运维_Oracle查询当前的crs/has自启动状态实例教程
  5. 建立管理SQL Server登录帐户
  6. android fragment 设置透明,Android透明DialogFragment
  7. python opencv3 —— 改变颜色空间(color space)
  8. Oracle 10g宝典(第2版)
  9. 【转】宝贝,我要出嫁了……
  10. java数组及循环专题练习(使用数组和循环结构实现一个简易的功能完善的订餐系统)
  11. C#操作Word书签模板
  12. 数据可视化BI平台--CBoard的使用
  13. 1137:加密的病历单
  14. 车辆vin信息查询接口
  15. jpa+hibernate整合达梦数据库(附源码)
  16. 全球十大程序化交易系统 ( 有源码 )
  17. Focal Loss讲解
  18. 用latex写毕业论文--设置附录、参考文献、致谢环境
  19. Oracle中的各种NAME
  20. css3实现六边形列表

热门文章

  1. (Ryan的Redis系列博客)1.开源协议
  2. 2021.07.17【R语言】丨扩增子课程学习——α多样性简介
  3. 2011年老古董MacbookPro(MD314 二代i7+SSD)升级macOS + windows11日记 - 双系统
  4. Echarts 南海诸岛简图显示位置调整
  5. python画风向杆_matplotlibquiver画风速风向
  6. 多模态交互的概念与现状
  7. Ubuntu更换国内源
  8. Unity 抛物线 弹道(三)终结篇
  9. JS小游戏——五子棋
  10. 12本大神级程序员必读书籍,从菜鸟走向牛逼!