文章目录

  • 1 简介
    • 1.1 动机
    • 1.2 创新
  • 2 方法
  • 3 半监督双重训练策略
  • 4 实验

1 简介

论文题目:What the role is vs. What plays the role: Semi-supervised Event Argument Extraction via Dual Question Answering
论文来源:AAAI 2021
论文链接:https://ojs.aaai.org/index.php/AAAI/article/view/17720

1.1 动机

  • 目前的事件论元抽取方法存在两个限制:1)不充分地参数共享。2)不充分地利用论元角色的语义信息。

1.2 创新

  • 提出了一个半监督学习框架DualQA(dual question answering))解决低资源情况下的事件论元抽取。
  • 为了尽可能地共享参数和利用角色语义信息,在问答范式下提出事件论元识别和事件角色识别(使用dual training进行训练)。

2 方法


整体框架如上图所示,主要分为下面几部分:

  1. 问题生成:事件论元识别的问题为What plays the role xrx_rxr​ in xtxx_{tx}xtx​?(xd1,...,xdn)(x_d^1,...,x_d^n)(xd1​,...,xdn​) 事件角色识别的问题为What is the role of xax_axa​ in xtsx_{ts}xts​?
  2. 实体编码:使用BERT-based对上下文和问题进行编码,公式如下:
  1. Flow Attention: 该模块的主要目的是将问题和上下文结合,并为上下文中的每个单词生成一组query-aware特征向量。attention从两个方向被计算:从上下文到问题(C2Q)和从问题到上下文(Q2C),首先计算问题和上下文的相似性(SA,SRS^A,S^RSA,SR),然后根据相似性进行注意力计算,最后得到query-aware特征向量。公式如下:
  1. 论元分类:预测每个token是否为论元的开始或者结束,公式如下:
  2. 角色分类:使用CNN对角色进行分类:

3 半监督双重训练策略

每轮训练主要分为两步:1)联合训练模型 2)使用模型标注数据,扩充训练集(当事件论元识别和事件角色识别的结果相同时认为是可靠的标注)。当没有未标注的数据或者模型拟合时停止训练。loss公式和伪代码如下:

4 实验

数据集为ACE 2005英语语料和FewFC中文金融语料,为了建立低资源的条件,ACE数据集选择10%的训练数据作为标注数据,60%作为未标注数据;FewFC数据集选择1%的训练数据作为标注数据,60%作为未标注数据,实验结果如下:

机器阅读理解框架的消融实验,结果如下:

双向学习的消融实验,结果如下:

不同数据量情况下的实验结果:

标注数据的质量:

论文笔记 AAAI 2021|what the role is vs. What plays the role: Semi-supervised Event Argument Extraction v相关推荐

  1. 16篇论文入选AAAI 2021,京东数科AI都在关注什么?(附论文下载)

    近日,国际人工智能领域顶级学术会议AAAI2021(第35届AAAI)论文收录结果出炉.在国内AI阵营前列的京东数科以高达16篇论文的入选量成为本届AAAI的一大黑马.其研究方向包含了联邦学习.对抗学 ...

  2. 论文笔记 EMNLP 2020|Resource-Enhanced Neural Model for Event Argument Extraction

    文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 实验 1 简介 论文题目:Resource-Enhanced Neural Model for Event Argument Extrac ...

  3. 【论文笔记 | TGRS 2021】多内容互补网络:MCCNet

    论文标题:Multi-Content Complementation Network for Salient Object Detection in Optical Remote Sensing Im ...

  4. 论文笔记 EMNLP 2021|Treasures Outside Contexts: Improving Event Detection via Global Statistics

    文章目录 1 简介 1.1 动机 1.2 创新 2 方法 2.1 语义特征提取器 2.2 统计特征提取器 3 实验 1 简介 论文题目:Treasures Outside Contexts: Impr ...

  5. 论文笔记 EMNLP 2021|Modeling Document-Level Context for Event Detection via Important Context Selection

    文章目录 1 简介 1.1 创新 2 方法 2.1 预测模型 2.2 上下文选择 2.3 训练 3 实验 1 简介 论文题目:Modeling Document-Level Context for E ...

  6. 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 基础模型 3.2 跨事件依赖 4 实验 1 简介 论文题目:Document-level Event Extractio ...

  7. 论文笔记 EMNLP 2021|Lifelong Event Detection with Knowledge Transfer

    文章目录 1 简介 1.1 创新 2 方法 2.1 baseline 2.2 新旧事件类型的知识迁移 3 实验 1 简介 论文题目:Lifelong Event Detection with Know ...

  8. 论文笔记 EMNLP 2021|Uncertain Local-to-Global Networks for Document-Level Event Factuality Identificatio

    文章目录 1 简介 1.1 创新 2 方法 3.1 Local Uncertainty Estimation 3.2 Uncertain Information Aggregation 3.3 Rep ...

  9. 论文笔记 ACL 2021|Low-resource Event Detection with Ontology Embedding

    文章目录 1 简介 1.2 创新 2 方法 2.1 Event Detection (Ontology Population) 2.2 Event Ontology Learning 2.3 Even ...

最新文章

  1. 在Eclipse中导入Tiny工程,有下面的错误,是什么原因?
  2. $Django 中间件 csrf
  3. 查询除了一列意外_想让你的查询语句变快吗?
  4. 前端学习(77):css中常见margin塌陷问题之解决办法
  5. mysql初始化很慢_mysql初始化报错
  6. 你想要的江湖,可能不在这时候笑傲
  7. HTML表格和HTML表单
  8. Linux alias设置别名 Ubuntu设置别名创建简写指令短命令
  9. 《计算机网络》学习笔记 ·002【物理层】
  10. 2018前端开发面试备忘录(1年以上经验初中级别前端开发)-面试篇
  11. 跟小静读CLR via C#(15)--String,熟悉而又陌生
  12. 小米 samba linux,U-BOOT移植准备之(一)Samba服务器
  13. Win10:更改桌面路径位置,彻底解放你的C盘
  14. JS动态添加Html
  15. 【书单推荐】西方思想史上占有重要地位的100部思想名著
  16. canvas绘制表盘时钟
  17. [LOJ6198] 谢特(sam+字典树合并)
  18. 主码流和辅码流的区别
  19. String ends with?
  20. http code码详解

热门文章

  1. 年已过,新的一年如何过?
  2. “龙芯杯”——全国大学生计算机系统能力培养大赛
  3. office xls Hyperlink
  4. 看完清华最新发布的毕业生去向,我沉默了
  5. 这15部评分9.0以上纪录片,让你放假后足不出户就可以看遍世界!(附链接)
  6. 面试文案策划要准备一些什么?
  7. Redis应用场景-排行榜
  8. pytorch distiller Weights Pruning Algorithms
  9. esxi服务器下虚拟机Ubuntu系统搭建PPPoE拨号服务
  10. 常用颜色RGB、灰度值