文章目录

  • 1 简介
    • 1.1 动机
    • 1.2 创新
  • 2 方法
    • 2.1 Contrastive sample generator
    • 2.2 Event encoder
    • 2.3 Ordered contrastive loss
    • 2.4 Supervised loss
  • 3 实验

1 简介

论文题目:Zero-Shot Event Detection Based on Ordered Contrastive Learning and Prompt-Based Prediction
论文来源:NAACL findings 2022
组织机构:华东师范大学
论文链接:https://aclanthology.org/2022.findings-naacl.196.pdf
代码链接:https://github.com/KindRoach/NAACL-ZEOP

1.1 动机

  • 没有注释的新事件不断出现,使有监督的事件检测方法不再适用。
  • 现有的事件检测方法需要预定义的事件类型作为启发式规则或外部语义分析工具。

1.2 创新

  • 基于有序的对比学习提出一个zero-shot事件检测模型。
  • 将基于prompt的预测引入到zero-shot事件检测问题中,消除了对预定义事件结构和启发式规则的依赖。

2 方法


模型的整体框架如上图,给定可见的事件类型S和不可见的事件类型U,全部的样本首先被作为原始样本xix_ixi​输入到对比样例生成器,构建多个对比样例为{s1,...,s2}\{s_1,...,s_2\}{s1​,...,s2​},然后事件编码器编码事件提及为eie_iei​,最后通过原型网络(prototypical network)预测事件类型的概率分布为pip_ipi​。

2.1 Contrastive sample generator


如上图所示,构建四种对比样本,与原始样本的相似度逐渐减弱:

  1. Dropout sample: 相同的句子输入到预训练模型中两次,由于训练中网络结点会被随机dropout,因此可以获得不同的编码。
  2. Rewrite sample: 对原始事件提及进行文本的编辑,为了保证语义相似性,使用回译的方法对事件提及进行重写。
  3. Homogeneous sample:取样同类的事件类型,对应可见的事件类型,随机取样相同标签的事件;对于不可见的事件类型,从不可见事件类型的事件中随机取样。
  4. Heterogeneous sample:取样不同类的事件类型,对应可见的事件类型,随机取样不相同标签的事件;对于不可见的事件类型,从可见事件类型的事件中随机取样。

2.2 Event encoder


触发词预测的模型如上图所示,prompt模板为"This is event about[MASK]. <event mention>",其中[MASK]为BERT需要预测的触发词, <event mention>为描述事件的文本。给定输入序列为t={w0,w1,w2,...,wl}t=\{w_0,w_1,w_2,...,w_l\}t={w0​,w1​,w2​,...,wl​},对事件提及中的全部词,得到分布pm(wm=wi∣t)p_m(w_m=w_i|t)pm​(wm​=wi​∣t)。

事件类型预测的模型如上图,使用原型网络,定义一个原型矩阵C(维度为n*h,n=k+l,k为可见的事件类型数量,l为不可见的事件类型数量,h为BERT的编码维度),对CLS和上一阶段预测的MASK向量进行相加,然后通过与原型矩阵计算欧几里得距离,预测事件类型,公式如下(d为计算欧几里得距离):

2.3 Ordered contrastive loss

对于全部的样本,计算Ordered contrastive loss,p0p_0p0​表示为原始事件的事件类型概率分布,p1−p4p_1-p4p1​−p4分别表示生成的四种样本的事件类型概率分布,首先使用Wasserstein距离(公式2)计算与原始事件的距离(公式1),对比loss为公式3(对于不可见事件类型的样本,在第三阶段可能随机取样到相同的事件类型):

2.4 Supervised loss

对于可见事件类型的样本,使用监督学习的loss,总loss为两部分loss的和。

3 实验

实验数据集为ACE 2005和FewShotED(few-shot事件检测数据集),为了平衡可见事件类型和不可见事件类型的样本数,对每个事件类型的样本数量进行排序,奇数次序为可见类型,偶数次序为不可见类型,数据统计如下表:

实验结果如下图(Hungarian算法对预测的标签进行映射):

消融实验:

可视化分析:

不可见类型数量l对实验结果的影响(实际不可见类型的数量的1-5倍):

论文笔记 NAACL findings 2022|Zero-Shot Event Detection Based on Ordered Contrastive Learning and Prompt-相关推荐

  1. 【论文笔记】《Virtual histological staining of unlabelled tissueautofluorescence images via deep learning》

    [论文笔记]<Virtual histological staining of unlabelled tissueautofluorescence images via deep learnin ...

  2. 【论文笔记】A Survey on Masked Facial Detection Methods and Datasets for Fighting Against COVID-19

    声明 不定期更新自己精度论文,通俗易懂,初级小白也可以理解 涉及范围:深度学习方向,包括 CV.NLP.Data Fusion.Digital Twin 论文标题:A Survey on Masked ...

  3. 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...

  4. 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 基础模型 3.2 跨事件依赖 4 实验 1 简介 论文题目:Document-level Event Extractio ...

  5. 论文笔记 ACL 2019|Rapid Customization for Event Extraction

    文章目录 1 简介 1.1 创新 2 方法 2.1 新事件的触发词实例 2.2 模型 3 实验 3.1 触发词分类 3.2 论元分类 1 简介 论文题目:Rapid Customization for ...

  6. 论文笔记:CVPR 2022 Cross-Domain Adaptive Teacher for Object Detection

    摘要 我们解决了对象检测中的域适应任务,其中有注释的源域和没有注释的感兴趣的目标域之间存在域间隙(注:在一个数据集上训练模型,再另外一个数据集上进行预测性能下降很大,在一个数据集上训练好的模型无法应用 ...

  7. 【论文笔记】(TEVC 2022)A Meta-Knowledge Transfer-Based Differential Evolution for Multitask Optimization

    一.摘要简介 1.动机与创新 知识迁移在多任务优化问题(MTOPs)中起着非常重要的作用,但是现有的方法因为任务特定知识差异造成效果不佳.因此本文提出一种基于元知识转移(MKT)的差分进化算法(MKT ...

  8. 论文笔记:Missing Value Imputation for Multi-view UrbanStatistical Data via Spatial Correlation Learning

    TKDE 2021(Apr) 0 摘要 作为城市化的发展趋势,海量的多视角(如人口和经济视角)的城市统计数据被越来越多地收集并受益于不同领域,包括交通服务.区域分析等. 划分为细粒度区域的数据在获取和 ...

  9. 最新论文笔记(+20):Biscotti_ A Blockchain System for Private and Secure Federated Learning / TPDS21

    Biscotti: A Blockchain System for Private and Secure Federated Learning"译为"Biscotti:一个用于隐私 ...

最新文章

  1. 多个互相有联系的checkbox的单选逻辑
  2. LeetCode:1. Two Sum
  3. Python基础教程(十二):GUI编程、版本区别、IDE
  4. ctrl键一直自动按住了_用好Ctrl键,效率快一半
  5. cmd中检测远程的ip和端口是否处于监听状态
  6. sudo su 与 su
  7. VNCServer在Linux下设置
  8. (25)Vue.js组件通信—父组件向子组件传值
  9. Bootstrap 文档类型
  10. 【Kafka】kafka Authentication failed credentials with SASL mech
  11. linux上使用netstat查看当前服务和监听端口
  12. 样本均值的抽样分布_抽样分布样本均值
  13. html倒放播放器,AVPlayer 的无缝快进和倒放.
  14. 读书笔记——心理学之影响力
  15. 第一行代码android网课,使用Mongodb实现打卡签到系统的实例代码
  16. 关于企业邮箱服务器经常被spamhaus反垃圾邮件组织拦截的排错方法分享
  17. Android 网易云信直播
  18. 项目管理论坛_活动预告|2019年“VUCA时代项目管理与项目治理”论坛通知
  19. 供应链管理的五大策略
  20. imx6 Android gpu 内存,IMX8M / IMX8M NANO /IMX6D 等GPU的简单对比

热门文章

  1. echarts移除百度地图logo方法
  2. win7怎么进入安全模式_win7进入安全模式教程
  3. Excel制作热力图
  4. 如何在Windows环境下快速搭建Web服务器并发布网页
  5. OSPF单区域配置【eNSP实现】
  6. 矩阵链乘法 自顶向下 自底向上 Python 实现 算法导论
  7. XShell免费正版远程控制ssh客户端
  8. php中=%3e -%3e的区别,华为nova3e与nova2s买哪个好?华为nova2s和nova3e区别对比详细评测...
  9. Makefile3、书写规则(文件搜寻、伪目标、多目标、静态模式、自动生成依赖性)
  10. Angularjs兼容低版本IE