论文笔记:OntoED: Low-resource Event Detection with Ontology Embedding
作者:崔金满
单位:燕山大学
论文地址:https://arxiv.org/pdf/2105.10922.pdf
代码地址:https://github.com/231sm/Reasoning_In_EE
论文来源:ACL 2021
目录
Abstract
Introduction
Methodlogy
ED
Event Ontology Learning
Event Correlation Inference
Experiments
Abstract
事件检测(Event Detection, ED)旨在从给定文本中识别事件触发词,并将其分类为预定义的事件类型。现有的ED方法大多严重依赖训练实例,几乎忽略了事件类型的相关性。因此,这些方法往往会遭到数据稀缺的困扰,无法处理新的未知事件类型。为了解决这些问题,本文将事件定义为一个事件本体填充的过程:在事件本体中将事件实例链接到预定义的事件类型,并提出一个新颖的本体嵌入的ED框架,OntoED。该方法丰富了事件类型之间的联系,并进一步产生了更多的事件-事件相关性。基于事件本体,OntoED可以提取和推荐相关知识,尤其是从数据丰富到数据稀缺的事件类型。此外,通过建立与现有事件类型的联系,本体可以应用一个新的事件类型。
Introduction
事件检测所面临的挑战:一方面,在ED的基准数据集上样本分布不均匀的情况相当严重,例如FewEvent和MAVEN,其中很大一部分事件类型包含的训练实例相对较少。导致有监督的ED模型很容易产生过拟合;另一方面,面对新的事件类型,以往模型也很难发挥很好的作用。
在本文中,我们用事件类型的更多的内部结构来丰富事件本体,例如时间、因果和层次的事件-事件关系,例如:(Attack, Cause, Sentence), (Sentence, Before, Acquit), (Attack, CoSuper, Riot),本文的主要意图是充分利用事件本体,并利用从数据丰富的事件类型到数据稀缺的事件类型的相关知识,此外,新的事件类型可以通过现有事件类型的相关性来学习。
OntoED框架:首先用事件实例和类型建立初始事件本体。BERT捕获事件实例的语义特征和关系,并利用原型来表示事件类型。其次,基于提取的事件实例之间的关系,用事件-事件关系扩展事件本体,然后通过聚合每个原型的邻居原型来学习本体嵌入。这样,向量空间中语义相似的事件类型会更接近,从而提高了对不同事件类型的区分度。第三,我们设计了一个基于符号规则的事件关联推理机制来诱导新的事件关联,由此,我们可以归纳出新的事件关系,进一步丰富事件本体。
Methodlogy
事件本体填充的目标是在事件类型和实例之间建立适当的联系。OntoED具体包括事件检测(本体填充),识别事件触发词和类型,然后标识事件实例之间的关系。每种类型的平均实例嵌入被计算为原始事件原型;事件本体学习,目的是根据实例衍生出的事件类型之间的关系,利用事件原型的相关性获得本体嵌入;事件关联推理,是指基于已有事件-事件关系来推理新的事件关联,从而获得一个事件本体。
ED
Instance Encoder:利用预训练模型BERT得到触发词的上下文表示,[CLS]标志位表示实例embedding。
Class Encoder:事件类型由事件原型表示。最初,原型是通过计算实例的平均值得到的。
Event Detector:将序列中的每个token视为一个候选触发词,然后计算候选触发词的对应事件类型的概率,并利用交叉熵损失函数计算损失
Instance Relation Extractor:抽取事件实例之间的关系,用以下方式建模事件之间的交互关系,并用softmax进行关系分类,交叉熵损失函数计算损失。
Event Ontology Learning
Ontology Completion:建模事件实例与类型之间关系和事件类型之间的关系
Instance-to-class Linking:给定一个带有触发词的事件实例,利用标准三元组的形式将事件信息链接到对应的事件类型。三元组:(, triggerIs, ),(, instanceOf, )
Class-to-class Linking:给定一个具有关系的事件实例对(, ),将实例相关性升级到相应的事件类型,用(, , )表示。
Ontology Embedding:事件原型更新
给定三元组(, , ),利用关系变换矩阵将头部变换事件类型的事件原型传播到尾部事件类型的原型。
更新后的事件原型:
Event Correlation Inference
在事件关联推理阶段,基于现有的事件类型推断新的事件相关性。
给定grounding:
可以通过计算它的得分来判断事件之间关联推断成立的可能性:
Experiments
提出一个数据集OntoEvent,数据集对比:
实验对比:
论文笔记:OntoED: Low-resource Event Detection with Ontology Embedding相关推荐
- 论文笔记 ACL 2021|Low-resource Event Detection with Ontology Embedding
文章目录 1 简介 1.2 创新 2 方法 2.1 Event Detection (Ontology Population) 2.2 Event Ontology Learning 2.3 Even ...
- (二十四)【2021 ACL】OntoED: Low-resource Event Detection with Ontology Embedding
题目: OntoED: Low-resource Event Detection with Ontology Embedding 论文链接: https://arxiv.org/abs/2105.10 ...
- 论文笔记 EMNLP 2018|Collective Event Detection via a Hierarchical and Bias Tagging Networks with Gated
文章目录 1 简介 1.1 创新 2 背景知识 3 方法 4 实验 1 简介 论文题目:Collective Event Detection via a Hierarchical and Bias T ...
- 论文笔记 EMNLP 2021|Lifelong Event Detection with Knowledge Transfer
文章目录 1 简介 1.1 创新 2 方法 2.1 baseline 2.2 新旧事件类型的知识迁移 3 实验 1 简介 论文题目:Lifelong Event Detection with Know ...
- [论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit
[论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit IEEE TITS 2019 YangJian 简 ...
- 【论文笔记】Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection
论文标题:Multi-modal Knowledge-aware Event Memory Network forSocial Media Rumor Detection 论文链接:https://s ...
- [论文笔记] Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark 阅读笔记
Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark 阅读笔记 Towards Real-World ...
- [论文笔记] Super Low Resolution RF Powered Accelerometers for Alerting on Hospitalized Patient Bed Exits
原文链接:Super Low Resolution RF Powered Accelerometers for Alerting on Hospitalized Patient Bed Exits | ...
- 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...
- 论文笔记 NAACL 2021|Document-level Event Extraction with Efficient End-to-end Learning of Cross-event De
文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 基础模型 3.2 跨事件依赖 4 实验 1 简介 论文题目:Document-level Event Extractio ...
最新文章
- 【PAT乙级】1094 谷歌的招聘 (20 分)
- spring中最重要的一些Aware接口
- 畅享9能更新鸿蒙吗,Mate 9也能升级!鸿蒙系统正式发布:老用户爽了
- DefaultIfEmpty
- 如何测试sql语句性能,提高执行效率
- centos下eclipse的安装
- 计算机的算数逻辑单元控制单元统称为,算术控制单元
- 5 Openstack-Ussuri-Placement部署-ubuntu1804
- MySQL数据库字段级权限设计
- 计算机网络读书笔记(谢希仁 第六版 思维导图)
- NOI 1818:红与黑(C++)
- 网页知识入门-浏览器和网页生成
- 环境和社会风险分类c类_A、B、C级风险隐患分类标准
- solid works 插入两两相交直线确定的基准面作图
- JSP中文乱码解决方案了解和TOMCAT中文乱码解决
- 五面阿里拿下飞猪事业部offer,先睹为快
- linux nginx 内存占用,nginx内存占用过高
- 如何判断是不是个maven项目
- 盐城北大青鸟植树节丨迎接春天,种下美好
- mov和mp4格式哪个好_在线视频格式转换器哪个好?求一个能转换多种格式的工具...