学习内容

本文主要详细介绍事件抽取EE的概念;
装载自:李景鹏 啥是事件抽取(Event Extraction)?
同时这里关于事件抽取的介绍也可以作为补充: 分层网络用于事件参数抽取

事件抽取 = 事件提取(Event Extraction EE)= 事件识别(Event Detection ED)

很多事件抽取的方法将事件抽取分为两个阶段:EAE(event argument extraction) 和 ED(event detection)后者会根据触发词来确定事件的发生,发生了啥。
结构化数据和非结构化数据: 指的是一句话是不是已经给他归类了!

事件描述

schema:

事件抽取任务的起点,是需求的出现。关心金融领域的朋友,比如我(持有市值约370元人民币的基金),希望了解所有可以影响市场情绪的事件。因此,海量新闻数据中识别特定类型的事件就是我们的需求。

需求确定了,接下来的任务就是把需求转换为人和机器都可以理解的一种形式,即制定事件的schema。“schema”即纲要,是我们对事物一般的、抽象的描述,体现人类对事物的认知水平,决定了机器抽取事件的能力,因此非常重要。一个完整的事件schema,应当包括:

(1)事件类型体系,比如“企业成立”、“企业并购”等等组成的,就是我关心的事件的类型体系;

(2)各类事件的重要角色,比如表2-1所示的各个字段,就是一个事件得以发展所依赖的重要角色。有时候,我们会设置一种特殊的角色,即“事件触发词”,用来辅助判断事件的发生。

确定了schema,一方面方便大家在相同的概念基础上展开协作,另一方面也让机器有了相对确定的学习和预测目标。

事件抽取分类

事件抽取包括事件触发词检测(识别事件触发词,并明确所触发事件的类型)和属性抽取(识别触发事件的属性,并标注各属性对应角色)两个子任务。例如,“He died in hospital”中“died”作为一个Die类型事件的触发词,该事件中,属性“He”的角色为Person, “hospital”的角色为Place. 本文主要探讨事件触发词检测任务中的跨句触发词联合抽取问题。

事件抽取难点

当下,事件触发词检测任务面临的挑战主要包括:(1)句子上下文表示及篇章级信息整合[1],[2]。候选触发词类型的判定一般需要结合上下文信息,包括关联实体信息(类型等)、其他候选触发词等。例如,图1中句子3中的“firing”可能是开枪(触发Attack事件)或离职(触发End_Position事件),Attack事件的确立需要融合句子2,4等的信息。(2)句内和句间事件关联性建模[1],[3]。句4包含事件触发词fight和death,ACE05数据集中超过40%触发词如此共现;类似句2、句3和句4中的连续关联事件同样普遍。因此,建模事件之间依赖对于同时抽取句子、跨句多事件尤为重要。

现有方法主要专注于句子级事件抽取,忽略了存在于其他句子中的信息。通过对事件抽取benchmark数据集ACE05的分析,我们得出如下结论。(1)可将事件触发词检测任务视为一个Seq2Seq任务,其中,source序列为文本篇章或句子,target序列是事件标签序列。对应基于RNN的encoder-decoder框架能有效处理该类问题,其中encoder建模丰富的上下文语义信息,decoder在解码过程中捕捉标签的依赖性。(2)对于当前句子,与之关联最密切的信息主要存在于邻近句子,相距较远的文本影响较小。

事件抽取和命名实体识别的区别

命名实体抽取,指的是抽取某一类客观实例的词语,比如手机、张三、李四等
事件抽取只得是抽取某一类动作,比如爆炸、开会、开车等
命名实体抽取是事件抽取的基础,因为事件中都必须有至少一个主体,比如手机爆炸、张三开会、李四开车。

NER

链接
NER技术简要介绍
1.命名实体识别的主要任务:
要识别出文本中出现的专有名称和有意义的数量短语并加以归类。

2.命名实体识别的主要研究内容:

就整个的命名实体识别的研究结果而言,时间表达式和数字表达式的识别相对简单,其规则的设计、数据的统计训练等也比较容易。而对于实体中的组织名、人名、地名,因为其具有开放性和发展性的特点,而且构成规律有很大的随意性,所以其识别就可能会有较多的错选或漏选。现在大多数的命名实体识别的研究都集中于对这三种实体的识别技术的研究。

知识图谱入门知识(二)事件抽取(EE)详细介绍相关推荐

  1. 知识图谱入门——知识融合

    文章首发于博客du_ok's Notes,本文链接为知识图谱入门--知识融合 本文介绍了知识融合相关的技术和典型的知识融合工具. 知识融合相关概念 相关的术语: 知识融合 (Knowledge Fus ...

  2. 知识图谱(七)——事件抽取

    文章目录 一.任务概述 1.事件的定义 2.事件抽取的定义 3.相关评测和语料资源 二.限定域事件抽取 1.基于模式匹配的事件抽取方法 1)有监督的事件模式匹配 2)弱监督的事件模式匹配 3)优缺点: ...

  3. 知识图谱入门知识(一)知识图谱应用以及常用方法概述

    学习内容 搜集各种博客,理解实体识别.关系分类.关系抽取.实体链指.知识推理等,并且总结各种分类中最常用的方法.思路. 由于自己刚刚接触知识图谱,对该领域的概念和方法的描述还不是很清楚,所以只是简单的 ...

  4. 知识图谱入门知识(三)词性标注

    学习内容 基本大多数的问题都可以转为词性标注问题! 这里只做记录,都是别人的回答! 常用的概念 什么是token tokenization就是通常所说的分词,分出的每一个词语我们把它称为token. ...

  5. 知识图谱入门知识(五)【转】秒懂词向量Word2Vec的本质

    博文: 秒懂词向量Word2Vec的本质 什么是Word2Vec? 词性标注:是动词还是名词,样本(x,y)中,x是词语,y是它们的词性 f(x)->y 中的f(神经网络.SVM)只接受数值型输 ...

  6. 知识图谱入门 【九】- 知识问答

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  7. 知识图谱入门 【八】- 语义搜索

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  8. 知识图谱入门 【一】- 认识图谱技术

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  9. 知识图谱入门学习笔记(二)-知识表示

    目录 1 知识表示的概念 1.1 知识表示方法 1.2 知识表示的分类观点 1.3 知识表示的发展 2.1 语义网络 2.2 产生式系统 2.3 框架系统(Frame Systems) 2.4概念图( ...

最新文章

  1. 华为又一重拳!全球首款5G基站核心芯片“天罡”发布!
  2. 创建数据库时指定编码方式
  3. C ++ 11基于反向范围的for循环
  4. shell 脚本 抽取指定数量的随机学生
  5. CSS Grid layout布局
  6. VSX-5 VSXMusic 编码听音乐
  7. 发送不同类型的ActivityFeed
  8. 容器内应用日志收集方案
  9. pycharm 设置虚拟工作空间_七、连Pycharm都不知道怎么用,学什么Python
  10. 【好】Paxos以及分布式一致性的学习
  11. 实战撤回对方QQ消息+防止别人撤回消息插件演示附软件
  12. STEAM无法打开创意工坊或成就页面
  13. 从零搭建美团饿了么外卖红包CPS小程序教程
  14. python之Django框架将sqliteman数据库数据显示在页面上
  15. 知乎周源微信_每周源代码41-搜索代码,共享代码和阅读代码(和注释)
  16. 【无线链路】无线发射功率以及接收灵敏度
  17. 产品研发技术团队如何做360度评估
  18. LWN:滚动发布的稳定版内核!
  19. 使用wine在mac系统上运行windows程序
  20. [PaddleSeg 源码阅读] PaddleSeg计算 mIoU

热门文章

  1. 王译潇20162314 第九周作业总结
  2. Mac Pro 修改环境变量
  3. 你不知道的 字符集和编码(编码字符集与字符集编码)
  4. 周报_2012第11周(2012/03/11-2012/03/17)
  5. 服务器开发中网络数据分析与故障排查经验漫谈
  6. Epoll例子的使用
  7. JVM GC调优总结 -Xms -Xmx -Xmn -Xss
  8. 评分9.3,你想要的那本书,来了!
  9. python标准库怎么用_Python常用标准库使用(一)
  10. 图像目标分割_5 DeepLab V2 V3 V3+