摘要:本文对几种基于深度学习的有监督关系抽取方法进行了介绍,包括CNN关系抽取、BiLSTM关系抽取以及BERT关系抽取。

本文分享自华为云社区《基于深度学习的有监督关系抽取方法简介》,作者: 一枚搬砖工。

随着互联网的快速发展,大数据、信息化时代悄然来临,如何从海量数据中挑选出有利用价值的信息,是十分具有挑战性的。本文将对基于深度学习的有监督关系抽取方法进行介绍。

1、任务定义

关系抽取是信息抽取的重要子任务之一,其目标在于从文本中抽取出两个或多个实体之间的语义关系。根据关系事实中涉及的实体数量,又可以进一步细分为二元关系抽取和多元关系抽取。本文中,关系抽取特指二元关系抽取。

输入:句子、目标实体对(头实体+尾实体)
输出:目标实体对之间的语义关系------------------------------------------------
例1:
输入:建安二十五年,曹操去世,葬于高陵,其子曹丕继位魏王。
- 头实体:曹操
- 尾实体:曹丕
输出:儿子

在上述例子中,给定输入文本“建安二十五年,曹操去世,葬于高陵,其子曹丕继位魏王。“,其中”曹操“是头实体,”曹丕“是尾实体,两者之间的语义关系为”儿子“,即可抽取关系三元组<曹操,儿子,曹丕>。

2、关系抽取方法

在有监督的关系抽取中,关系抽取任务通常被建模成一个多分类任务,大多数研究工作也围绕着如何提取文本特征用于关系分类展开。本节将介绍三种用于关系抽取的常用方法。

2.1、CNN关系抽取

论文:Relation Classification via Convolutional Deep Neural Network

主要思想:

使用CNN结构提取文本的句子级特征用于关系分类。与文本分类任务不同的是,在关系抽取任务中,头实体和尾实体对关系的预测和判断有着重要的影响。例如,在例1中,如果头实体是“曹丕”,尾实体是“曹操”,则实体对之间的关系变成了“父亲”,即<曹丕,父亲,曹操>。因此,在提取文本特征时考虑实体对的位置是十分有必要的。在这篇文章中,通过引入位置向量的方法来指明头实体和尾实体。如下图所示,词“高陵” 与头实体“曹操” 和尾实体“曹丕” 的相对位置距离分别为4 和-3,可分别在头实体和尾实体对应的位置向量表中查询得到对应的位置向量,再拼接得到词“高陵” 的全部位置向量。最后,拼接上词的原本向量表示,得到最后的词向量化表示。最后,使用一个卷积神经网络提取句子级的文本特征,用于关系分类。

2.2、BiLSTM关系抽取

论文:Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

主要思想:

使用BiLSTM作为特征提取器提取文本特征,并结合注意力机制捕捉文本中的重要特征。在这篇文章中,对文本进行编码时,使用了四个位置指示符(<e1>,</e1>,<e2>,</e2>)标记实体的位置。例如,在例1中,输入文本就变成了“建安二十五年,<e1>曹操</e1>去世,葬于高陵,其子<e2>曹丕</e2>继位魏王。”,表明“曹操”是头实体,“曹丕”是尾实体。通过位置指示符,可以使模型感知实体的位置,强化模型对于实体关系的理解。然后,使用BiLSTM提取深层次的文本特征。在关系抽取中,局部特征常常足以推测判断实体对的关系。在例1中,“其子” 一词就是预测“曹操” 和“曹丕” 之间人物关系的最重要特征。在这篇文章中,使用句间注意力机制对BiLSTM提取的文本特征进行组合,提取其中最重要的语义特征信息。具体如下:

其中,H \in R^{d^\omega\times T}HRdω×T​是BiLSTM的输出, d^\omega​ 是隐层维度,TT​ 是句子长度, \omegaω​ 、 \alphaα​ 、rr​的维度分别为 d^\omega​ 、TT​、d^\omega​。最后使用特征向量rr进行关系分类。

2.3、BERT关系抽取

论文:Enriching Pre-trained Language Model with Entity Information for Relation Classification

主要思想:

使用BERT抽取句子的文本特征用于关系分类。与上节相似,在这篇文章中,也是用特殊符号标记实体的位置,在头实体和尾实体周围分别插入“$”和“#”,并在每个句子的开始位置添加“[CLS]”,然后将目标文本输入到BERT中。关系分类的特征来自于三个部分:句子的整体特征,头实体特征以及尾实体特征。在BERT 预训练时, “[CLS]”被NSP任务用来判断句子对的关系,从而能够学习到对整个句子的表达。因此,句子的整体特征通过 “[CLS]”来获取:

其中,H_0 \in R^dH0​∈Rd是BERT的CLS输出向量,dd是BERT的隐层维度。

而实体对特征则通过对实体的BERT输出做均值化处理获取。具体如下:

最后,将获取的句子特征及实体特征拼接得到最后的特征向量,进行关系分类。

3、小结

本文对几种基于深度学习的有监督关系抽取方法进行了介绍,包括CNN关系抽取、BiLSTM关系抽取以及BERT关系抽取。

想了解更多的AI技术干货,欢迎上华为云的AI专区,目前有AI编程Python等六大实战营供大家免费学习。(六大实战营link:华为云AI实战营_云主机_云服务器_华为云)

点击关注,第一时间了解华为云新鲜技术~

3种基于深度学习的有监督关系抽取方法相关推荐

  1. DeepARG——一种基于深度学习更加准确预测ARG的方法

    DeepARG--一种基于深度学习更加准确预测ARG的方法 本文介绍的是发表于Microbiome名为DeepARG: a deep learning approach for predicting ...

  2. 开放开源 | DeepKE:基于深度学习的开源中文关系抽取工具

    本文转载自公众号:浙大 KG. 作者:余海阳 机构:浙江大学 代码地址: https://github.com/zjunlp/deepke OpenKG 发布地址: http://openkg.cn/ ...

  3. 一种基于深度学习的遥感图像分类及农田识别方法

    文章针对现有的神经网络收敛速度慢.识别准确率不高的缺点,提出了一种基于卷积神经网络的遥感图像农田分类及识别方法.该算法使用较大的卷积核,有效地提取梯度信息:设计深度为6层的卷积神经网络,提高了网络的分 ...

  4. 一种基于深度学习的目标检测提取视频图像关键帧的方法

    摘要:针对传统的关键帧提取方法误差率高.实时性差等问题,提出了一种基于深度学习的目标检测提取视频图像关键帧的方法,分类提取列车头部.尾部及车身所在关键帧.在关键帧提取过程中,重点研究了基于SIFT特征 ...

  5. DeepRMethylSite:一种基于深度学习的蛋白质精氨酸甲基化位点预测方法

    DeepRMethylSite:一种基于深度学习的蛋白质精氨酸甲基化位点预测方法 https://www.researchgate.net/publication/341890599_DeepRMet ...

  6. 一种基于深度学习的增值税发票影像识别系统

    一种基于深度学习的增值税发票影像识别系统-专利技术交底书 缩略语和关键术语定义 1.卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构 ...

  7. 一种基于深度学习的方法来检测摩托车头盔的使用

    背景 据统计使用摩托车头盔可以将道路交通事故中摩托车驾驶员致命伤害的可能性降低42%,尽管如此,遵守摩托车头盔还是较少,尤其是在发展中国家,为了有效开展针对性的头盔使用运动,政府必须收集有关头盔法律遵 ...

  8. 基于linux火焰识别算法,一种基于深度学习模型的火焰识别方法与流程

    本发明属于通信领域,具体涉及一种基于深度学习模型的火焰识别方法. 背景技术: 随着我国工业化与城镇水平的不断提高,现代设施大型公共建筑朝着空间大.进深广功能复杂的多元化方向发展,这对于防烟火朝着空间大 ...

  9. 水位尺读数识别 python_一种基于深度学习的水尺识别方法与流程

    本发明涉及水位监测 技术领域: :,具体地说,涉及一种基于深度学习的水尺识别方法. 背景技术: ::近些年来,随着图像处理技术的发展,通过计算机获得图像里的详细信息成为了一种非常方便且高效的方式.将图 ...

最新文章

  1. google gflags的参数解析,便捷实用
  2. TypeReference -- 让Jackson Json在List/Map中识别自己的Object
  3. 推荐几个MySQL大牛的博客
  4. SQLite添加列的限制
  5. Python-OpenCV 杂项(一):图像绘制
  6. 使用easyexcel导入时间数据转换成Data的坑
  7. 今日arXiv精选 | 15篇ICCV 2021最新论文
  8. 根据变量值取得变量的参数名
  9. 前端学习(2754):配置tabber
  10. js页面跳转与url获取
  11. 方法、方法的重载(Overload)与重写(Override)
  12. 如何有效规避程序化交易的滑点?
  13. Cortex-M3/M4(5)-软件移植
  14. 测试发文章测试发文章
  15. 构建根文件系统(一)
  16. 用python爬取豆瓣影评及影片信息(评论时间、用户ID、评论内容)
  17. 关于xml加载提示: Error on line 1 of document : 前言中不允许有内容
  18. Android应用本地离线激活认证方案—so文件授权认证
  19. windows常用快捷键-简洁版
  20. 区块链相关概念与简介

热门文章

  1. 必备收藏 | 超详细揭秘 Redis 持久化,建议收藏!
  2. Bootstrap 表单的基本控件
  3. es6 Promise.resolve()方法
  4. 如何用java弄相对布局_用java 编码实现相对布局界面
  5. 视觉SLAM笔记(54) Ceres 操作后端优化
  6. sharding分表后主键_分库分表【Sharding-JDBC】入门与项目实战
  7. mysql dump 二进制_mysqldump+二进制日志备份恢复
  8. python图像分类代码_Kaggle—So Easy!百行代码实现排名Top 5%的图像分类比赛
  9. python包里面的dll是什么_使用R的程序包提示我们无法使用怎么回事?因为计算机丢失jvm.dll...
  10. mac cad石材填充图案_CAD怎么填充颜色?