点击下面卡片关注我呀,每天给你送来AI技术干货!

来自:浙大KG

论文题目:Document-level Relation Extraction as Semantic Segmentation

本文作者:张宁豫(浙江大学)、陈想(浙江大学)、谢辛(浙江大学)、谭传奇(阿里巴巴),陈漠沙(阿里巴巴),黄非(阿里巴巴),司罗(阿里巴巴),陈华钧(浙江大学)

接收会议:IJCAI 2021

论文链接:https://arxiv.org/abs/2106.03618

1. 总述

关系抽取(Relation Extraction, RE)是从纯文本中提取未知关系事实,是自然语言处理领域非常重要的一项任务。过去的关系抽取方法主要将注意力集中于抽取单个实体对在某个句子内反映的关系,然而单句关系抽取在实践中受到不可避免的限制:在真实场景如医疗、金融文档中,有许多关系事实是蕴含在文档中不同句子的实体对中的,且文档中的多个实体之间,往往存在复杂的相互关系。如下图所示:

图中包括了文章中的三个关系事实(从文档标注的诸多关系事实中采样得到),其中涉及这些关系事实的命名实体用彩色着色,其它命名实体用下划线标出。与句子级相比,文档级关系抽取中的文本要长得多,并且包含更多的实体, 这使得文档级关系抽取更加困难。其中(Maryland, country, US)、(Baltimore, located_in, Maryland) 和 (Eldersburg, located_in, Maryland)三组triples中的实体在同一个句子中的出现,这种句内关系相对容易识别。然而,跨句实体之间的关系识别更具挑战性, 例如,关系事实(Baltimore,country,U.S.)和(Eldersburg,country,U.S.)中的相关实体并没有出现在同一个句子中并且需要长距离依赖, 具体来说,多个三元组之间的相互依赖是有利的,可以为实体多的情况下的关系分类提供指导。例如,如果句内关系 (Maryland, country, US) 已被识别,则{US} 不可能处于任何 person-social 关系中,例如"is the father of." 此外,根据{Eldersburg} 位于{Maryland} 和{Maryland} 属于{US} 的三元组,我们可以推断{Eldersburg} 属于{US} . 如上所述,每个关系三元组可以向同一文本中的其他关系三元组提供信息。

文档级关系抽取主要面临以下三个挑战:

1. 相同关系会出现在多个句子。在文档级关系抽取中,单一关系可能出现在多个输入的句子中,因此模型需要依赖多个句子进行关系推断。

2. 相同实体会具有多个指称。在复杂的文档中,同一个实体具有各种各样的指称,因此模型需要聚合不同的指称学习实体表示。

3. 不同三元组之间需要信息交互。文档包含多个实体关系三元组,不同的实体关系三元组之间存在逻辑关联,因此模型需要捕捉同一篇文档中三元组之间的信息交互。

然而先前的基于graph或基于transformer的模型仅单独地使用实体对,而未考虑关系三元组之间的全局信息。本文创新性地提出DocuNet模型,首次将文档级关系抽取任务类比于计算机视觉中的语义分割任务。DocuNet模型利用编码器模块捕获实体的上下文信息,并采用U-shaped分割模块在image-style特征图上捕获三元组之间的全局相互依赖性,通过预测实体级关系矩阵来捕获local和global信息以增强文档级关系抽取。实验结果表明,我们的方法可以在三个基准数据集DocRED,CDR和GDA上获得SOTA性能。

2. 方法

具体来说,DocuNet模型分为三个模块:

(1)Encoder Module

我们将triple抽取视为sequence-to-sequence的任务,以更好地对实体和关系之间的交叉依赖进行建模。我们将输入文本和输出三元组定义为源和目标序列。源序列仅由输入句子的标记组成,例如“[CLS] The United States President Trump was raised in the borough of Queens ...[SEP]”。我们连接由特殊标记 ”< e >” 和 ”< /e >”分隔的每个实体/关系的三元组作为目标序列。

其中是  实体感知注意力的注意力权重,对于矩阵中的每个实体,它们的相关性由一维特征向量  捕获。

(2)U-shaped Segmentation Module

三元组之间存在局部语义依赖,语义分割中的CNN可以促进感受野中实体对之间的局部信息交换。文档级RE还需要全局信息来推断三元组之间的关系,语义分割模块中的下采样和上采样可以扩大当前实体pair对嵌入  的感受野,能够增强全局隐式推理:

我们把实体级关系矩阵  作为D-channel图像,我们将文档级关系预测公式化为像素级掩码, 其中N是从所有数据集样本中统计出的最大实体数。

(3)Classification Module

给定实体pair的特征表示和实体级关系矩阵Y,我们使用前馈神经网络将它们映射到隐藏表示z。然后,我们通过双线性函数获得实体pair之间关系预测的概率表示如下:

由于观察到 RE 存在不平衡关系分布(许多实体对具有 NA 的关系),我们引入了一种平衡的 softmax 方法进行训练:

3. 实验

(1)数据集

为了验证DocuNet的效果,我们在三个文档级关系抽取数据集上评测,数据集具体分析如下所示:

(2)实验结果

由下面实验结果表明,DocuNet比以往的文档级关系抽取方法效果更佳。

4. 总结与展望

在本文中,我们把文档级关系抽取任务看作语义分割来求解,直接给出了如何将 UNet 应用于文档级 RE 的解决方案,实验结果表明U-shaped模块能有效得理解局部上下文和全局相互依赖性。目前结果表明U-shaped模块中的卷积学习了 RE 三元组之间的相互作用,但仍U-shaped模块的推理作用尚是隐式的,未来对U-shaped模块进一步的可视化分析有助于我们加强理解其是如何做三元组之间推理的。我们的方法证实了语义分割模块在处理RE中有效性,仍需要更多的工作去探索U-shaped模块在如aspect-based sentiment analysis等其他nlp任务上的应用。

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

点击上面卡片,关注我呀,每天推送AI技术干货~

整理不易,还望给个在看!

【IJCAI2021】长文本知识抽取:基于语义分割的文档级三元组关系抽取相关推荐

  1. 直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  2. CVPR2019| 亚洲微软研究院、阿德莱德论文:结构知识蒸馏应用语义分割

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 今天介绍一篇来自阿德莱德大学.亚洲微软研究院.北航的CVPR2019关于语义分割的论文. 本文研究了利用大型网络训练 ...

  3. 空间中的语义直线检测_基于语义分割的车道线检测算法研究

    龙源期刊网 http://www.qikan.com.cn 基于语义分割的车道线检测算法研究 作者:张道芳 张儒良 来源:<科技创新与应用> 2019 年第 06 期 摘 ; 要:随着半自 ...

  4. 基于语义分割Ground Truth(GT)转换yolov5目标检测标签(路面积水检测例子)

    基于语义分割Ground Truth(GT)转换yolov5目标检测标签(路面积水检测例子) 概述 许多目标检测的数据是通过直接标注或者公开平台获得,如果存在语义分割Ground Truth的标签文件 ...

  5. 《论文阅读》开放域对话摘要(长文本|知识嵌入)

    <论文阅读>开放域对话摘要(长文本|知识嵌入) 前言 相关知识 文本摘要 对话摘要 Mind the Gap! Injecting Commonsense Knowledge for Ab ...

  6. 基于监督学习和远程监督的神经关系抽取

    基于监督学习和远程监督的神经关系抽取 作者:王嘉宁  QQ:851019059  Email:lygwjn@126.com 最新:博主发表在华东师范大学学报(自然科学版)的<基于远程监督的关系抽 ...

  7. 基于依存句法分析的开放式中文实体关系抽取

    参考: HanLP自然语言处理 基于依存分析的开放式中文实体关系抽取方法 命名实体三元组抽取参考自fact_triple_extraction 这一段时间一直在做知识图谱,卡在实体关系抽取这里几个月了 ...

  8. 论文翻译 | Mask-SLAM:基于语义分割掩模的鲁棒特征单目SLAM

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 1 摘要 本文提出了一种将单目视觉SLAM与基于深度学习的语义分割相结合的新方法.为了稳定运行,vSL ...

  9. 基于语义分割的身份证部件解析和文字检测

    概述 这个工作主要是利用之前项目的语义分割算法,顺便探索一下身份证部件解析的功能.安排实习生利用合成的身份证照片进行了语义分割的标注. 我的目的有两个:1.检测身份证上的信息是否齐全:2.确定身份证各 ...

  10. 基于语义分割的矸石充填捣实机构防碰撞系统

    对研一时候做的一个项目进行简短的总结~ 背景:为某煤矿公司智能研究中心做一个智能检测:矸(gān)石充填防碰撞的检测和预警.矸石充填就是捣实机不断把传动带送过来的细碎矸石给往后捣实.以往都是矿工手动操 ...

最新文章

  1. UI设计培训分享:2021年UI设计风格新风向标主要体现在哪些方面
  2. Visual Studio 15改进C++工程加载
  3. Pdf怎么转换excel表格,职场人士必备技能
  4. xml+dom4j+xpath学生管理系统
  5. NgRx createSelector 工具函数的三个类型参数
  6. 源服务器未能找到目标资源的表示或者不愿,java - 源服务器没有找到目标资源的当前表示,或者不愿意透露一个存在。 关于部署到 tomcat - 堆栈内存溢出...
  7. mysql数据库字段字符转数字批量语句_MySQL数据库批量替换指定字段字符串SQL语句命令...
  8. mrtg监控硬盘容量,内存占用,CPU占用 二
  9. 佳能MG2580S清零
  10. 一款超漂亮的简历生成器,金三银四的你一定用得上
  11. AR人脸识别 Three.js + tensorflow.js(一)
  12. http://www.jb51.net/softjc/33896.html(vs2010破解)
  13. Dynamics crm2013 IFD部署后启用多组织
  14. linux系统宝塔安装nodejs,基于debian宝塔面板安装nodebb – 一款基于Node.js的论坛程序...
  15. java写足球游戏_月光软件站 - 编程文档 - Java - 足球战术之flyweight篇
  16. 10大耗油,10大省油。
  17. QTableView 例三(代理)
  18. ElementUI 图标字体无法正常显示 本地CDN文件
  19. wpa_cli的使用
  20. 可汉学院python_A可汗学院-统计学python实现1-10

热门文章

  1. Html+CSS基础之img标签
  2. ThinkPHP redirect 传参
  3. 小程序授权登录的体验优化
  4. css3制作旋转动画
  5. MySQL 【Row】下的 Event_type
  6. HTML的form表单标签
  7. Tensorflow Python3 做神经网络(视频教程)
  8. [转]如何在Windows 10中更改文件夹背景颜色
  9. 简单分布式系统构建知识
  10. A计划 hdu2102(bfs一般题)