本文主要复述论文["Modeling Relational Data with Graph Convolutional Networks"] 的主要内容
感谢小姐妹带我读论文~

摘要

本论文介绍的是关系图卷积网络模型(R-GCN),并在两个已知的知识库上实现关系预测与实体分类。R-GCN是在GCN的基础上优化得到的神经网络模型,原来的GCN处理的是具有拓扑结构的数据集之间的单关系,R-GCN则可以处理知识库中的多关系数据特征。与仅解码器的基准对比,改模型在FB15K-237上有29.8%的改进。

问题介绍

目前知识库的信息不完整,预测知识库中丢失的信息是SRL的主要任务。依据先前工作,考虑知识库的存储模式是三元组式的集合(主语,谓语,宾语),例如(Mikhail Baryshnikov, educated at, Vaganova Academy)。并假定实体为类型标签,例如(Vaganova Academy is marked as a university)。则知识库的表示完成带标签的有向图,具有带标签编码的节点和三元组实体。具体结构见Figure1。

Figure 1

论文中考虑两个基本的SRL任务:关系预测(丢失三元组的恢复)和实体分类(为实体分配类型或分类属性)。 在这两种情况下,通过图结构编译器可以获得丢失的信息。比如,知道Mikhail Baryshnikov是在Vaganova学院接受教育的,这意味着Mikhail Baryshnikov应该有标签person,其三元组 (Mikhail Baryshnikov, lived in, Russia)属于知识图。

GCN

图卷积神经网络应用在具有拓扑结构的图数据集上,其与CNN的计算方式类似,滤波器参数在图中的所有位置或者说所有局部位置都可共享,目标是学习图G=(V, E)上的特征映射。
定义卷积网络中的第l+1层,其向前传播的非线性激活方程可表示为


其中H(0)=X,H(L)=ZX∈(N×D)是节点特征向量的输入矩阵,N为节点数,D为特征维数。Z∈(N×F)为输出矩阵,A为图结构的邻接矩阵,描述每个节点的度数。O是非线性激活函数,比如ReLu。W是当前层的权重矩阵。
上式的传播规则有两个限制:一是节点本身的信息量未被计入,二是A本身未被正则化,直接进行矩阵运算会改变特征向量的域。Kipf & Welling (ICLR 2017)提出了矩阵的对称归一化,对第一个问题引入节点自环,即此时的A=A+I;对第二个问题引入节点度的对角化矩阵,由可以实现节点特征的归一化。实际上,借鉴对拉普拉斯矩阵的标准化公式可以更好的描述邻接矩阵的动态特性,其中

此处引入拉普拉斯矩阵进行归一化的行为我不是很理解,关于谱论的知识我也没有补,想要深入探讨的旁友可以参阅其他资料,此处发一个GCN传播规则的解释的链接,大嘎可以参考参考----GCN的空间域理解

那么带入之后我们就可以得到下列的前向传播公式:


再应用Weisfeiler-Lehman算法到这个GCN模型上,可以得到下式中以向量形式表示的传播规则。是边<vi,vj>的归一化常数,也就是经该算法得到的对邻接矩阵进行对称归一化的变体。

则是对当前节点i得到的邻居节点j的特征向量,并经过hash(·)进行特征更新。

R-GCN

GCNs可以有效获取局部图特征,在图分类、基于图的半监督学习模型中得到改进。作者对于R-GCNs定义了下述的传播准则:

对于节点或实体,表示关系r∈R下的节点i的邻居节点集,是归一化常数,可以预先学习或选择(例如)。

正则化

多关系模型中的参数数量和关系数量增长很快,在计算过程中很容易导致稀疏关系矩阵的过度拟合。论文中引入了两种正则化权重矩阵的方式:基函数分解和块对角分解。

块对角分解视为每种关系类型对权重矩阵的稀疏约束,通过块分解可以将潜在特征分组为变量集,这些变量集在组内比在组间更加紧密的耦合。这两种分解都可以帮助我们减少训练当中的参数规模。

模型结构

与常规GCN不同,该模型引入了由边的类型与方向决定的关系转换,等式中+的后一项表示节点的自连接。模型中每个节点参数的更新过程可以Figure2来描述,红色部分为节点或者说实体,与蓝色的邻接节点进行矩阵运算,再对每种关系的边类型进行转换,得到绿色部分的已做归一化处理的结果总和,累加后经过激活函数传递,由此在模型中并行更新节点参数。

Figure2

整个模型采用堆叠层,即上一级的输出作为下一级的输入。作者在初始化时仅考虑了无特征向量方法,选择图节点的独热编码作为第一层的节点向量输入,对于块表示,通过线性变换将one-hot编码映射为密集表示。

  • Entity classification:
    在模型堆叠的最后一层,对每个节点使用softmax分类器,财通R-GCN提供的节点表示来预测标签,将所有标记节点上的交叉熵最小化。实体分类的模型示意图可参考Figure a3。

    Figure 3

  • Link prediction:

实验评估

实体分类

数据集选择了RDF格式的四个数据集,详细见table1。

结果见table2。

链接预测

数据集的选择见table3。

实验结果见table4。

论文笔记 | 使用GCN建模关系数据相关推荐

  1. 【论文笔记】RSE//结合遥感数据和气象数据改进关中平原小麦产量估算的LSTM神经网络

    1.材料与方法 计算植被温度条件指数(VTCI)和叶面积指数(LAI)两个遥感指标: 主要采用:1km空间分辨率的LST产品.1km空间分辨率的表面反射率数据产品.空间分辨率为500m的4天MODIS ...

  2. 论文笔记目录(ver2.0)

    1 时间序列 1.1 时间序列预测 论文名称 来源 主要内容 论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Dr ...

  3. 论文浅尝 | Rot-Pro:通过知识图谱嵌入中的投影建模关系的传递性

    笔记整理:陈湘楠,浙江大学硕士在读. 研究背景 知识图嵌入模型学习知识图谱中实体和关系的表示,以预测实体之间的缺失链接(关系).它们的有效性深受建模和推断不同关系模式(如对称.不对称.逆向.组合和传递 ...

  4. RGCN - Modeling Relational Data with Graph Convolutional Networks 使用图卷积网络对关系数据进行建模 ESWC 2018

    文章目录 1 相关介绍 两个任务 main contributions 2 Neural relational modeling 2.1 符号定义 2.2 关系图卷积网络R-GCN 2.3 Regul ...

  5. 【论文笔记】李盟, et al. 一种恶意代码特征选取和建模方法. 计算机应用与软件 08(2015):272-277.

    前言 论文笔记. 论文笔记 出处及年份 <计算机应用与软件 Computer Applications and SoftwareVol.>第32卷第8期2015年8月 论文标题 一种恶意代 ...

  6. 论文笔记:Dynamic GCN: Context-enriched Topology Learning for Skeleton-based Action Recognition

    原论文:Dynamic GCN: Context-enriched Topology Learning for Skeleton-based Action Recognition(暂未开源) Dyna ...

  7. GCN论文笔记——HopGAT: Hop-aware Supervision Graph Attention Networks for Sparsely Labeled Graphs

    [论文笔记]HopGAT: Hop-aware Supervision Graph Attention Networks for Sparsely Labeled Graphs 作者:纪超杰,王如心等 ...

  8. 读周傲英老师的论文:计算广告:以数据为核心的web综合应用笔记

    读周傲英老师的论文:计算广告:以数据为核心的web综合应用笔记 原文链接:http://cjc.ict.ac.cn/quanwenjiansuo/2011-10/zay.pdf 摘要 涉及学科:数据管 ...

  9. ESWC 2018 | R-GCN:基于图卷积网络的关系数据建模

    目录 前言 1. 关系图卷积网络 2. 正则化 3. 实验 3.1 节点分类 3.2 链接预测 前言 题目: Modeling Relational Data with Graph Convoluti ...

  10. 【牛津大学博士论文】关系数据的学习和推理

    来源:专知 本文为论文介绍,建议阅读5分钟 在这篇论文中,我们研究了关系数据的学习和推理. 关系数据在现代计算中无处不在,并驱动跨多个领域的几个关键应用程序,如信息检索.问题回答.推荐系统和药物发现. ...

最新文章

  1. windows下 composer常见问题及处理
  2. java贪吃蛇教程_用Java做的贪吃蛇,简单版......
  3. python 跳出多重循环
  4. python中tell_Python的File tell()方法使用方法及作用解析(实例)
  5. springboot常用配置
  6. UVA 512 Spreadsheet Tracking
  7. SQLServer格式化时间
  8. 优酷《追光吧!》正式开播 风度、实力成关键词
  9. 一台手机苹果含泪赚4000?iPhone 12硬件成本曝光
  10. SCVMM 2012 R2---添加Hyper-V虚拟机
  11. 易语言.用修改注册表的方式来关闭win10自带的杀毒软件
  12. java 期刊杂志参考_参考文献可以引用整本期刊杂志吗?格式怎么写?
  13. php论坛搭建,PHP建设论坛:Discuz!论坛快速架设指南
  14. vs2019,C#,MySQL创建图书管理系统2(登录功能实现)
  15. PC分享插件js - sosh.min.js
  16. [sig16]Real-time Rendering on a Power Budget
  17. c++类和对象---多态
  18. type=submit表单提交理解
  19. 使用计算机打印汉字文档是汉字(),浙江财经学院本科社会调查汇报撰写规范.doc...
  20. 《首先,打破一切常规》笔记(转)

热门文章

  1. PIL.Image.transpose 顺时针旋转
  2. linux 多个文件中查找字符串
  3. Yii框架官方指南系列53——专题:使用命令行生成代码(已废弃)
  4. 【Codeforces #228】Solutions
  5. CCNA11月20日战报
  6. 对MYSQL进行压力测试
  7. ESRI ArcGIS 9.0系列软件报价
  8. Luogu P5201 [USACO19JAN]Shortcut 最短路树???
  9. bzoj 相似回文串 3350 3103 弦图染色+manacher
  10. 使用MapReduce将HDFS数据导入到HBase(三)