今天给大家介绍蒙特利尔算法研究所Yoshua Bengio教授课题组在ICML 2019发表的文章“GMNN:Graph Markov Neural Network”。作者在文章中提出了图马尔可夫神经网络GMNN,该模型可以结合统计关系学习方法和图神经网络的优点来研究关系数据的半监督对象分类问题,能够学习用于预测对象标签的对象表示以及对对象标签之间的依赖关系进行建模。经过实验证明,在对象分类,链接分类和无监督节点表示学习方面,GMNN均获得了最先进的结果。

1

研究背景

现实世界的各种实体通过各种关系相互连接,例如网页通过超链接链接,社交媒体用户通过友谊关系建立联系。对这类关系数据进行建模是机器学习中的一个重要主题,它包含了实体分类,链接(边)预测和链接(边)分类等各种应用。

半监督对象分类是关系数据建模的一个基本问题,在研究这一问题时人们通常使用统计关系学习(SRL)方法或图神经网络(GNN)。SRL通常使用条件随机字段对对象标签的依赖性进行建模,但是因为条件随机场(CRF)中的势函数被定义为手动设计的特征函数,导致模型的效果不够理想,对象之间复杂的关系结构也会使SRL方法难以推断未标记对象的标签后验分布,GNN专注于学习标记对象的标签后验分布而忽略对象标签之间的依赖关系。

针对以上两类方法存在的问题,作者提出了图马尔可夫神经网络(GMNN),该模型结合SRL和GNN的优点对这两类方法进行互补,用条件随机场对对象标签的联合分布进行建模,使用变分EM算法对其进行有效训练,不仅能学习有效的对象表示,还能学习到不同对象间的标签依赖关系。

2

模型

GMNN模型首先使用CRF对基于对象属性的对象标签的联合分布进行建模,由于大多数对象是未标记的,通过计算已标记对象的标签的极大对数似然来学习模型参数是比较困难的,因此作者提出使用伪似然变分EM框架优化对数似然的证据下界(ELBO),对数似然的ELBO表示如公式(1)所示:

其中表示已标记对象的标签而表示未标记对象的标签,表示所有对象的属性,是近似后验分布的变分分布,和均为模型参数。

GMNN模型的伪似然变分EM框架中的E-step目的是计算变分分布,具体实现时使用了平均场和摊销推理的思想,将变分分布表示为公式(2):

其中表示未标记的对象标签,表示的邻域对象标签。E-step通过最小化(2)中约等号两边公式的反KL散度以及通过预测已标记对象的标签来训练来确定GNN的目标函数。M-step中将表示为伪似然,使用另一个非线性GNN参数化对对象标签进行建模。整体GMNN算法如表1所示:

表1 GMNN的算法框架

图1展示了GMNN的基本框架,首先使用条件随机场对目标对象标签的联合分布进行建模,然后使用伪似然变分EM框架进行优化,其中E-step使用一个图神经网络来学习标签预测的对象表示,M-step则使用另一个图神经网络来建模对象标签。

图1  GMNN的基本框架

3

实验

作者通过对象分类、无监督节点表示学习和链接分类这三个任务对GMNN的性能进行了评估。实验中使用的数据集如表2所示:

表2 数据集统计

其中OC、NRL、LC分别表示对象分类、节点表示学习和链接分类任务。为了验证GMNN的有效性,作者将GMNN与其它三类基线方法进行比较:(1)GNN methods:包括图卷积网络GCN、图注意力网络GAT、深度图互信息DGI、DeepWalk和Planetoid;(2)SRL methods:包括概率关系模型PRM、关系马尔可夫网络RMN和马尔可夫逻辑网络MLN;(3)SSL methods:标签传播LP。

3.1对象分类

在对象分类任务中,GMNN的表现明显优于所有SRL方法,因为GMNN在推理过程中采用GNN模型学习有效的对象表示以改进推理,并且在学习过程中使用另一个GNN对本地标签依赖项进行建模,这与SRL方法相比更为有效。GMNN还优于标签传播方法,因为GMNN能够使用对象属性并以非线性方式传播标签,与GCN相比,GMNN的性能提升主要来自于对标签依赖关系建模的能力。具体实验结果如表3所示,对于链接分类,作者通过实验得到了类似的结果。

表3  对象分类结果(%)

3.2无监督节点表示学习

GMNN在Cora和Pubmed数据集上获得了最佳结果。原因是GMNN使用网络有效地模拟了不同节点的邻域分布的平滑度。此外,GMNN的性能与半监督环境下的性能非常接近(表2),这表明学习到的节点表示非常有效。通过实验还比较了不使用网络的变体,在这种情况下GMNN性能显著下降,这表明了使用作为邻域分布正则化的重要性。具体实验结果如表4所示:

表4  无监督节点表示学习的结果(%)

4

总结

文章主要研究了半监督对象分类问题,并提出了一种称为GMNN模型,该模型使用条件随机场对对象标签的联合分布进行建模,并利用两个图神经网络来改进推理和学习过程。此外,作者在三个任务上对GMNN进行评估并证明了该模型的有效性。

参考资料

原文链接

https://arxiv.org/abs/1905.06214

代码

https://github.com/DeepGraphLearning/GMNN

ICML 2019 | 图马尔可夫神经网络相关推荐

  1. 图马尔可夫网络:融合统计关系学习与图神经网络

    ©PaperWeekly 原创 · 作者|石壮威 学校|南开大学硕士 研究方向|机器学习.图神经网络 论文标题: GMNN: Graph Markov Neural Networks 收录会议: IC ...

  2. [论文笔记]GMNN图马尔可夫网络原理

    GMNN Note 参考: Paper: GMNN: Graph Markov Neural Networks (arxiv.org) Paper Motivation 问题定义:弱监督下的关系数据中 ...

  3. CGMM 基于上下文的马尔可夫模型

    github代码:https://github.com/diningphil/CGMM 1. Introduction 结构域学习处理不同大小和拓扑结构.数量的数据,来在模型中识别.合成.嵌入结构化关 ...

  4. ESL第十七章 无向图模型 学习/推断/成对马尔可夫独立/全局马尔可夫性、协方差图/高斯图/修改回归算法/图结构估计/图lasso、【受限】玻尔兹曼机/泊松对数线性建模/迭代比例过滤/对比散度

    目录 17.1 导言 17.2 马尔可夫图及其性质 17.3 连续变量的无向图模型 17.3.1 图结构已知的参数估计 17.3.2 估计图结构 17.4 离散变量的无向图模型 17.4.1 图结构已 ...

  5. 双向循环神经网络(隐马尔可夫模型)

    在双向循环神经网络中,每个时间步的隐状态由当前时间步的前后数据同时决定. 双向循环神经网络与概率图模型中的"前向-后向"算法具有相似性. 双向循环神经网络主要用于序列编码和给定双向 ...

  6. 13张动图助你彻底看懂马尔科夫链、PCA和条件概率!

    来源:新智元 本文共2100字,建议阅读9分钟. 本文用可视化的方式来解释抽象的理论概念,使这些抽象概念变得生动而立体! [ 导读 ]马尔科夫链.主成分分析以及条件概率等概念,是计算机学生必学的知识点 ...

  7. 【数据挖掘】贝叶斯信念网络 ( 马尔科夫假设 | 结构 | 有向无环图 | 参数 | 条件概率表 | 案例分析 )

    文章目录 I . 贝叶斯信念网络 II . 马尔科夫假设 III . 贝叶斯信念网络 示例 1 IV . 贝叶斯信念网络 示例 2 V . 贝叶斯信念网络 联合概率分布计算 VI . 贝叶斯信念网络 ...

  8. html树状图右侧_马尔可夫模型怎么画?必备入门级模型图设计软件

    马尔可夫模型是什么呢?马尔可夫模型(Markov Model)也叫马尔可夫分析法,是一种广泛通用的应用于语音识别,音字转换,概率文法,词性自动标注等各个自然语言处理领域的统计模型.马尔可夫模型可以帮助 ...

  9. 《数学之美》读书记录【思维导图记录】:第五章,隐含马尔可夫模型

    隐含马尔可夫模型: 补充资料: 状态转移矩阵: 状态转移矩阵是俄国数学家马尔科夫提出的,他在20世纪初发现:一个系统的某些因素在转移过程中,第n次结果只受第n-1的结果影响,即只与当前所处状态有关,而 ...

最新文章

  1. java7 的final真的有坑啊。
  2. 夜晚 十点 React-Native 源码 暴力畜 系列
  3. k8s集群搭建教程(centos k8s搭建)
  4. C++描述的位运算总结
  5. 动态改变ListView布局
  6. sed,awk,grep学习笔记
  7. 【FPGA算法加速】FPGA编程开发环境:Vivado安装教程详细说明
  8. vue json对象转数组_vue-vue-router 快速了解,多看看能扎实基础
  9. Safari浏览器兼容性问题处理
  10. 高校圆桌派话题征集第五期来咯
  11. MySQL(二)查询操作
  12. win 10 禁用键盘,下载vc
  13. 云游戏深度报告:中国云游戏商业模式在哪里?
  14. matlab模拟断层成像,基于matlab和nirfast的荧光分子断层成像
  15. ubuntu安装HBuilder过程
  16. 文本分类中的文本特征表示
  17. 简理财COO郭勇:大数据驱动线上财富管理的深层逻辑是什么?
  18. 面对金九银十你真的准备好了吗?
  19. android模拟器背景色,安卓开发者必备的 5 款 App:终端模拟器、颜色萃取、移动 IDE 等...
  20. Battery Historian分析手机耗电神器

热门文章

  1. 爱奇艺视频千万级生产 Kubernetes 集群优化实践!
  2. SpringBoot+MDC实现全链路调用日志跟踪,这才叫优雅!
  3. 嗯,挺全乎儿的,Spring Boot 多环境配置都在这儿了,你喜欢哪一种呢?
  4. 今天说的是必须要熟练掌握的归并排序
  5. 活久见!64 张图带你 Maven 实战通关
  6. 如何成为顶尖管理者?
  7. 程序员成长的本质,就是一步步靠近商业
  8. 敏捷开发实践—任务看板
  9. Linux Ethercat主站
  10. 卡尔曼算法笔记---思想和实际应用物理含义的理解