点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

论文解读者:北邮 GAMMA Lab 硕士生  刘念

题目:Self-supervised Heterogeneous Graph Neural Network with Co-contrastive Learning

会议:KDD 2021

论文链接:https://arxiv.org/pdf/2105.09111.pdf

异质图中信息众多,语义复杂,谁来做自监督信号?谁与谁做对比?又该如何对比?孤掌难鸣,唯有两者合作、左右互搏, 方能协同优化、实现共赢。

1 介绍

最近,异质图神经网络(HGNNs)在处理异质信息网络(HIN)方面展现了优越的能力。大部分的HGNNs都遵循半监督学习的设定,然而实际应用中标签信息往往很难获得。而自监督学习由于能够自发地从数据本身挖掘监督信号,已经成为无监督设定下很好的选择。作为一种典型的自监督机制,对比学习(contrastive learning)通过从数据中抽取出正负样本,同时最大化正例间的相似度以及最小化负例间相似度,能够学到判别性的表示。尽管对比学习在CV和NLP领域得到了广泛应用,如何将它和HIN结合却尚未解决。

通过认真考虑HIN以及对比学习的特性,我们总结了三个需要解决的本质问题:

1)如何设计异质对比机制 HIN中包含复杂结构,例如元路径(meta-path),需要利用跨视图的对比学习机制来综合刻画。

2)如何在HIN中选择合适的视图 对于视图的基本要求是,能够刻画网络的局部结构和高阶结构。网络模式(network schema)反应了节点间的直接连接情况,捕捉局部结构;元路径通常被用来抽取多跳关系。

3)如何设置困难的对比任务 简单的正负关系很容易被捕获,模型学到的信息有限。增加对比任务的难度,可通过增加两个视图间的差异,或者生成更高质量的负样本来实现。

在本篇文章中,我们提出了一个新的基于协同对比学习的异质图神经网络框架,简称HeCo。HeCo采用跨视图的对比机制,选择网络模式和元路径作为两个视图,结合视图掩盖机制,分别学得两个视图下的节点表示。之后,利用跨视图对比学习,使得两个视图协同监督。此外,我们还提出两个HeCo扩展,通过生成更高质量的负例,提升最终效果。

2 模型介绍

模型整体流程如上图所示。

2.1 节点特征转换

首先,我们需要将不同类型节点的特征映射到同一空间中,如(a)所示。对于类型的节点,利用类型特别的映射矩阵进行投影:

是投影之后i的特征。

2.2 网络模式视图下的编码器

假设节点与种其他类型的节点相连,对于第类型的邻居,利用节点级别的注意力进行融合:

其中注意力的计算公式如下:

是类型的注意力向量。请注意,在构建时我们并没有聚合所有的邻居,而是随机选取个邻居。这样做可以保证每个节点从邻居中吸收同样的信息量,同时增加了节点表示的多样性,使得接下来的对比学习更具挑战性。

在得到每种类型的表示后,我们利用类型级别的注意力机制进行融合,得到网络模式下的节点表示:

2.3 元路径视图下的编码器

给定条预先定义的元路径,对于元路径,我们可以得到节点基于该条元路径的邻居。利用GCN [1] 对进行聚合:

是节点基于的表示。之后,利用语义注意力机制聚合每条元路径,得到元路径视图下的节点表示,公式如下:

2.4 视图掩盖机制

在上述生成过程中,我们隐去了目标类型节点的信息,只吸收不同类型邻居的信息;在生成的过程中,隐去了元路径上其他类型节点的信息,只吸收和目标节点类型相同的节点信息。这样,从两种视图下学到的节点表示,即相关又互补,互相监督彼此的训练,呈现协同优化的趋势。

2.5 协同对比优化

在得到和之后,将它们映射到对比损失计算的空间中:

接下来,我们需要定义HIN中的正负例。不同于CV,由于HIN中存在大量的边,节点间彼此高度相关。为了反映节点的局部结构,我们定义两个节点彼此互为正例,当它们可由许多条元路径相连。对于节点和,定义函数计数它们间的元路径数量:

对于,选择最大的个节点作为正例集合,其余节点作为负例集合。基于此,我们进行跨视图的对比学习:

表示和间的cosine相似度。不同于一般的对比loss,我们同时最大化多个正例对间的相似度;此外,上述公式表明,对于网络模式下的节点表示,我们利用在元路径模式下正负样本的表示来计算相似度,从而达到跨视图对比的目的。得到的方式相同。总的损失函数如下:

2.6 模型扩展

为了得到更高质量的负样本,我们提出了两种扩展模型:

1) HeCo_GAN 该扩展利用GAN的生成对抗思想,通过判别器和生成器间的对抗,使得生成器生成靠近正例分布的逼真的负例。

2) HeCo_MU 该扩展受启发于MixUp [2]、MoCHi [3]等方法,将和目标节点最相似的K个负例进行随机相加,生成更多高质量的负例。

3 实验

3.1 节点分类

3.2 节点聚类

3.3 模型扩展

3.4 协同趋势

由上图可看出,网络模式和元路径两种视图间呈现出协同优化趋势。例如在ACM中,PAP的注意力值更高,相应的A类型邻居的注意力值更高;在AMiner中,PRP的注意力值更高,相应的R类型邻居的注意力值更高。

参考文献

[1] Thomas N. Kipf and Max Welling. 2017. Semi-Supervised Classification with Graph Convolutional Networks. In ICLR.

[2] Hongyi Zhang, Moustapha Cissé, Yann N. Dauphin, and David Lopez-Paz. 2018. mixup: Beyond Empirical Risk Minimization. In ICLR.

[3] Yannis Kalantidis, Mert Bülent Sariyildiz, Noé Pion, Philippe Weinzaepfel, and Diane Larlus. 2020. Hard Negative Mixing for Contrastive Learning. In NeurIPS.

本期责任编辑:杨成

本期编辑:刘佳玮


北邮 GAMMA Lab 公众号

主编:石川

责任编辑:王啸、杨成

编辑:刘佳玮

长按下图并点击“识别图中二维码

即可关注北邮 GAMMA Lab 公众号

我知道你在看

点击“阅读原文”查看更多精彩

KDD2021 | 左右互搏:基于协同对比学习的自监督异质图神经网络相关推荐

  1. 直播 | KDD 2021论文解读:基于协同对比学习的自监督异质图神经网络

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  2. Dense Contrastive Learning for Self-Supervised Visual Pre-Training(基于密集对比学习的自我监督视觉预训练)2021

    最前面是论文翻译,中间是背景+问题+方法步骤+实验过程,最后是文中的部分专业名词介绍(水平线分开,翻译word文件可以找我要,能力有限,部分翻译可能不太准确) 摘要: 迄今为止,大多数现有的自监督学习 ...

  3. 知识图谱-生物信息学-医学顶刊论文(Bioinformatics-2022)-SGCL-DTI:用于DTI预测的监督图协同对比学习

    14.(2022.5.21)Bioinformatics-SGCL-DTI:用于DTI预测的监督图协同对比学习 论文标题: Supervised graph co-contrastive learni ...

  4. ​AAAI 2023 | 基于历史对比学习的时序知识图谱推理

    ©PaperWeekly 原创 · 作者 | 徐奕 单位 | 上海交通大学Acemap 研究方向 | 数据挖掘 论文标题: Temporal Knowledge Graph Reasoning wit ...

  5. 基于历史对比学习的时序知识图谱推理

    时序知识图谱 知识图谱(KGs)作为人类知识的集合,在自然语言处理.推荐系统和信息检索等领域显示展现了很好的前景.传统的KG通常是一个静态知识库,它使用图结构数据拓扑,并以三元组(s, p, o)的形 ...

  6. 华人博士提出原型对比学习,非监督学习效果远超MoCo和SimCLR

    点上方蓝字视学算法获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作分享,不代表本公众号立场,侵权联系删除 转载于:新智元 继MoCo和SimCLR之后非监督学习的又一里程碑!Sales ...

  7. 文章分享《Supervised Contrastive Learning》 自监督对比学习和有监督对比学习的区别

    文章题目 Supervised Contrastive Learning 作者: Prannay Khosla Piotr Teterwak Chen Wang Aaron Sarna 时间:2020 ...

  8. WWW 2021最佳论文亚军:基于属性补全的异质图神经网络新架构

    ©作者 | 机器之心编辑部 来源 | 机器之心 4 月 23 日,万维网顶会 WWW-2021(The Web Conference 2021: International World Wide We ...

  9. 北大FAIR自动化所快手提出基于动量对比学习的层次Transformer—HiT,用于视频文本检索!代码已开源!...

    关注公众号,发现CV技术之美 ▊ 写在前面 随着互联网上多媒体数据的增长,视频文本检索已经成为一个热门的研究课题.用于视频文本学习的Transformer因其良好的性能而受到越来越多的关注.然而,现有 ...

最新文章

  1. Spring.NET实用技巧3——NHibernate分布式事务(上)
  2. JAVA-数据库之JDBC连接MySQL数据库
  3. WebAssembly + Dapr = 下一代云原生运行时?
  4. [HZNOI #koishi] Magic
  5. 《位运算技巧以及Leetcode的一些位运算题目》
  6. leetcode 131. 分割回文串 思考分析
  7. [html] 字体图标加载出来成了小方块,是什么原因呢?如何解决?
  8. base64位转成二进制流_你知道 Base64 编码中的 64 指的是什么吗?
  9. 微服务的灾难:折磨人的环境!
  10. DXUT实战2:HLSL(withoutEffect)+D3D9+DXUT(june_2010) .
  11. JavaScript文档对象模型获取body元素对象和获取Html元素对象(3)
  12. matlab进阶摸索篇——彩色图直方图均衡化
  13. 计算机二级java技巧,计算机二级java难学吗
  14. su灯光插件_su各种插件合集
  15. Java程序员必备辅助开发神器(2022年版)
  16. 计算机毕业设计PHP图书馆图书借阅管理系统
  17. solus linux下载链接,Solus Linux下载_Solus 4.0 最新版_零度软件园
  18. 整理了上千个Python类库,简直太酷啦!
  19. 从文件结构认识HLS
  20. 尤菲·如月 与你有约 ぐりぐりキュートユフィ汉化补丁

热门文章

  1. 优质的矢量图形免费下载网站
  2. 操作系统笔记:windows 替换ctrl和alt键功能
  3. 什么是原子类,原子类有那些,有什么作用
  4. 有100元人民币,分别有1、2、5元三种人民币组成,其中每种人民币至少有一张,请问有多少种组合方法
  5. “注册表修改start page 时,显示无法编辑startpage”的对应办法
  6. 运算放大器的工作原理
  7. 4月N2知识冲刺(1)
  8. 最全讲解WFE和WFI进入低功耗的原理机制
  9. Ceph 的基础数据结构 [Pool, Image, Snapshot, Clone]
  10. 高数---第十章无穷级数---幂级数---收敛区间,函数展开