点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

GNN 旨在学习单节点表示。当我们想要学习一个涉及多个节点的节点集表示(如链路表示)时,以往工作中的一个常见做法是将 GNN 学习到的多个单节点表示直接聚合成节点集的联合表示。在本文中,我们展示了这种方法的一个基本缺陷,即无法捕获节点集中节点之间的依赖关系,并论证了直接聚合单节点表示不能得到多节点集合的有效联合表示。然后,我们注意到之前一些成功的多节点表示学习工作,包括 SEAL、DE和 ID-GNN,都使用了节点标记。这些方法首先根据节点与目标节点集的关系在图中标记节点,然后再应用 GNN,并将标记图中获得的节点表示聚合为节点集表示。通过研究它们的内部机制,我们将这些节点标记技术统一为一个单一且最基本的形式,即labeling trick。我们证明,通过labeling trick,具有足够节点表达能力的 GNN 可以学习最具表达力的节点集表示,因此原则上可以解决节点集上的任何联合学习任务。一项重要的两节点表示学习任务——链接预测——的实验验证了我们的理论。我们的工作为使用 GNN 进行节点集上的联合预测任务奠定了理论基础。

本期AI TIME PhD直播间,我们邀请到北京大学人工智能研究院助理教授、博士生导师——张牧涵,为我们带来报告分享《Labeling Trick: 一个图神经网络多节点表示学习理论》。

张牧涵:

北京大学人工智能研究院助理教授、博士生导师,北京通用人工智能研究院(BIGAI)研究员,2021年国家优青(海外)项目获得者。主要研究方向为机器学习/深度学习和图神经网络的算法、理论、应用等。提出了图神经网络的多种经典算法,如图分类的SortPooling、链路预测的SEAL算法、矩阵补全的IGMC算法等。成果被多次写入图深度学习标准库,如PyTorch Geometric和DGL。2015年本科毕业于上海交通大学IEEE试点班,2019年于美国圣路易斯华盛顿大学获得计算机科学博士学位。2019-2021年期间曾担任Facebook AI研究科学家,参与开发Facebook内部大型图深度学习系统并应用于社交网络和广告推荐中。担任ICML 2022领域主席、IEEE BigData 2021副主席,并常年担任NeurIPS、ICML、ICLR、AAAI、IJCAI和TPAMI、TNNLS、TKDE、AOAS、JAIR等顶级会议和期刊的审稿人。

什么是多节点表示学习?多节点表示学习指的是我们要学习图中不止一个节点,而是一个节点集的表示。因为图神经网络是用于单节点表示学习的,当我们想要获得多节点表示的时候通常是把这些GNN学到的单节点表示聚合成一个多节点的表示。经过我们的研究,我们发现这种多节点表示的学习方法是不好的。我们也提出了一个方法——Labeling Trick,并证明了相关理论。

虽然多节点表示学习理论是通用的,但是我们选择link prediction(链路预测)这样一个双节点表示学习任务作为例子。

在一个不完全的网络中,link prediction预测两个节点之间是否会形成链路,即一个连边。它有很多现实应用,比如如今现实生活中的各种推荐系统。

传统的链路预测大多是根据启发式的方法,定义一些节点在网络中的相似度度量来预测链路。这些启发式的方法往往方便计算而且具有较好的可解释性。我们接下来看几个知名的启发式方法。

这也启发了我们用图神经网络直接学习图上的结构特征,而不是使用手工定义的那些特征。

这样就有了这两个知名的工作:VGAE/GAE 和 SEAL

  • 自动的在链路周边学习和链路形成强关联的结构特征。

  • 对于链路形成机制是没有假设的,因为是直接从邻近的节点结构进行学习。

  • SEAL达到了新的state-of-the-art 线路预测性能。

结果

我们可以看到SEAL和VGAE两种方法都是使用图神经网络来学习链路表示并进行预测,但是性能相差很多,我们接下来主要回答这个问题。

上图为两个食物链的网络,左图为陆地上的食物链网络,右图为海洋上的食物链网络。

这两个食物链网络是同构的。

  • 问:海豹seal吃什么?远洋鱼or红松鼠

  • GNN无法区分海豹和红松鼠之间的链路与海豹和远洋鱼之间的链路

  • 所以说GNN真的不适合链路预测任务么?

Labeling Trick节点标注技巧

定义:给定节点集S和图A,我们会在A的第三个维度上叠加一个diagonal labeling matrix L(S)得到一个新的A(S),即标注后的A。L(S)满足以下条件:

Main Theorem

如果Γ(i,A)是node i的structural representation,那么对节点集S和S’,以及使用labeling trick标注过的A(S)和A(S’),我们聚合他们在标注后的A(S)得到的Γ(i,A(S)),作为节点集的表示。这可以保证我们学到了一个节点集S的structural representation。

解释:

  • 我们不在之前为标注过的原始图A中去学习节点表示,而是在通过labeling trick标注过的A(S)中去学习节点表示。

  • 然后我们将学到的节点表示聚合起来,得到的就是节点集的聚合表示,可以帮助我们解决一切节点集上的任务。

但是,如果我们在原始图A上学习节点表示得到的并不是节点集的结构表示,那么为什么我们在标注过的图上进行节点表示的聚合就可以得到节点集的结构表示呢?

How to implement labeling trick?

如何实现这种标注技巧

The SEAL Framework

比如(A,B)和(C,D)是一组training links,首先取一个local 子图对其进行距离标注。然后将标注后的子图feed给一个图神经网络,去训练一个链路的分类器。

Experiments

比较了Labeling TrickPlain GAN(简单直接把两个节点链路表示聚合成链路表示)之间的关系,我们可以看出Labeling Trick在链路预测上体现出了极佳的性能,而且强于启发式方法。

Takeaway

  • 如果直接聚合两个节点的表示,通常会得到一个不太好的链路表示

  • 总结得出了Labeling Trick,即对图中所有节点进行标注,让target nodes得以与其他节点区分出来

  • 在标注过后的图中聚合GNN学到的节点表示可以得到一个非常expressive的链路表示

  • SEAL就是实际使用了Labeling Trick来进行链路预测

  • 加上Labeling Trick之后,GNN可以获得 state-of-the-art的链路预测性能

  • 加上Labeling Trick之后,我们不必再去关注GNN的链路表示性能;保证我们只去关注如何提升节点的表示,因为Labeling Trick可以由好的节点表示自动转化成为好的链路表示

Recent work:将Labeling Trick用在子图的表示学习任务上

  • 在大图中,我们去学习其中一些小的子图的表示

  • 应用:预测PPI网络中多种蛋白质的集体功能,预测分子中的活性位点等。

  • 子图的表示任务:需要考虑边缘节点和内部节点的不同;子图在大图中所处的相对位置;子图的结构本身以及其他的许多特性

  • 创造了6个channel,每个channel都进行独立的message passing

  • 使用了一些较为heuristic的子图相似度度量

  • 结果是一个极度复杂的模型

GLASS: GNN with Labeling Tricks for Subgraph Representation Learning

  • GNN + zero-one labeling trick

  • 证明能够覆盖到所有的SubGNN channel

Experiments

可以看出我们提出的GLASS模型相比SubGNN等模型具有更好的表现。

总结:想要用GNN学习多节点表示的时候,labeling trick可以保证GNN获得更好的节点集表示能力。

论文链接:

https://proceedings.neurips.cc/paper/2021/file/4be49c79f233b4f4070794825c323733-Paper.pdf

论文题目:

Labeling Trick: A Theory of Using Graph Neural Networks for Multi-Node Representation Learning

点击“阅读原文”,即可观看本场回放

整理:林   则

审核:张牧涵

往期精彩文章推荐

记得关注我们呀!每天都有新知识!

关于AI TIME

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了600多位海内外讲者,举办了逾300场活动,超150万人次观看。

我知道你

在看

~

点击 阅读原文 查看回放!

干货!Labeling Trick: 一个图神经网络多节点表示学习理论相关推荐

  1. 图神经网络基础--基于图神经网络的节点表征学习

    图神经网络基础–基于图神经网络的节点表征学习 引言 在图节点预测或边预测任务中,首先需要生成节点表征(Node Representation).我们使用图神经网络来生成节点表征,并通过基于监督学习的对 ...

  2. 基于图神经网络的节点表征

    我们使用图神经网络来生成节点表征,并通过基于监督学习的对图神经网络的训练,使得图神经网络学会产生高质量的节点表征.高质量的节点表征能够用于衡量节点的相似性,同时高质量的节点表征也是准确分类节点的前提. ...

  3. 使用PyG进行图神经网络的节点分类、链路预测和异常检测

    图神经网络(Graph Neural Networks)是一种针对图结构数据(如社交图.网络安全网络或分子表示)设计的机器学习算法.它在过去几年里发展迅速,被用于许多不同的应用程序.在这篇文章中我们将 ...

  4. 图神经网络/GNN(三)-基于图神经网络的节点表征学习

    Task3概览: 在图任务当中,首要任务就是要生成节点特征,同时高质量的节点表征也是用于下游机器学习任务的前提所在.本次任务通过GNN来生成节点表征,并通过基于监督学习对GNN的训练,使得GNN学会产 ...

  5. 基于图神经网络的节点表征学习

    我们使用图神经网络来生成节点表征,并通过基于监督学习的对图神经网络的训练,使得图神经网络学会产生高质量的节点表征.高质量的节点表征能够用于衡量节点的相似性,同时高质量的节点表征也是准确分类节点的前提. ...

  6. 百度图神经网络——论文节点比赛baseline代码注解

    文章目录 一.项目介绍 二.BaseLine内容注解 1.Config部分注解 2. 数据读取与处理部分 2.1 边数据的加载与处理 2.2 数据的完整加载与处理 2.3 数据读取与分割 3. 模型加 ...

  7. 图神经网络GNN(三):基于图神经网络的节点表征学习

    1. 写在前面 这个系列整理的关于GNN的相关基础知识, 图深度学习是一个新兴的研究领域,将深度学习与图数据连接了起来,推动现实中图预测应用的发展. 之前一直想接触这一块内容,但总找不到能入门的好方法 ...

  8. MILA研究院唐建:基于图神经网络的关系推理(附视频)

    2020 北京智源大会 本文属于2020北京智源大会嘉宾演讲的整理报道系列.北京智源大会是北京智源人工智能研究院主办的年度国际性人工智能高端学术交流活动,以国际性.权威性.专业性和前瞻性的" ...

  9. 图神经网络的解释性综述!

    ↑↑↑关注后"星标"Datawhale每日干货 & 每月组队学习,不错过Datawhale干货 来源:纪厚业,北京邮电大学,图与推荐 编辑:数据派THU本文约1.5w字,干 ...

最新文章

  1. ThoughtWorks微服务架构交流心得
  2. JQuery 总结(7) index() data() each() 选项卡 表单验证
  3. 模型与logit_基础方法 | 如何用Logit回归模型写论文?
  4. 2021第一季度云智能生态技术服务能力盘点
  5. SpringAMQP--WorkQueue模型
  6. Armijo-Goldstein和wolfe-power的matlab代码实现(转)
  7. ScrollView嵌套EditText联带滑动的解决办法
  8. ASP.NET中防止刷新页面造成表单重复提交
  9. swc反编译工具_Flash反编译工具下载_Flash反编译工具(JPEXS Free Flash Decompiler)v11.3中文版-这家软件站...
  10. informix的安装步骤
  11. Linux系统添加用户、管理员权限
  12. centos上使用Dropbox
  13. 华为s5700交换机忘记console的密码,怎么恢复
  14. 示波器X-Y模式分析
  15. OKHTTP系列(九)---http请求头(header)作用
  16. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
  17. 用一个小故事模拟Spring-Aop(三)--Advice适配器
  18. 模糊查询like 如何查找 包含% 或者_的行
  19. 约数的和及约数的个数
  20. 10位管理学大师及其核心重要思想

热门文章

  1. Scala中TypeTags和Manifests的用法
  2. 如何用python画爱心型线_如何用python画爱心
  3. 大厂经典面试系列之三:唯品会大数据开发面试【建议关注收藏订阅,你早晚会用上】掌握了这些面试题,余生不在怕面试
  4. 失落世界服务器国庆宝箱位置,失落的斯菲尔 图文攻略 全剧情任务流程全宝箱收集...
  5. 手工皮具的大坑之路-封边感悟与工具
  6. 从产业互联网的角度,解读360智慧商业发布“春雨计划”
  7. 怎么在线把pdf文件合并
  8. 基于Kotlin实现学生信息管理系统【100010063】
  9. 微信企业号的消息发送
  10. 用PS把真人照片转素描手绘效果