目录

一、图联邦学习介绍

二、图间联邦学习(inter-graph FL)

三、图内联邦学习(Intra-graph FL)

四、图结构联邦学习(Graph-structured FL)

五、图联邦学习的挑战


一、图联邦学习介绍

大多数图学习模型如图神经网络(Graph Neural Networks,GNNs)都是基于大量的图数据进行训练的,然而在许多现实场景中,例如医疗保健系统中的住院预测,图数据通常存储在多个数据所有者处,由于涉及患者的隐私和相关法律法规限制,不同数据所有者的数据不能直接共享。

联邦学习(Federated Learning, FL)是一种分布式学习方案,通过多个参与方(即客户端)协作训练一个模型而无需共享他们的隐私数据,以解决数据隔离问题。图联邦学习(Federated Graph Learning,FGL)是联邦学习在图数据上的应用,通过以联邦方式训练图神经网络,来解决图数据隐私保护的问题。

图联邦学习的分类:

按照图数据在客户端之间的分布方式,将图联邦学习划分为图间联邦学习(inter-graph FL)、图内联邦学习(intra-graph FL)、图结构联邦学习(graph-structured FL)。

图联邦学习的分类

二、图间联邦学习(inter-graph FL)

图间联邦学习是图联邦学习最常见的学习方式,其中每个客户端样本都是图数据,全局模型执行图级任务。 图间联邦学习最典型的应用是在生物化学行业,研究人员使用图神经网络来研究分子的图结构。一个分子可以表示为一个图,其中节点表示原子,边表示化学键。在药物特性研究中,每个制药公司都拥有一个机密数据集,其中包含多个分子结构(即特征)和相应的性质(即标签)。在过去,由于商业竞争的阻碍,各公司之间无法共享数据,但在图间联邦学习框架下能够实现数据的共享。在这种情况下,,则图神经网络的全局模型为:

其中,分别表示第个客户端的数据集中第个图的特征和邻接矩阵,表示输出。

应用FedAvg后,目标函数为:

其中,为本地目标函数,L为全局损失函数。表示 第个客户端的数据集中所有节点的数量。

图间联邦学习

三、图内联邦学习(Intra-graph FL)

在图内联邦学习中,每个客户端拥有整张图的一部分数据(即子图),与联邦学习类似地,图内联邦学习可以分为横向图联邦学习和纵向图联邦学习。

1、横向图联邦学习

在横向图联邦学习中,每个客户端中持有的子图数据可以看作是从潜在的整张图中水平划分出来的(各子图之间的连接丢失了,严格来说可以有重叠),即。水平分布的子图具有相同的属性,客户端共享相同的特征和标签空间,但节点ID不同。例如:一个省内,不同城市的多家银行拥有大不相同的客户群体,银行构建有行内客户的关联关系网络,而对于任意两家银行的客户关系网络而言可能存在一些用户的潜在关联。 因此,所有银行的客户关系网络汇总起来可以构成整个省内银行客户关系网络 。持有不同客户关系数据的多家银行可以在横向图联邦学习框架下共享数据,以进行各自的反欺诈、反洗钱、关联风险预警等业务。

在这种情况下,,则图神经网络的全局模型为:

其中,分别表示第个客户端数据集的特征和邻接矩阵,表示输出。

应用FedAvg后,目标函数为:

横向图联邦学习

2、纵向图联邦学习

子图的垂直分布是指它们是平行的,并且彼此之间有很大的重叠,可以看作是从潜在的整张图中纵向划分出来的,即。在这种情况下,客户端具有大部分相同的节点ID,特征和标签大不相同。例如,对于同一地区中不同行业的多家公司,可能具有大部分相同的客户群体,而特征和标签不同。

在这种情况下,表示节点的集合,表示的大小。而图神经网络的全局模型不是唯一的(取决于多少客户端有标签),这表明纵向图联邦学习支持多任务学习。纵向图联邦学习的目的是通过在隐私保护的前提下结合并共享,进行图神经网络的学习。不考虑实体匹配和数据共享的方法,目标函数可以表示为:

纵向图联邦学习

四、图结构联邦学习(Graph-structured FL)

除了数据之外,各个客户端之间的关系也能用于图神经网络的学习。图结构联邦考虑了不同客户端之间的拓扑结构,即基于客户端的拓扑关系来使用图神经网络来聚合本地模型。典型的应用场景如联邦交通流预测,每个客户端是一台监控设备,其可能持有欧式数据或图数据,而监控设备分布在不同的地理位置,图神经网络用于捕获设备之间的空间依赖关系。,即客户端(k)⇒vk。图结构联邦学习是指服务器使用GNN根据客户端拓扑聚合本地模型的情况。

图结构联邦学习

五、图联邦学习技术及数据集总结

图联邦学习技术总结

上图中,“FL with Structured Data”包括图间联邦学习和图内联邦学习的情况,“Structured FL”表示上文中的图结构联邦学习。

图联邦学习数据集总结

六、图联邦学习的挑战

图联邦学习是近两年兴起的技术,其中存在许多挑战,多为传统联邦学习的遗留问题,如非独立同分布数据(Non-IID data)、通信效率(communication efficiency)、鲁棒性(robustness)。此外,还存在图联邦学习所特有的问题,如横向图内联邦学习的孤立图问题(Isolated graph in horizontal intra-graph FL)、纵向图内联邦学习的实体匹配和安全数据共享问题(Entities matching and secure data sharing in vertical intra-graph FL)、图内联邦学习缺乏数据集(Dataset of intra-graph FL)等。

1、非独立同分布的图结构

无论哪种类型的图联邦学习,非独立同分布问题都不可避免。与联邦学习一样,它既影响收敛速度,又影响收敛精度,目前还没有方法可以彻底解决此问题。除了特征和标签之外,图数据还具有边(结构)信息,这表明图结构的非独立同分布也可能影响学习过程。图结构的性质包括度分布、平均路径长度、平均聚类系数等。研究这些性质的非独立同分布可能是解决图域非独立同分布问题的一个重要方向。

2、横向图内联邦学习的孤立图

图模型上的表示学习依赖于遍历或多阶邻域间的消息传递。然而,在横向图内联邦学习中,不同的客户端持有潜在整张图的一部分数据,本地子图的直径一般很小。这将影响图神经网络的准确性,因为本地子图不能提供来自高阶邻居的信息。一个极端的情况是,若本地子图只包含一个节点,图卷积网络GCN将退化为多层感知机MLP。因此在横向图内联邦学习中,发现客户端本地子图中的潜在边是一个至关重要的挑战。

3、纵向图内联邦学习的实体匹配与安全数据共享

实体匹配(隐私集合求交PSI)和安全数据共享是纵向联邦和纵向图内联邦学习的关键问题。纵向图内联邦学习的主要难点还在于在隐私保护的前提下尽可能地提升精度和通信效率。有相关研究提出了一种联邦框架,通过在服务器中保存的匹配表进行知识图谱嵌入,这在一定程度上违反了隐私保护原则。

4、图内联邦学习缺乏数据集

图像和语料库数据集的丰富性是计算机视觉和自然语言处理快速发展的必要条件,然而适合图内联邦学习的公开图数据集目前还很少。对于欧式数据,可以很容易地通过实验模拟数据分布,例如将样本集合划分为,将特征集划分为,这很容易实现,不需要考虑额外的因素。但涉及到图形数据时,由于图中存在着结构,很难模拟数据分布。例如,在横向图联邦学习中,需要将一整张图分割成多个子图以模拟多个客户端的数据,但是有一些边被破坏,并且子图分布也不符合实际情况。在纵向图联邦学习也一样困难,虽然可以将特征划分为几部分,但需要考虑所有部分是否具有相同的结构。在现实场景中,结合相关业务规则,这还要复杂得多。因此,数据集的缺乏限制了图内联邦学习的发展。

5、通信和内存消耗

在实际应用图联邦学习算法时,通信和内存消耗是一个关键瓶颈。例如,对于联邦推荐系统,服务器和客户端之间传输的模型可能很大,其中用户和商品隐藏层占据了大部分模型参数,并且隐藏层参数的大小随着用户和商品节点的规模不断增加而线性增长,会造成通信和内存的大量消耗。对于这一问题,模型量化、剪枝、蒸馏是模型压缩的有效方法。

参考文献:

1、(2021)Zhang H, Shen T, Wu F, et al. Federated graph learning--a position paper[J]. arXiv preprint arXiv:2105.11099, 2021.

2、(2022)Fu X, Zhang B, Dong Y, et al. Federated graph machine learning: A survey of concepts, techniques, and applications[J]. ACM SIGKDD Explorations Newsletter, 2022, 24(2): 32-47.

图联邦学习(Federated Graph Learning)相关推荐

  1. 【论文导读】- Cluster-driven Graph Federated Learning over Multiple Domains(聚类驱动的图联邦学习)

    文章目录 论文信息 摘要 主要贡献 聚类驱动的图联邦学习 问题定义 联邦聚类 聚类模型 聚类模型的联系 FedCG框架 论文信息 Cluster-driven Graph Federated Lear ...

  2. 初识联邦学习(Federated learning)

      联邦学习(Federated learning)最早在2016由谷歌提出,并在之后受到大量的关注.本文旨在简要介绍联邦学习,了解联邦学习的背景,而不关注联邦学习具体的实现方案.希望能解释通如下几个 ...

  3. AI之FL:联邦学习(Federated Learning)的简介、入门、应用之详细攻略

    AI之FL:联邦学习(Federated Learning)的简介.入门.应用之详细攻略 导读       2019 年2 月,微众银行 AI 团队自主研发的全球首个工业级联邦学习框架 FATE(Fe ...

  4. 【论文笔记】FedGraph:Federated Graph Learning with Intelligent Sampling

    文章目录 概览: 基础信息 分支领域 论文作者 Publishment 正文内容 摘要 知识背景 联邦学习 图卷积网络GCN 图采样 FedGraph设计 FedGraph的架构 智能图采用算法 背景 ...

  5. 论文笔记:联邦学习——Federated Learning: Strategies for Improving Communication Efficiency

    Federated Learning: Strategies for Improving Communication Efficiency 文章目录 Federated Learning: Strat ...

  6. 详解联邦学习Federated Learning

    今天我们来讲下最近比较博眼球的联邦学习.应该很多人听过但是始终都没懂啥是联邦学习?百度一下发现大篇文章都说可以用来解决数据孤岛,那它又是如何来解决数据孤岛问题的?对于联邦学习,大部分文章还都处于其学术 ...

  7. 联邦学习 Federated Learning 相关资料整理

    代码 微众银行+杨强教授团队的联邦学习FATE框架代码:https://github.com/WeBankFinTech/FATE 谷歌联邦迁移学习TensorFlow Federated (TFF) ...

  8. 论文笔记:联邦学习——Federated Learning: Challenges, Methods, and Future Directions

    Federated Learning: Challenges, Methods, and Future Directions 论文链接: link Federated Learning: Challe ...

  9. 图对比学习入门 Contrastive Learning on Graph

    对比学习作为近两年的深度学习界的一大宠儿,受到了广大研究人员的青睐.而图学习因为图可以用于描述生活中广泛出现的非欧式数据,具有广大的应用前景.当图学习遇上了对比学习- 本文从对比学习入手,再介绍图对比 ...

最新文章

  1. 索引系列八--索引特性之有序难优化union
  2. 专栏 | 基于 Jupyter 的特征工程手册:特征选择(四)
  3. 用Windows Server Backup备份DC服务器
  4. 编程题: 将一个矩阵(二维数组)顺时针旋转90度
  5. Linux系统下.ko文件是什么文件?.so文件是什么文件?
  6. CentOS以及Oracle数据库发展历史及各版本新功能介绍, 便于构造环境时有个对应关系...
  7. python读取字典元素笔记_Python 学习笔记 - 字典
  8. 接口返回[object,Object]解决方法
  9. 在Crystal Report 8中调用Oracle的procedure储存过程,并取得返回的类型为Sys_Refcursor数据表...
  10. 【Python】 html解析BeautifulSoup
  11. 【图像修复】基于matlab GUI运动模糊消除(逆滤波)【含Matlab源码 847期】
  12. JZOJ7月18日提高组T3 Ocd
  13. matlab多元正态性检验,Matlab正态分布性检验
  14. tkinter运行时出现无响应问题
  15. lempel ziv matlab,1.9 Lempel-Ziv算法
  16. SpaceVim - 让你的vim变得更加高效和强大
  17. tlc5620输出三角波流程图_基于TLC5620的数模转换器设计
  18. 石家庄阿福卡4G问题
  19. 2023年中南财经政法大学西方经济学考研上岸前辈初复试备考经验
  20. 有关python的比赛_用 Python 写一个 Kaggle 比赛排行榜的爬虫

热门文章

  1. 计算机网络帧中继是什么,计算机网络实用技术知识点之帧中继的应用
  2. 马云:预测2014——可怕
  3. 【题解】CSP-J集体测试1
  4. insert sql语句_SQL Insert语句概述
  5. 凌度A958 行车记录仪 root 破解
  6. 重磅!英语四六级考试报名来袭!考试时间及报名照片材料!别再用最丑的丑照了!
  7. 华为核心交换机配置子网互联地址
  8. 零和博弈(抽牌游戏)
  9. 图形图表设计软件Edraw Max更新至v9.0,新增10000+符号和模板
  10. 出现涨价拐点,2022年新能源汽车向左or向右?