关注公众号,发现CV技术之美

Personalized Federated Learning with Theoretical Guarantees: A Model-Agnostic Meta-Learning Approach

论文链接:https://proceedings.neurips.cc/paper/2020/file/24389bfe4fe2eba8bf9aa9203a44cdad-Paper.pdf

 介绍与引言

传统联邦学习弊端:只为所有用户开发一个公共模型,因此,它不会将模型适应于每个用户,这是一个重要的缺失特性,特别是当考虑到不同用户的底层数据分布的异质性。

在本文中,作者研究了联邦学习的个性化变体,其中我们的目标是找到一个初始共享模型,基于初始模型,当前或新用户通过对自己的数据执行一步或几步梯度下降,可以很容易地适应他们的本地数据集。这种方法保留了联邦学习体系结构的所有好处,并通过结构为每个用户提供了更个性化的模型。

传统联邦学习设置如下图1所示,传统的联邦学习设置是由中央服务器汇聚所有客户端模型的参数进行平均聚合获取全局模型。但是,该方案为所有用户开发了一个全局的公共模型,因此它并不适合每个用户,因为每个用户拥有其自身的特性(异构性)。

图1:传统FL设置

作者通过考虑一个包含个性化的联邦学习模型的修正损失函数来克服这个问题,作者基于元学习MAML的思想出发去做联邦学习个性化,主要是以下两点:

1)目标是找到所有用户之间共享的初始点,在每个用户更新自己的损失函数后表现良好,可能是通过执行基于梯度的方法的一些步骤。

2)虽然初始模型是以所有用户的分布式方式派生的,但是每个用户基于自身数据实现的最终模型不同于其他模型。

作者研究了FedAvg算法的一个个性化变体,称为Per-FedAvg,旨在解决所提出的个性化FL问题。特别地,我们描述了不同用户的数据异质性和数据分布的紧密性,通过分布距离测量,如Total Variation或1-Wasserstein,对Per-FedAvg收敛的作用。

 相关工作

在这项工作中,作者更关注MAML方法对FL设置的收敛,这更具有挑战性,因为节点在发送更新到服务器之前执行多个本地更新,这在以前的元学习理论工作中没有考虑到。

然而,我们的主要重点是关于这个公式的理论评估,其中我们描述了Per-FedAvg的收敛性,以及该算法的参数对其性能的作用。

使用元学习和多任务学习来实现个性化并不限于MAML框架,还考虑了一个训练单个全局模型和局部模型的框架,为每个用户提供个性化的解决方案;以及另一论文作者提出了一种自适应联邦学习算法,该算法学习局部和全局模型的混合作为个性化模型。

 通过模型不可知论的元学习进行个性化联邦学习

如果我们假设每个用户都接受初始点,并使用关于它自己的损失函数的一个梯度下降的步骤来更新它:

这个公式的优点是,它不仅允许我们保持FL的优势,而且它捕获用户之间的区别。

作者提出了个性化的FedAvg(Per-FedAvg)方法来解决问题(3),即如何来寻找问题(3)的最优解。针对(3)中每个Fw可知:

那么我们针对每个Fw进行求导,由于fw求导耗时,所以考虑无偏估计替代:

类似MAML进行模型初始化,然后根据自身数据再训练一次或若干次,如下图公式所示,这样我们就可以得到个性化的客户端模型:

总结一下:作者通过使用无偏估计代替原始参数求导,大大减轻模型开销,同时作者借鉴MAML思想,将服务器发送给客户端的模型进行初始化,然后客户端根据自身私有数据再进行若干次训练,从而达到联邦个性化元学习的效果。个人感觉有点类似于:模型初始参数迁移 + 微调。

 理论结果

作者关注非凸设置,并描述了服务器和用户之间的整体通信回合,以找到一个近似的一阶平稳点。

关于Per-FedAvg算法描述如下图2所示:

图2:Per-FedAvg伪代码

作者考虑两种手段代替2阶偏导(FO and HF):

1 )FO( First-Order MAML):直接考虑使用一阶偏导代替二阶导;

2 )HF( Hessian-vector MAML):考虑使用一阶偏导的差(二阶导的定义)代替二阶偏导。

接下来作者通过实验进行论证:

通过实验我们可以得知,使用Hessian-vector黑森矩阵来代替二阶偏导的效果优于直接考虑使用一阶偏导代替二阶导,说明作者方法的有效性。

 总结

作者考虑联邦学习(FL)问题在异构情况下,并研究个性化的经典的FL公式,其目标是找到一个适当的初始化模型,可以快速适应本地数据后的每个用户的训练阶段

作者提供了一组数值实验,说明了两种不同的一阶近似的性能(FO and HF)及其与FedAvg方法的比较,可以知道综合来看Per-FedAvg(HF)优于FedAvg。同时也间接证明了作者所提模型不可知论的元学习进行个性化联邦学习方法的有效性。核心就是作者通过MAML的启发来作为模型初始化参数再利用微调适应本地私有数据,从而提升模型性能与效率。

参考链接

Fallah, Alireza, Aryan Mokhtari, and Asuman Ozdaglar. "Personalized federated learning with theoretical guarantees: A model-agnostic meta-learning approach." Advances in Neural Information Processing Systems 33 (2020): 3557-3568.

END

欢迎加入「元学习交流群

Per-FedAvg:联邦个性化元学习相关推荐

  1. 今日 Paper | 虚拟试穿网络;人群计数基准;联邦元学习;目标检测等

    2020-01-15 05:41:40 为了帮助各位学术青年更好地学习前沿研究成果和技术,AI科技评论联合Paper 研习社(paper.yanxishe.com),推出[今日 Paper]栏目, 每 ...

  2. 【阅读笔记】联邦学习实战——联邦个性化推荐案例

    联邦学习实战--联邦个性化推荐案例 前言 1. 引言 2. 传统的集中式个性化推荐 2.1 矩阵分解 2.2 因子分解机 3. 联邦矩阵分解 3.1 算法详解 3.2 详细实现 4 联邦因子分解机 4 ...

  3. 多模态学习、迁移学习、元学习、联邦学习、表示学习、知识图谱、无监督学习、半监督学习、弱监督学习、自监督学习简介

    多模态学习 Multimodal Learning :文本.视觉.声音模态结合的学习 迁移学习 transfer learning:在某训练集上训练后的模型(预训练模型),相似训练集再进行训练后可以使 ...

  4. 【联邦元学习】论文解读:Federated Meta-Learning for Fraudulent Credit Card Detection

    论文:Zheng W, Yan L, Gou C, et al. Federated Meta-Learning for Fraudulent Credit Card Detection[C], Pr ...

  5. 机器学习贝叶斯学习心得_贝叶斯元学习就是您所需要的

    机器学习贝叶斯学习心得 Update: This post is part of a blog series on Meta-Learning that I'm working on. Check o ...

  6. 中大博士分析ICLR 2022投稿趋势:Transformer激增,ViT首进榜单前50,元学习大跌

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 深度学习 ...

  7. 直播 | WWW 2021论文解读:基于隐私保护的模型联邦个性化

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  8. 元学习兴起,卷积“落幕” | NeurIPS2020研究趋势总结

    AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...

  9. WSDM 2022最佳论文候选:港大提出多行为对比元学习的推荐系统

    ©PaperWeekly 原创 · 作者 | 韦玮 单位 | 香港大学 研究方向 | 推荐系统 论文标题: Contrastive Meta Learning with Behavior Multip ...

最新文章

  1. AD5272数字变阻器
  2. 初识Mongodb总结
  3. 懒加载--初步理解. by:王朋
  4. win10常见问题处理办法
  5. 摘抄自知乎的redis相关
  6. linux c语言 udp 接收和发送数据用同一个端口_网络编程基础入门及TCP,UDP
  7. 大数据上的“大产品”
  8. 【干货】史上最全个性化推荐技术资料包(附50余份技术文档下载链接)
  9. css制作tips提示框,气泡框,制作三角形
  10. 主板bios修改、刷新
  11. series 锐捷rgrsr20_锐捷路由器(RG-RSR20-04)清除密码的方法详解
  12. CS 1.6 服务器信息读取
  13. 二进制 转换 .java_如何在Java程序中将二进制转换为十进制?
  14. windows 网络监控_如何在Windows 10中监控网络使用情况
  15. 《动手学深度学习》(PyTorch版)代码注释 - 32 【RNN_with_zero】
  16. 矩阵求逆引理(Matrix Inversion Lemma)的意义
  17. JZOJ6362. 【NOIP2019模拟2019.9.18】数星星(star)
  18. 推荐模型之DeepFM与DIN
  19. 智慧城市的互联网云脑架构,7种城市神经反射弧的建设是重点
  20. java 浏览器 qq_Qq浏览器通用版移动QQ浏览器v2.1Java通用版下载

热门文章

  1. matlab计算曲线形心,并将y轴移动到形心上,使图形居中布置
  2. Opencv--学习Opencv比较好的网址
  3. 计算机视觉、机器学习相关领域论文和源代码大集合--持续更新……(转载)
  4. 药业计算机系统专项内审检查表,2017年最新医疗器械内审检查表 分部门 已填写...
  5. 如何制作一个塔防游戏 Cocos2d x 2 0 4
  6. UML学习笔记--导航
  7. android sdk no space,Android SDK folder taking a lot of disk space. Do
  8. 交叉编译docker_端侧推理引擎Tengine初识:安卓平台交叉编译并跑通MobileNetV1
  9. python深拷贝一个对象_Python中的深拷贝和浅拷贝以及存在的问题
  10. 组装电脑配置单报价_组装电脑配置单推荐,性价比高的游戏、画图和办公全能配置电脑!...