联邦学习论文阅读笔记
目录
- 一、前缀基础知识
- 二、论文笔记
- A Theoretical Perspective on DP Federated MTL - preprint'20
- Federated Multi-Task Learning - NIPS'17
- FLTrust _ Byzantine-robust Federated Learning via Trust Bootstrapping - NDSS'21
- Provably Secure Federated Learning - NIPSw'20
- RSA _ Byzantine-robust stochastic aggregation methods for distributed learning from heterogeneous datasets - AAAI'19
- 三、总结
一、前缀基础知识
- FL的两大挑战:高通信开销和严重的安全风险
- 联邦学习——在不共享数据的情况下联合训练机器学习模型。可以通过交换梯度/模型参数将数据保持在客户上进行协作训练。
联邦学习在每次迭代中,执行三个步骤:
1)服务器将当前全局模型发送给客户端;
2)客户端根据全局模型及其本地训练数据更新其本地模型,并将模型更新发送给服务器;
3)服务器聚合模型更新并使用它们更新全局模型。
然后使用所学的全局模型来预测测试示例的标签。 - 联邦平均化——平均来自本地客户的梯度
- MTL是在联邦环境中处理统计挑战的自然选择
- Non-IID——非独立同分布、SGD——随机梯度下降
- 在联合学习应用程序中,许多设备可能非常不可靠,甚至很容易被黑客破坏。 我们称这些设备为Byzantine workers。
- Byzantine-robust的联邦学习旨在使服务提供者能够学习一个准确的全局模型时,有限数量的客户端是恶意的。
- 现有的Byzantine-robust federated methods的关键思想是,服务提供商在客户端的本地模型更新之间进行统计分析,移除可疑的模型,然后将它们聚合以更新全局模型。
二、论文笔记
A Theoretical Perspective on DP Federated MTL - preprint’20
提出了一种差分隐私联邦多任务学习方法,用于具有差分隐私的有效参数传输,以保护客户端级别的梯度。具体来说,网络的下层在所有客户端之间共享,以捕获可转移的特征表示,而网络的顶层则是特定于客户端个性化的任务。算法自然地解决了联邦网络中的统计异质性问题。此外,作者团队建议在客户端加入不同的隐私权,以保护在FL通信过程中的梯度信息。证明了局部Lipschitz光滑目标函数在全局非凸性、凸性和强凸性下的收敛性,为联邦算法提供隐私和收敛保护。
Federated Multi-Task Learning - NIPS’17
针对分布式多任务学习的高通信成本、分层和容错问题,作者提出了一个系统感知优化方法MOCHA,来解决一个一般的MTL问题。该方法推广了分布式优化方法的核心算法,以解决与网络大小和节点异质性相关的系统挑战。MOCHA方法是收敛的。
联邦多任务学习:提出了数据上的挑战与系统上的挑战,这两种概念。不同于之前的联邦学习工作,这篇文章考虑了针对每一个存放数据的结点都训练了一个模型,这样来解决数据挑战问题。
FLTrust _ Byzantine-robust Federated Learning via Trust Bootstrapping - NDSS’21
在论文中,作者提出了FLTrust来为联邦学习提供信任。
服务器本身为学习任务收集一个干净的小型训练数据集(根数据集),然后根据它维护服务器模型以引导信任。
在每次迭代中,服务器为客户端的每个本地模型分配一个信任分数,如果本地模型更新的方向偏离服务器模型更新的方向,则具有较低的信任分数。把模型更新看做一个向量,它的特征是它的方向和大小。服务器将本地模型更新的大小标准化,限制具有较大规模的恶意局部模型更新的影响,使它们与向量空间中的服务器模型更新位于向量空间的相同超球体中。最后,服务器计算按信任分数加权的标准化局部模型更新的平均值,用于更新全局模型。
Provably Secure Federated Learning - NIPSw’20
提出了一个算法,算法学习多个全局模型,每个模型都是使用随机选择的客户端子集学习的。作者团队表示他们集成全局模型预测的测试示例的标签不受有限数量的恶意客户端的影响。
理论结果一:当恶意客户端的数目不超过阈值时,作者团队聚集的全局模型能够预测测试样本x的标签,标签结果与无恶意客户端时相同。这被称为certified security level(认证安全级别)。
理论结果二:作者团队证明了他们提出的certified security level是紧密(tight)的,即当没有对基本联邦学习进行任何假设时,就不可能得到比他们更大的认证安全级别。
RSA _ Byzantine-robust stochastic aggregation methods for distributed learning from heterogeneous datasets - AAAI’19
本文研究了在一般的Byzantine failure model下的分布式机器学习,其中Byzantine workers可以任意修改从自己传输到主人的信息。目标是开发高效的分布式机器学习方法,并提供可证明的性能保证。
作者团队提出了Non-IID的Byzantine-Robust Stochastic Aggregation(鲁棒的拜占庭随机集合)方法,简称RSA,用于在未知数量的Byzantine workers存在下从异构数据集进行分布式学习。提出的方法的关键是一个包含了目标函数的正则化项,它可以破坏学习任务,并减轻拜占庭攻击的负面影响。
i)RSA 收敛到一个接近最优解,学习误差取决于拜占庭工人的数量;
ii)拜占庭攻击下 RSA 的收敛速度与不受拜占庭攻击的随机梯度下降法相同。
三、总结
Byzantine-robust的主要思想是减轻异常值在客户端模型更新中的影响。研究表明,恶意客户端可以通过仔细篡改发送给客户端的模型更新(向量)来大大降低Byzantine-robust方法学习的全局模型的测试精度。
FL目前的挑战是高通信开销和严重的安全风险,高通信开销与模型的复杂度有关,安全风险指信息泄露,要点在于防御。
联邦学习论文阅读笔记相关推荐
- 联邦学习论文阅读三:ChainFL
联邦学习论文阅读三:ChainFL Secure and Efficient Federated Learning Through Layering and Sharding Blockchain 论 ...
- 联邦学习论文阅读一:经典FedAvg
联邦学习论文阅读一:经典FedAvg Communication-Efficient Learning of Deep Networksfrom Decentralized Data 论文地址:htt ...
- 【联邦学习论文阅读】FedProx(2018)Federated Optimization in Heterogeneous Networks
[FedProx]论文链接:https://arxiv.org/abs/1812.06127 摘要 联邦学习面临两个关键挑战:系统异构性:统计异构性.本文的FedProx可以解决联邦学习的异构性,可看 ...
- 联邦学习论文阅读:Variational Federated Multi-Task Learning
这篇文章是探索联邦学习的框架下的多任务学习,稍后会整理一下之前的那篇multi task learning to be continued
- 联邦学习-论文阅读-Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Comb
Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Combining Repu ...
- 联邦学习-论文阅读-NDSS-FLTrust: Byzantine-robust Federated Learning via Trust Bootstrapping
1.FLTrust: Byzantine-robust Federated Learning via Trust Bootstrapping 1.概要 拜占庭式的鲁棒联邦学习方法中没有信任的根(即不知 ...
- 强化学习论文阅读笔记(一)——强化学习研究综述_高阳
强化学习研究综述_高阳 目录 强化学习研究综述_高阳 一.与其他机器学习对比 二.分类 三.最优搜索型强化学习算法 四.经验强化型强化学习算法 五.部分感知 六.函数估计 七.多Agent强化学习 八 ...
- [论文阅读笔记52]深度学习实体关系抽取研究综述
来源:软件学报 2019 1.摘要: 围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系 抽取研究进展,并对未来可能的研究方向进行了探讨和展望. 2.经典的实体关系抽取方法 ...
- 论文阅读笔记(9):加权稀疏子空间表示——子空间聚类、约束聚类和主动学习的统一框架
论文阅读笔记(9):WEIGHTED SPARSE SUBSPACE REPRESENTATION--A UNIFIED FRAMEWORK FOR SUBSPACE CLUSTERING, CONS ...
最新文章
- plotly可视化表格数据:以表格可视化pandas dataframe
- 数据库安全性之使用命令来实现用户管理以及角色.十五
- Apache设置多网站
- BZOJ 2752: [HAOI2012]高速公路(road)
- JavaScript实现跳跃游戏的动态编程自上而下的方法算法(附完整源码)
- 搜索引擎优化不是网页标签优化
- JavaEE——Spring4--(9)Spring的事务管理(注解方式)
- python中ntlk报错及解决
- 【leetcode】Remove Duplicates from Sorted Array
- JavaScript监听手机物理返回键的两种解决方法
- 应用公园制作app靠谱吗_简单靠谱的app制作工具平台,简直是不可多得啊
- PrintShield打印监控系统
- 如何设立清晰的可衡量的目标(SMART原则)
- ffmpeg安装之mac安装
- JS 0.1+0.2的理解
- LINUX基础知识笔记全
- 如何卸载360安全客户端
- 网站app被劫持怎么办?HTTPDNS阿里云域名防劫持, DNSPod 移动解析服务 D+
- 使用MySQLDUMP进行数据库逻辑备份与恢复
- 功能点算法及在软件测试中的应用
热门文章
- 计算机核心期刊(北大核心)投稿意见
- md格式 linux,Linux命令基本格式以及文件处理命令.md
- pyinstaller说明(windows、mac、linux)
- 手机铃声和图片的详细设计说明
- uni-app:uni-icons的使用及如何自定义图标
- 微信退款服务器系统失败怎么办,微信缴费失败怎么退款?能退回吗?
- PHP+python+nodejs+ springboot+vue 社区互助平台
- oracle表数据导出成unl文件,oracle的文本导入、导出技巧
- 电源适配器的主要质量指标
- php微信公众号开发图片预览,微信公众号点亮图片怎么做