无线网络边缘“遇上”分布式机器学习讲座:Machine Learning at the Wireless Edge
Machine Learning at the Wireless Edge"
description: “概述无线网络边缘端的分布式学习的一些成果,包括两个主题:联邦学习和去中心化学习”
原博文:https://windy810.github.io/blog/2022-10-28-Machine_Learning_at_the-_Wireless_Edge/
URL: https://www.ee.bgu.ac.il/~haimp/VincentPoorMLCOM22.pdf
URL 2: 【【直播回放】IEEE TNSE杰出讲座系列(五) 2022年10月28日8点场】
引言(机器学习与无线网络的关联):
- 使用机器学习优化通信网络
- 在移动设备上学习
1. Motivation
1.1 机器学习最新现状
- 大量数据可用,计算能力提高
- 标准的机器学习是集中式的,可以访问所有数据
- 在云端使用软件工具运行模型,通过特殊硬件加速
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SbtVUWHT-1667306608763)(https://imgur.com/xCQo3Mx)]
1.2 无线边缘的机器学习
- 集中机器学习不适合一些新兴应用,如:自动驾驶、急救网络、医疗网络
- 这些场景特殊的原因:数据由边缘产生、有限容量上行链路 、低延迟和高可靠性、数据隐私/安全、可扩展性和局部性
以上原因促使了机器学习需要更接近网络边缘
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vHle7CbY-1667306608765)(https://imgur.com/2z4ZBoQ)]
1.3 网络化机器学习模型
- 标准机器学习:数据存储在云端;在云端进行训练;没有隐私
- 联邦机器学习:云与用户设备同时机器学习;只有部分数据存储在云端;促进隐私
- 去中心化机器学习:没有类似于云的基础设施;数据完全分布;协作智能;隐私
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-luzstP64-1667306608766)(https://imgur.com/NpXEPP8)]
2. 联邦学习
2.1 基本架构
【数据集】终端用户(UE)使用本地的原始数据→
【训练】终端用户使用共享模型进行训练→
【联邦计算】边缘节点(AP)从终端收集权重并更新共享模型→迭代至收敛
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uEk0CQRb-1667306608766)(https://imgur.com/aFewsqH)]
2.2 需要解决的问题
- 与边缘节点的交流只能通过无线信道
- 无线介质是共享的而且有限:每轮更新只能选取部分设备;因为干扰传输不可靠
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cQTlGjYk-1667306608766)(https://imgur.com/hPUU0zs)]
2.3 调度机制
- 随机调度
- 轮询:分组再依次选组
- 比例公平:选择最强信噪比的终端用户
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zsghaKnF-1667306608767)(https://imgur.com/65XiqPK)]
2.4 性能指标
- 更新的前提条件:
- 终端用户被调度器选择
- 接收的信噪比大于解码阈值
- 量化训练有效性的指标:达到解法精度所需要的沟通轮次
【注】ϵ\epsilonϵ-accurate solution:最大化一个强凸函数(原始解和对偶解是相同的),此时,只有两个解,原始解和对偶解,彼此在ϵ\epsilonϵ之内
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y8uvTzUW-1667306608767)(https://imgur.com/7RbB76r)]
【参数注解】ϵ\epsilonϵ是试图实现的二元差,θ\thetaθ是信噪比阈值,其他如图所示(具体细节可以暂时不注意)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UB23IUW4-1667306608768)(https://imgur.com/15GhQeO)]
联邦学习的收敛速度
【实验说明】
- 左图为解码阈值很大,意味着传输通道很差,所以需要高信噪比才能成功解码,此种情况比例公平的方法表现最好
- 右图解码阈值很小,说明传输通道很不错,较低的信噪比也能解码,此时轮询表现最好
原因说明:当信道很好的时候,意味着数据包都通过了,所以每个数据包等量地被使用是最合适的
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MfbJlcrz-1667306608768)(https://imgur.com/bfmGGcD)]
【结论】调度协议十分重要
在较优的频道中测试,以极低的信噪比,只比较随机调度和轮询,左边为损失,右图为精准度,基于MNIST手写数据集建立SVM模型
- 轮询在两方面表现都明显较好
- 如果交流回合够多,则两者差不多,次数较少的情况下,轮询收敛快很多
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8UqICE3o-1667306608769)(https://imgur.com/CSFru05)]
2.5 优化调度
- 设计想法:因为在类似于传感器网络中,数据的及时性和准确性同样重要,所以要确保诸如此类情况,终端设备的数据在一个合理的时间限制内上传
- 设计指标:信息时代/信息的年龄(AoI)
- 设计思路:每回交流,如果被选择,则将AoI降为0,否则,加1
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vCjYsCLv-1667306608770)(https://imgur.com/X5SmANb)]
- 最终算法:于是,据此设计一个使得平均信息年龄最小化的算法,称为无线轮询
【实验分析】如上类似的实验条件,比较无线轮询和最大包算法(每一轮发出尽可能最多的包)的表现,发现其明显优于该算法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Wk6Zj1ih-1667306608771)(https://imgur.com/Dw35124)]
2.6 联邦学习中的隐私保护
- 最初因为数据保留在终端上,认为其可以保护隐私
- 后来发现用户数据可以从模型参数中推断出来
- 所以用户数据的隐私是联邦学习的一个问题
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6Qem8PEm-1667306608771)(https://imgur.com/la90Qpa)]
所以提出了一些解决方案,类似于差分隐私,特征如下
- 分为两个数据集,一个有私人信息,一个没有私人信息,其他部分相同
- 不能通过统计查询(高概率)区分
- 有时候可以向数据添加噪声来实现差异隐私,但是会影响性能
- 需要在隐私和性能之间进行权衡
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-diSqXdww-1667306608772)(https://imgur.com/5lvYZKk)]
【实验说明】对MNIST数据集进行卷积神经网络拟合
- 紫色线为没有添加任何噪音
- ϵ\epsilonϵ参数越小,则差分隐私的隐私程度越大,其性能也就越差
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SrG7g4zC-1667306608773)(https://imgur.com/qYVxuuN)]
3. 去中心化学习
特性:模型在终端用户设备上构建,但是所有的模型共享和协作都是以点对点的方式进行的
3.1 基本模型
【图分析】一个二分图,一部分为训练样本,另一部分为学习体,图片表示了学习体可以访问的训练数据库。可以看出,并不是每个学习体都可以访问每个训练数据库
集中学习:学习体数量=1
去中心化学习:学习体数量=训练样本数
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PnQ98AY8-1667306608773)(https://imgur.com/v3zHoWC)]
但是本地的学习是局部不连贯的:
如果两个学习体可访问的训练数据库有重合部分,例如L1L_1L1和LmL_mLm都可以访问x1,y1x_1,y_1x1,y1,但是他们得到的f^1\hat{f}_1f^1和f^m\hat{f}_mf^m是不一样的,这就是局部不连贯
如果一个模型中有局部不连贯,那么其是次优的
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-f0yJbMB6-1667306608774)(https://imgur.com/fM4Bs5c)]
3.2 协同算法
所以为了解决上述问题,提出了一个协同算法
【算法阐述】在学习体1完成训练后,将其对目标的预估写回原数据库,再进入学习体2的训练,这样,学习体1的经验即可被转移到学习体2。依次迭代,反复这样做以后,结果则会连贯地收敛到全局解
【引申结论】分布式机器学习可以通过消除此类不一致来获得接近最优的算法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QQmcOLQZ-1667306608774)(https://imgur.com/9gkJQl6)]
【实验分析】有50个传感器构成的学习体和50个训练数据库,假设回归函数f是线性的,i和j称为邻居,其距离定义为r,代表连通性,r越大则二分图中的边越多,即每个学习体可以访问的数据库越多。使用线性内核进行内核学习,纵轴代表平均平方误差
- 图的最底部有一条直线,是集中学习的表现
- 较高的虚线为没有协同算法的,需要连通性很大的情况下才能达到集中学习的表现
- 较矮的虚线为有协同算法的,明显在合理的时间内和集中学习的表现一样好
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RHAf2cda-1667306608775)(https://imgur.com/9AEThHd)]
3.3 分布式强化学习
- 强化学习:用于解决马尔科夫决策问题,即用于寻找最优决策和控制策略
- Q-learning:特殊类型的强化学习,每次学习迭代中,都需要更新的Q-function;利用梯度下降等方法来收敛到最优
- 分布式强化学习:因为无法在本地计算梯度了,所以可以根据
- 本地邻居的数据来计算局部梯度
- 在邻居间寻找共识,达成一致
- 在连通性上收敛到全局最优
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BEpaDPWj-1667306608776)(https://imgur.com/aYpzOxc)]
【模拟】Q函数有四个值,将其随机扔到一个区域里,然后使用两个最近的邻居来连通,再来绘制图。左图为一个典型的agent,右图为十个agent
- 左图能达到集中,汇聚在一起了
- 右图显示,一开始他们变化很大,但是由于算法的一致性,最后他们会收敛到一起,达成共识
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-228pHlZx-1667306608776)(https://imgur.com/SXmqNTB)]
4. Conclusion
无线网络可以成为机器学习的平台
- 联邦学习:边缘设备与终端用户设备交互来学习常用模型
- 去中心化学习:终端用户设备与另一台设备交互来协作学习模型或动作
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TcrzAleN-1667306608777)(https://imgur.com/tzhE5tQ)]
【一些研究上的问题】
- 设备限制
- 通信效率
- 边缘数据有限
- 安全和隐私
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z2VSBgjy-1667306608777)(https://imgur.com/xwu3GLq)]
【相关论文】
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XgSVw0lr-1667306608778)(https://imgur.com/QNgl4ym)]
5. 提问与回答
除了可能影响性能的差分隐私,如何解决联邦学习中的隐私问题?
A:①使用某种同态加密可以实现在不解密的情况下进行聚合(对聚合器进行保密)②使用区块链分布式账本,由终端用户自行进行聚合。主要取决于想对谁进行保密,防范谁。
两个运行在不同服务器的不同的联邦学习应用有个公共池/重叠池?
A:聚合器要做的工作是区分不同的子集,为其提供相应的平等服务。但是划分不同的进程比较难以做到。
不能一味地进行聚合,比如有些终端是视频数据,有些是图片数据,两者聚合并没有好处,应当让其以自适应的方式进行集群聚合
关于去中心化学习
可以将分布式学习变化为多层级的,不一定只是看起来的点对点。例如边缘计算加入雾计算/一些控制器等等方法
无线网络边缘“遇上”分布式机器学习讲座:Machine Learning at the Wireless Edge相关推荐
- finalshell连接超时怎么解决_电脑无线网络连接不上怎么回事 电脑连不上无线网络的解决方法...
现在是一个网络多元化的时代,基本上家家户户都有电脑,用电脑就需要网络,今天我们要说的是无线网络,近日很多网络用户出现电脑连不上无限网络,又不知道如何处理,大家可以看看下面的电脑教程,帮你搞定无线网络连 ...
- orcal 工具能连接上 程序连接不上_电脑无线网络连接不上怎么办
无线网络是帮助我们摆脱网线的束缚,它的出现带来了巨大的方便,笔记本也在用户中越来越普及.然而却时常会遇到笔记本电脑无线网络连接不上的问题,这种问题该怎样解决呢? 电脑无线网络连接不上怎么办 第一步:右 ...
- 小米机顶盒显示网络无法连接服务器,小米盒子无线网络连接不上怎么回事 - 卡饭网...
无线网络连接不上怎么回事,如何解决 无线网络连接不上怎么回事,如何解决 无线网络连接不上怎么回事,如何解决,很多电脑用户可能会遇到这个问题. 一:先检查下你的无线网络开关是否打开,没打开请打开 二:检 ...
- win7怎么不能无线连接网络连接服务器,win7网络连接不上|windows7无线网络连接不上怎么办?...
windows7 无线网络不能自动连接:随着人们生活水平的提高,笔记本电脑已经逐渐进入普通人家,许多朋友也选择使用无线网络链接宽带.在使用笔记本win7系统进行无线网络连接的时候遇到Windows7无 ...
- android xp wifi连接不上,手把手解决xp系统电脑无线网络连接不上的处理技巧
可能有的小伙伴遇到过xp系统电脑无线网络连接不上的问题,大部分朋友还是不知道xp系统电脑无线网络连接不上的情况应该怎么解决,因此我就给大家整理总结了xp系统电脑无线网络连接不上的完整解决方案,你只用依 ...
- mac 电脑连接不上github_告诉你电脑无线网络连接不上怎么办
随着科技的进步,电脑已成为我们不可或缺的工具.无线网络是笔记本电脑的灵魂,没有网络笔记本就失去了一大半的功能,而我们也失去了一半的乐趣.有什么方法能解决电脑连不上无线网的问题吗?今天,我就和大家分享一 ...
- win7计算机建立无线网络连接不上,Win7笔记本无线网络连接不上如何解决?
随着网络的不断发展,无线网络已经随处可见了.而现在的笔记本都有内置的无线网卡,只要有WiFi的热点还有知道无线密码就可以登录了.最近,有Win7系统的用户,在使用电脑上网的时候,发现无线网络连接不上. ...
- 笔记本电脑无线网络连接不上的五大原因和解决办法
笔记本电脑无线网络连接不上的五大原因和解决办法:无线網絡的发展和普及尤其是无线局域网丰富了我们的生活,让我们的生活变得越来越便利了.同时提供随时即用.高速优质的網絡服务.但是.由于无线信道特有的性质. ...
- 计算机无线网络怎么连接,电脑无线网络连接不上,小编教你电脑无线网络连接不上怎么办...
无线网络是帮助我们摆脱网线的束缚,它的出现带来了巨大的方便,笔记本也在用户中越来越普及.然而却时常会遇到笔记本电脑无线网络连接不上的问题,这种问题该怎样解决呢?下面,小编给大家分享电脑无线网络连接不上 ...
最新文章
- Java项目:学生选课系统(java+javaweb+jdbc)
- list对oracle结果集排序了_MySQL之排序分组优化
- 【 D3.js 入门系列 --- 2 】 怎样使用数据和选择元素
- 《Effective C++》读书笔记(第一部分)
- php实现多字段unique验证,Laravel实现用户多字段认证的解决方法
- Win10 通过升级安装完成后出现了中文字体忽大忽小的问题解决。
- Weblogic Server上部署War包
- [Note]Linux查看ASCII字符表
- Java中文jsp页面_java中文乱码解决之道(七)—–JSP页面编码过程
- base/7/x86_64/filelists_db FAILED
- 计算机一级常用计算公式,全国计算机一级考试题库
- 微信小程序:事件传参
- 常用原型图设计工具 Axure RP 等等
- IC基础知识(十五)RS触发器、JK触发器、D触发器、T触发器
- c语言 将数组转化成二叉树
- android qq音乐 搜索,QQ音乐搜索功能基本思路
- 惠普m154a状态页_惠普M154a说明书
- wps2019数据分析加载项_《07版office办公软件中的excle中,为什么在加载项里选择了分析工具库,数据分析还是显示不出来?》 wps数据分析加载项...
- 遇见错误:ValueError: Classification metrics can‘t handle a mix of binary and continuous targets
- cannot bind non-const lvalue reference of type ‘***‘ to an rvalue of type ‘***‘解决方法