文章目录

  • 背景简介
  • 横向联邦学习
  • 纵向联邦学习
  • 参考

背景简介

现实生活中,除了少数巨头公司能够满足,绝大多数企业都存在数据量少,数据质量差的问题,不足以支撑人工智能技术的实现;同时国内外监管环境也在逐步加强数据保护,陆续出台相关政策,如欧盟最近引入 的新法案《通用数据保护条例》(GDPR),我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》,因此数据在安全合规的前提下自由流动,成了大势所趋;在用户和企业角度下,商业公司所拥有的数据往往都有巨大的潜在价值。两个公司甚至公司间的部门都要考虑利益的交换,往往这些机构不会提供各自数据与其他公司做与单的聚合,导致即使在同一个公司内,数据也往往以孤岛形式出现。

基于以上不足以支撑实现、不允许粗暴交换、不愿意贡献价值三点,导致了现在大量存在的数据孤岛,以及隐私保护问题,联邦学习应运而生。

横向联邦学习

适用场景:

横向联邦学习的本质是样本的联合,适用于参与者间业态相同但触达客户不同,即特征重叠多,用户重叠少时的场景,比如不同地区的银行间,他们的业务相似(特征相似),但用户不同(样本不同)

学习过程:

step1:参与方各自从服务器A下载最新模型;

step2:每个参与方利用本地数据训练模型,加密梯度上传给服务器A,服务器A聚合各用户的梯度更新模型参数;

step3:服务器A返回更新后的模型给各参与方;

step4:各参与方更新各自模型。

步骤解读:在传统的机器学习建模中,通常是把模型训练需要的数据集合到一个数据中心然后再训练模型,之后预测。在横向联邦学习中,可以看作是基于样本的分布式模型训练,分发全部数据到不同的机器,每台机器从服务器下载模型,然后利用本地数据训练模型,之后返回给服务器需要更新的参数;服务器聚合各机器上的返回的参数,更新模型,再把最新的模型反馈到每台机器。

在这个过程中,每台机器下都是相同且完整的模型,且机器之间不交流不依赖,在预测时每台机器也可以独立预测,可以把这个过程看作成基于样本的分布式模型训练。谷歌最初就是采用横向联邦的方式解决安卓手机终端用户在本地更新模型的问题的。

纵向联邦学习

适用场景:

纵向联邦学习的本质是特征的联合,适用于用户重叠多,特征重叠少的场景,比如同一地区的商超和银行,他们触达的用户都为该地区的居民(样本相同),但业务不同(特征不同)。

学习过程:

纵向联邦学习的本质是交叉用户在不同业态下的特征联合,比如商超A和银行B,在传统的机器学习建模过程中,需要将两部分数据集中到一个数据中心,然后再将每个用户的特征join成一条数据用来训练模型,所以就需要双方有用户交集(基于join结果建模),并有一方存在label。其学习步骤如上图所示,分为两大步:

第一步:加密样本对齐。是在系统级做这件事,因此在企业感知层面不会暴露非交叉用户。

第二步:对齐样本进行模型加密训练:

step1:由第三方C向A和B发送公钥,用来加密需要传输的数据;

step2:A和B分别计算和自己相关的特征中间结果,并加密交互,用来求得各自梯度和损失;

step3:A和B分别计算各自加密后的梯度并添加掩码发送给C,同时B计算加密后的损失发送给C;

step4:C解密梯度和损失后回传给A和B,A、B去除掩码并更新模型。

参考

https://zhuanlan.zhihu.com/p/79284686

【机器学习】横向联邦学习纵向联邦学习区别相关推荐

  1. 横向项目和纵向项目的区别

    前言:读研的同学可能经常会听到横向课题.纵向课题,但是对于初入硕士研究生的同学,可能对此略有懵懂.下面给出以下解释,希望能够帮助到你们. 科技项目包括纵向科技项目和横向科技项目. 1. 纵向科技项目 ...

  2. 破解数据匮乏现状:纵向联邦学习场景下的逻辑回归(LR)

    摘要:主要介绍了华为云可信智能计算服务(TICS)采用的纵向联邦逻辑回归(LR)方案. 本文分享自华为云社区<纵向联邦学习场景下的逻辑回归(LR)>,作者: 汽水要加冰. 海量训练数据是人 ...

  3. 【联邦学习】联邦学习算法分类总结

    [联邦学习]联邦学习算法分类总结 横向联邦学习.纵向联邦学习和联邦迁移学习 横向联邦学习 纵向联邦学习 联邦迁移学习 基于机器学习算法的联邦学习分类 联邦线性算法 联邦树模型 联邦支持向量机 联邦深度 ...

  4. 纵向联邦线性模型在线推理过程中成员推断攻击的隐私保护研究

    纵向联邦线性模型在线推理过程中成员推断攻击的隐私保护研究 尹虹舒, 周旭华, 周文君 中国电信股份有限公司研究院安全技术研究所,上海 201315 摘要:随着大数据的发展以及数据安全相关法规的出台,人 ...

  5. 纵向联邦学习的挑战与展望

    <联邦学习>(杨强等著)读书笔记 我们把在数据集上具有相同的样本空间.不同的特征空间的参与方所组成的联邦学习归类为纵向联邦学习,也可以理解为按特征划分的联邦学习. 出于不同的商业目的,不同 ...

  6. 谁都能看懂的纵向联邦学习(VFL)加密聚合算法的解释

    场景说明 为便于分析,先考虑最简单的情形,现在有两个clients,client A和 client B,以及一个受信任的第三方client C(或者用server代替也可以).client A和 c ...

  7. 最新最全论文合集——纵向联邦学习

    AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现. ...

  8. 银行借助纵向联邦学习 集中化进行长尾客群的精准营销

    易观数字化:银行受限于有限的营销资源,导致缺少对长尾客群的精细化运营,而纵向联邦学习是面向长尾客群精准营销的有效手段之一,但在应用时需同步考虑系统层级的挑战. 银行的长尾客户占比80%以上.但受限于有 ...

  9. 3节点Fate集群实战记录 -- 纵向联邦学习

    前一篇博客记录了3节点fate集群实现横向联邦学习的实践过程link,本篇接着记录纵向联邦学习的实践过程,其中有些简单步骤未详细列出,具体执行方法可以参考上篇博客. 纵向联邦的场景简单说就是A和B两数 ...

最新文章

  1. 转:从零开始做app需要做的事情列表
  2. R语言使用randomForest包构建随机森林模型(Random forests)、使用importance函数查看特征重要度、使用table函数计算混淆矩阵评估分类模型性能、包外错误估计OOB
  3. Visual Studio 2019更新到16.2.3
  4. 连接LilyPad之Linux平台的驱动
  5. 用于在公网环境下测试的Telnet/SSH服务器
  6. C++基于多态实现依赖颠倒原则附源码
  7. Facade(外观模式)
  8. 设计模式(第十七式:迭代器模式)
  9. CV 加持的工业检测,从算法选型到模型部署
  10. python文件のpandas操作
  11. Python算法:推导、递归和规约
  12. webpack资源的输入与输出
  13. Python之turtle画小狗、狮子头和小黄人
  14. RK3288_Android7.1调试RTC总结(二)
  15. 编码风格之变量的命名规则
  16. Android热修复Sophix的使用
  17. sqlserver格式化-年月日
  18. 首发创新微信聊天内容制作生成器微信小程序源码下载支持多种制作
  19. python之if嵌套
  20. 爬取今日头条街拍美女图片

热门文章

  1. 正试图在 os 加载程序锁内执行托管代码。不要尝试在 DllMain 或映像初始化函数内运行托管代码,这样做会导致应用程序挂起。
  2. python自学容易吗-python好学吗
  3. 【渝粤题库】国家开放大学2021春1054流通概论题目
  4. python爬取pubmed的文献_利用selenium爬取pubmed,获得搜索的关键字最近五年发表文章数量...
  5. 2017年最火的19个行业,你做哪行!
  6. DXF读写:对齐尺寸标注文字居中、上方的位置计算
  7. ssm基于微信小程序的电影影评交流平台系统 uni-app
  8. verilog练习:hdlbits网站上的做题笔记(6)
  9. IDEA中的pom.xml文件变成了橙色
  10. LNA设计学习心得记录----MOS管的选取