近几天谷歌因为一项叫做FLoC的技术而被骂上了热搜,笔者看了一下这是一种基于联邦学习的“用户追踪”技术,可以在不暴露客户隐私的情况下进行用户画像及大数据营销,这项技术对于谷歌这种广告收入占总体营收9成的互联网公司来讲意义重大。

其实FLoC相比于Cookie从某种程度上讲还是有一定进步的,通过Cookie网站能轻松追踪到用户的所有上网行为,而通过FLoC只能追踪到分类相同的用户组,从这个逻辑上讲今后如果读者突然发现APP突然疯狂向你推荐某些莫名其妙的商品,那很有可能是你所在的用户组中的其它人搜索这种商品的次数比较多。不过Cookie只能给单个网站提供相应服务,但是FLoC的联邦学习将有助于广告商掌握用户组全局的浏览行为。

凭心而论谷歌这次被骂的并不冤,在没有进行任何说明的情况下谷歌就把上百万用户列为了小白鼠,并且这些试验用户只能在“旧追踪技术”也就是Cookie和“新追踪技术”FLoC之间选择,“不可追踪”的选项被谷歌删除了。而且谷歌遭反弹最强烈的操作是由于担心违反欧盟GDPR的隐私保护法规,这次试用计划并没有在欧盟开展。

当然笔者更加关注FLoC背后的联邦学习技术,因为笔者突然发现这可是被ARM v9和英特尔联合Pick从芯片底层给予支持的黑科技。

安全联邦计算-为何被科技巨头Pick

之前笔者曾经写过一篇《ARM V9到底强在哪》的文章,其中对于ARM V9的新安全计算技术并没有特别看好。但是在两周前英特尔首任CTO帕特.基辛格重回老东家执掌帅位后推出的Ice Lake-SP也把安全计算的指令集SGX列入主推方向,这让我感觉安全计算背后必有看点。

而且帕特.基辛格与谷歌的关系应该也比较微妙,谷歌母公司Alphabet现任董事长约翰·亨尼斯就是帕特.基辛格在斯坦福的硕士导师。帕特虽然出身寒门,与很多硅谷大佬一样,帕特.基辛格也是在十八九岁、年纪轻轻时就走上了工作岗位,不过与比尔盖茨不同的是,在英特尔的资助下帕特拿到了圣克拉拉大学的电气工程学士学位和斯坦福大学计算机科学的硕士学位。在出任英特尔CTO后,帕特.基辛格转战Vmware出任CEO,并在上个月初正式回归英特尔。

我们知道约翰·亨尼斯的另一个身份是RISC之父,因此帕特.基辛格回归之后开启的IDM2.0模式其中这个重要的改变就是可以代工RISC-V和ARM架构的RISC芯片了。

说回SGX安全计算,其实这项技术的历史已经非常久远了,简单来讲安全计算可以百万富翁问题来表述,假如两个百万富翁街头邂逅,他们都想炫一下富,比比谁更有钱,但是出于隐私,都不想让对方知道自己到底拥有多少财富,如何在不借助第三方的情况下,让他们知道彼此之间到底谁更有钱?针对这个问题,在上世纪80年代,清华大学的姚期智院士提出了解决方案,并因此获取了图灵奖,从理论层面证明了多方可信计算问题的可行性。

但在实践层面多方安全计算依然困扰业界,即使像是腾讯、脸书这样的流量巨头,所无法收集用户全部的行为数据,单靠他们一家社交数据训练不出特别好的模型,而想让亚马逊和阿里的电商数据也都共同都拿出来共享吧,又有客户隐私泄漏的风险。如何在不让其它参与者看到真实数据的情况下进行计算,把姚期智院士的解决方案落地,就成了一个难题。在这个经典问题之下,目前只有蓝象智联的GAIA CUBE等少数几个平台能够做到让数据在不泄露的情况下联合多方的数据进行联合计算并得到明文计算结果,实现数据的所有权和数据使用权的分离,而且这还都是基于区块链软件技术机制保证安全可信。而谷歌的联邦学习产品FLOC甚至都没有基于区块链设计,FLOC从很大程度上是基于谷歌自身的平台信誉背书,这也难怪人们对FLOC产生众多质疑。

而英特尔的SGX和ARM V9则力争从硬件安全角度用户打消顾虑,CPU安全计算实际是给计算机加了一个安全密室,即使拥有最高权限的特权管理员也不能进入安全密室,更无法在安全密室前布放监控。安全密室与外界的一切交互全部要经过加密并进行完整性校验。

其实英特尔的SGX技术早在几年前就已经实现了,但当时SGX能创建的内存空间只有128M,而目前的AI机器学习模型动辙要上百M,大的甚至要几十上百个G,当时的SGX根本放不下这样的模型,无法在多方安全计算中使用。不过这次Ice Lake-SP最高可以支持1T的安全空间,这种程度的提升将全面拓展SGX的应用场景,比如腾讯就联合北京微芯边缘计算和区块链研究院,将区块链与SGX结合,保障数据安全性,做到最终数据可用不可见。不过话虽这么说,但是笔者还是对于联邦学习的安全性有所顾虑,因为现在的AI重建技术太过强大了。

缺陷数据的恢复也没那么难
其实回归到百万富翁问题,只要富翁A斗富的次数够多,那么他具体的财富数值就不再是什么秘密了,怎么把这种被损坏了的数据恢复回来,其实这个问题完全是GAN等生成模型的攻击范围。比如如何把打了马赛克的人脸数据恢复回来,目前比较优秀的开源模型是由英伟达提出的Partialconv(https://github.com/NVIDIA/partialconv)。

即使图像丢失了大面积的像素,也能通过Partialconv模型将损失进行修复。之前红遍网络的一键去“马赛克“技术,其实背后都是Partialconv,其效果图如下:

其实联邦学习就是用户A与用户B联合进行数据挖掘,但是用户A只有计算结果和自身的数据,但是用户B的数据不可见,但是想推理出用户B的数据似乎也不是不可能,这项技术从本质上讲和AI换脸有点像,也就是说用户A有换脸后的结果和自身的面部数据,那么他应该也有机会推测出用户B的数据。值得注意的是目前AI甚至突破了之前的分辨率限制,比如去年年中使用自编码模型技术的AI换脸项目ALAE成功登顶了Github趋势榜(https://github.com/podgorskiy/ALAE),相比于之于的之前的Faceswap以及Deepfakes等换脸项目,ALAE可谓将AI换脸带到了一个新高度,这种最新的技术突破了之前的分辨率极限,可以生成高清的换脸图像,以下是效果图。

所以说即使是最终数据被打码不可见,可能也很难避免被恢复的最终结果。

因此笔者最后推荐一下苹果的手机,在IOS中把追踪功能关掉就万事大吉了。而非苹果的用户可以考虑由Opea创始人开发的维瓦尔第(Vivaldi)浏览器。这款浏览器兼容chrome插件,最近颇为良心的还出了阻止你同意cookies的弹窗功能。

FloC背后联邦计算相关推荐

  1. 为什么谷歌被骂上热搜一点也不冤,详解FLoC背后联邦计算

    作者 | 马超       责编 | 欧阳姝黎 出品 | CSDN博客 近几天谷歌因为一项叫做FLoC的技术而被骂上了热搜,笔者看了一下这是一种基于联邦学习的"用户追踪"技术,可以 ...

  2. 区块链BaaS云服务(19)趣链“联邦计算BitXmesh”

    1. 系统框架 2. 系统特点 2.1 可信存储 支持数据大规模可信存储,采用Merkle DAG的组织形式存储数据,可实时侦测数据的完整性与一致性. 多备份分片存储进行数据容灾,并实现范围请求.断点 ...

  3. 【学习笔记】联邦计算

    相关概念 数据孤岛 指 数据像孤岛一样分散存储在多个组织. 群体之间,且相互闭塞,难以用常规手段打通. 联合计算 是一种在原始数据不出本地的条件下进行多方联合计算 的新型数据共享计算范式.逐渐成为破除 ...

  4. 同态加密在联邦计算中的应用

    [摘要] 在大数据时代背景下,如何在保护数据安全隐私的前提下充分发挥数据的价值,成了一个亟待解决的问题.同态加密作为实现数据隐私计算的关键技术,在云计算.区块链.隐私计算等领域均存在着广泛的应用需求和 ...

  5. 腾讯“神盾-联邦计算”平台带你翻越数据合作的重重大山

    导语 | 大数据及人工智能飞速发展的今天,法律法规和信任问题严重阻碍了企业之间的数据流通,数据孤岛问题像一只无形的手挡在了企业之间,因为缺乏有价值的数据合作,各行业用户获取成本居高不下.为了满足企业间 ...

  6. 联邦计算在百度观星盘的实践

    导读:本文简短综述联邦计算领域的核心技术点,随着联邦计算在产业界的应用及普及,保护数据隐私与解决数据孤岛,二者可以兼得,为数字广告营销等领域提供了一个全新思路. 全文4761字,预计阅读时间12分钟. ...

  7. Authing 背后的计算哲学

    Authing 是一个严肃的.以开发者为中心的身份云平台,这个平台由一群严肃的人精心设计并经过 2 次重构后才成功推向了市场.通过知识型内容营销和口碑传播,Authing 已经吸引 1 万多名开发者和 ...

  8. 计算神经科学简介~【整理自】类脑计算背后的计算神经科学框架

    A. 计算神经科学简介 >> 1. 一颗硬币的两面 >> 这枚硬币就是智能算法本身. a) 类脑计算 >> (1) 换一个名字 >> i) 计算神经科学 ...

  9. 王炸不断,半导体巨头们到底在打什么牌?

    作者 | 马超  责编 | 欧阳姝黎 出品 | CSDN博客 头图 | 下载于视觉中国 最近整个半导体行业实在风起云涌,IBM 推出了 2nm 的芯片,苹果春季发布会上搭载 M1 的 iPad Pro ...

最新文章

  1. Android关于Task的一些实践之SingleTask, SingleInstance和TaskAffinity
  2. 标准caffe中实现darknet相关层。caffe和darknet模型的相互转换和加速(分类、检测、分割)
  3. 041_Unicode对照表七
  4. 软工三(5.12上课)
  5. 如何从svn上down项目
  6. JavaScript的数据类型、null 和undefined、原始数据类型和引用数据类型等JavaScript基础知识总结
  7. c语言实验四报告,湖北理工学院14本科C语言实验报告实验四数组
  8. 来自Java空间的传送门
  9. shell脚本中的逻辑判断,文件目录属性判断,if特殊用法,case判断
  10. spring与web关系
  11. html中不支持什么元素,html5新元素和html不支持的元素
  12. svg转换pdf用php实现,如何使用javascript在JSPDF中将SVG文件转换为PDF
  13. 泛微oa系统什么框架_泛微OA ecology 二次开发实例 开发完整说明
  14. matlab太阳影子定位,基于MATLAB软件的太阳影子定位
  15. MMS的基本特征与特点(转)
  16. java 释放句柄_Java文件句柄释放
  17. ​相亲APP开发软件为广大单身男女牵线搭桥​
  18. selenium接管浏览器并配置代理
  19. vscode和IDEA分别如何克隆git上的项目
  20. 名人投资加密货币:推动行业发展的重要力量(连载:四)

热门文章

  1. 国产的开源电子表格web网页电子表格
  2. 张宇考前叮嘱:关于代数、级数、微分方程的三道送命题
  3. google语音搜索识别API【转载】
  4. yxc_第一章 基础算法(二)_高精度
  5. python编程实现人民币和美元的互相转换_java人民币转换美元的实验报告
  6. 用VSCode编写Latex时遇到的问题(Mac系统下)
  7. 无人机倾斜摄影测量影像处理关键技术
  8. 2021 第十二届 蓝桥杯 国赛决赛 Java B组 真题 详细解析
  9. python求最小公倍数
  10. 如果时光可以倒流,会不会有不一样的故事