一、说明

Fate 是一个工业级联邦学习框架,所谓联邦学习指的就是可以联合多方的数据,共同构建一个模型;

与传统数据使用方式相比,它不需要聚合各方数据搭建 数据仓库,联邦学习在联合计算建模的过程中,多方机构之间的数据是不会进行共享的,实现数据的 可用不可见;本文主要分享隐私计算平台 Fate 的相关基本概念,以及基于 Docker 的单机部署。

二、隐私计算

隐私计算 是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,实现数据的 可用不可见 的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。

图灵奖得主姚期智院士在1982年提出的 百万富翁 问题:

假设有两个百万富翁,都想比较谁更富有,但是他们都想保护自己的 隐私 不愿意让对方或者任何第三方知道自己真正拥有多少钱。如何在保护双方隐私的情况下,计算出谁更有钱呢?

此问题开创了安全多方计算领域,在如今以区块链为先导的一系列可信架构中,多方计算问题是建立机器信任的关键技术之一。

目前实现隐私计算的主流技术主要分为三大方向:第一类是以 多方安全计算 为代表的基于密码学的隐私计算技术;第二类是以 联邦学习 为代表的人工智能与隐私保护技术融合衍生的技术;第三类是以 可信执行环境 为代表的基于可信硬件的隐私计算技术。

不同技术往往可以 组合 使用,在保证原始数据安全和隐私性的同时,完成对数据的计算和分析任务。

三、联邦学习

在联邦学习当中主要有两种模式:

横向联邦

指的是在联合的多方当中,特征 是相同的,但是 用户 不一样;那么通过联合呢,就可以在训练模型时 扩展样本数量

例如:有两家不同地区银行(北京与广州)由于银行间的业务相似,所以数据的特征(字段)大概率是相同的;但是它们的用户群体分别来自北京与广州的居住人口,用户的交集相对较小;这种场景就比较适合使用 横向联邦 用于增加模型训练的用户数据 扩展数据量

纵向联邦

指的是在联合的多方当中,各方的 用户 重叠较多,但是它们的 特征 是不一样的,那么通过联合呢,就可以在训练模型时 扩展特征维度

例如:同一地区的商场与银行,它们的用户群体很有可能包含该地的大部分居民,用户的交集可能较大;由于银行记录的都是用户的收支行为与信用评级,而商场则保有用户的购买历史,因此它们的用户特征交集较小;这种场景就比较适合使用 纵向联邦 用于增加模型训练的特征数量 扩展模型能力

四、Fate

FATE (Federated AI Technology Enabler)是微众银行人工智能团队自研的全球首个联邦学习工业级开源框架,它提供一种基于数据隐私保护的安全计算框架,为机器学习、深度学习、迁移学习算法提供强有力的安全计算支持。并内置保护线性模型,树模型以及神经网络在内的多种机器学习算法。

github地址:https://github.com/FederatedAI/FATE

在 Fate 里面存在以下三种角色:

Guest

为数据的应用方,指的是在实际的建模场景中有业务需求去应用这些数据;并且在纵向算法中,Guest 往往是有标签 y 的一方。

Host

为数据的提供方,通常它只是一个合作的机构负责提供数据来辅助 guest 完成这个建模,只是帮助提升训练效果。

Arbiter

为第三方协作者,用来辅助多方完成联合建模的,不提供数据主要是负责发放公钥,加解密,还有聚合模型等功能。

五、部署

5.1. 安装镜像

首先设置环境变量 version 用于后面指定 Fate 的版本,执行以下命令:

export version=1.8.0

使用的是当前最新版本,可按需修改。

镜像有 两种安装 方式,选其一即可;

方式一 如果服务器能访问公网的话,可直接拉取腾讯云容器镜像:

docker pull federatedai/standalone_fate:${version}
docker tag ccr.ccs.tencentyun.com/federatedai/standalone_fate:${version} federatedai/standalone_fate:${version}

方式二 如果服务器没有公网,则可以通过下载镜像然后导入的方式:
在有网络的机器上下载镜像包:

wget https://webank-ai-1251170195.cos.ap-guangzhou.myqcloud.com/fate/${version}/release/standalone_fate_docker_image_${version}_release.tar.gz

在目标机器导入镜像:

docker load -i standalone_fate_docker_image_${version}_release.tar.gz

查看已安装的镜像:

docker images | grep federatedai/standalone_fate

5.2. 启动容器

执行以下命令启动:

docker run -d --name standalone_fate -p 8080:8080 federatedai/standalone_fate:${version};

六、测试

Fate 里面自带了测试任务;

首先执行以下命令,进入 Fate 的容器中:

docker exec -it $(docker ps -aqf "name=standalone_fate") bash

执行以下命令,启动 toy 测试:

flow test toy -gid 10000 -hid 10000

成功后显示以下内容:

success to calculate secure_sum, it is 2000.0

七、图形化界面

FATE Board 是 Fate 里面负责可视化的服务组件,在单机版容器中已经集成了该服务,可以通过 8080 端口访问:

账号和密码都是 admin

通过右上角的 JOBS 按钮可以查看我们 Toy测试 所运行的任务:

因为是联邦学习所以看到 guest 和 host 两方角色的任务。

扫码关注有惊喜!

隐私计算FATE-核心概念与单机部署相关推荐

  1. FATE 1.10.0 单机部署

    前言 使用环境为VMware Workstation 16 Player +CentOS7 其使用环境详细可见联邦学习FATE(单机部署)案例搭建+安装(超详细)中的前半部分. 环境部署 进入终端 部 ...

  2. 隐私计算FATE-多分类神经网络算法测试

    一.说明 本文分享基于 Fate 使用 横向联邦 神经网络算法 对 多分类 的数据进行 模型训练,并使用该模型对数据进行 多分类预测. 二分类算法:是指待预测的 label 标签的取值只有两种:直白来 ...

  3. 隐私计算FATE-离线预测

    一.说明 Fate 的模型预测有 离线预测 和 在线预测 两种方式,两者的效果是一样的,主要是使用方式.适用场景.高可用.性能等方面有很大差别:本文分享使用 Fate 基于 纵向逻辑回归 算法训练出来 ...

  4. 隐私计算开源平台Rosetta部署分享

    Rosetta是一个方便.高效又实用的隐私计算开源平台,但其部署有不少的坑,作者踩过这些坑以后,在这里跟大家作以分享,以使同学们能一次就部署成功. 在Rosetta github的repo里,有关于部 ...

  5. 2022爱分析· 隐私计算厂商全景报告 | 爱分析报告

    报告编委 张扬 爱分析 合伙人&首席分析师 洪逸群 爱分析 高级分析师 孟晨静 爱分析 分析师 目录 1.研究范围定义 \2. 厂商全景地图 \3. 市场定义与厂商评估 \4. 入选厂商列表 ...

  6. 三万文字透视前瞻:区块链及隐私计算在传统企业中的技术认知与进阶思考

    作者  :招商局集团数字化中心  山金孝 声明:文章仅代表作者个人观点,与任何组织或公司无关 前言 区块链是一种分布式网络数据管理技术,其利用密码学和分布式共识协议保证网络传输与访问安全,并实现数据多 ...

  7. 隐私计算 — Overview

    目录 文章目录 目录 背景 隐私计算 隐私计算的关键技术 隐私计算的四大方面 全面落地充满挑战 安全 算法协议尚无法实现绝对安全 开发应用安全存在挑战 安全性共识有待形成 性能 性能瓶颈阻碍隐私计算规 ...

  8. 强得离谱!串烧70+个Transformer模型,涵盖CV、NLP、金融、隐私计算...

    Transformer 作为一种基于注意力的编码器 - 解码器架构,不仅彻底改变了自然语言处理(NLP)领域,还在计算机视觉(CV)领域做出了一些开创性的工作.与卷积神经网络(CNN)相比,视觉 Tr ...

  9. 专访洞见科技李博:科技向实,隐私计算规模化应用吹响号角

    1 洞见科技,从"信用科技"到"隐私计算" 风口已至,隐私计算成为数据安全流通的"技术最优解" 作为专注于隐私计算领域的技术服务商,洞见科技 ...

最新文章

  1. win10 error LNK1112: 模块计算机类型“X86”与目标计算机类型“x64”冲突
  2. JVM【带着问题去学习 01】什么是JVM+内存结构+堆内存+堆内存参数(逃逸分析)
  3. 【跃迁之路】【440天】刻意练习系列199(2018.04.21)
  4. 非常好用的轮播图插件
  5. 微软发布ML.NET 1.0,可一键添加机器学习模型
  6. Xcode 5.1 编译模拟器以及真机都能使用的静态库
  7. mysql身份证校验码_通过SQL校验身份证号码是否正确
  8. MDT错误之日志查看方法
  9. 莫言母亲的八大教育真经
  10. linux进程操作日志文件,我使用过的Linux命令之tailf - 跟踪日志文件/更好的tail -f版本...
  11. UNITY TMP PRO 字体制作
  12. Java封装e4a_E4A类库封装从入门到放弃
  13. Web3.0技术栈简介
  14. 巨多的笑话,让心情放飞一下吧..
  15. caffe的安装配置(CUDA7.5+VS2013)
  16. R语言 lars包 lars()函数中文帮助文档(中英文对照)
  17. spark driver HA
  18. win策略计算机配置,BGinfo配置策略(Server2012R2-Win10)
  19. 八字取名,你应该要考虑的7个实用建议
  20. 一套完整的微信公众号代运营方案

热门文章

  1. sigmastar—ISP图像调试(OBC矫正)
  2. python-分类模型
  3. portainer 集群环境_Portainer实战
  4. Activiti设置流程发起用户信息【包括获取发起人信息代码】
  5. Android自由行之走进zxing,轻松实现二维码扫描
  6. 实现微信公众号H5消息推送的超级详细步骤
  7. Unity Resolving Packages卡住的问题
  8. java中String的用法详解
  9. 在大学期间必须学好的几门课​
  10. JS 数组push遇到的小问题