导语

联邦学习(Federated learning)在保证数据隐私性的前提下,使用分散在各地的数据,训练机器学习/深度学习模型,从而在遵守隐私保护法律的前提下,通过协作建模,提升机器学习的效率,其在金融、零售、自动驾驶等领域已有广泛应用。

正文

继《网络安全法》、《数据安全法》、《个人信息保护法》陆续实施之后,国家对网络安全、数据安全、和个人信息安全都有了明文严格的法律法规保护与制约。

毫不夸张地说,数据安全已经成为了整个时代都关注的重要议题之一。跨机构的数据要素融合应用充满了挑战,而隐私计算技术发明的初衷,便是服务于各方数据在合作中不被泄露的诉求,其解决最根本的问题是隐私数据的安全性。

天冕科技自2019年8月获得的第一个国家知识产权局的发明专利证书“欺诈检测和风险评估方法、系统、设备及存储介质”的评估方法之后,就展开了对隐私计算技术的深入探索,其布局时间远早于隐私计算风口到来之时,彰显出天冕科技在创新科技研究方面超前的战略眼光。

如果我们把创新技术的商业模式按照IT系统和应用平台两种类型来划分,则隐私计算技术的应用从现阶段来看,更偏向于定位成一个应用平台。该类型的划分在业务逻辑上有着很大的区别。IT系统,在应用中的最终价值,是帮助使用方节省成本;应用平台,则可能对具体使用方有提升业务的作用。目前隐私计算技术的作用更偏后者,其根本价值,主要是使得机构能够将内外部数据结合起来对用户进行分析,从而提升业务收入。在这样的大背景下,一种基于数据隐私保护技术实现的分布式训练范式——联邦学习应运而生,逐渐受到学术界和工业界的广泛关注。

天冕联邦学习平台是天冕科技利用前沿信息技术打造的高效安全数据合作解决方案。该平台可以充分保护各方用户数据安全,打破数据孤岛,支持企业按照具体的建模场景,沟通并匹配其他联邦成员,在明文数据不出库的前提下,共同完成联邦模型的训练与构建,帮助建模人员快速搭建联邦学习任务(横向联邦、纵向联邦、纵横向混合联邦等),促进联邦成员间的交流与共赢;在保护数据隐私的同时,深度连接各个合作方,实现跨数据、跨行业的合作共赢。

落地案例 | 某头部互金公司通过画像补充提升营销效果

背景:某头部互金公司需要对存量沉默用户进行激活营销,仅使用现存自有数据特征进行建模或者仅参考第三方数据评分只能达到收支平衡,然而引入线下第三方数据进行联合建模的方式又存在用户数据泄露的风险;通过使用天冕联邦学习平台,在自有数据特征的基础上引入第三方数据进行联合建模,有效提升了模型效果和营销ROI。

实施过程:该头部互金公司抽取30万的存量沉默用户(已注册但未曾进件)作为样本,结合某数据服务商提供的第三方数据,依托天冕联邦学习平台进行联合建模之后,将用户特征维度扩⼤至上千维度,然后抽取样本中70%的沉默用户作为训练模型,并用该训练模型对剩余30%沉默⽤户进行评分预测。

结果显示,分值越高的用户,进件概率越⼤,在训练模型中分值排名前5%的样本用户里,预测的进件准确率能达到3%(较以往单独建模预测进件准确率为1%)左右,这说明了该训练模型对于有贷款需求的用户具有较高的预测性。

与此同时,天冕科技对⽐了该头部互金公司单⽅建模和多方联合建模的模型效果,从模型角度和最终预判的贷款需求用户数量来看,联合建模⽐单方建模在AUC、KS等指标上具有更好的区分度和排序性,在对前10%评分高的用户营销后,模型KS提升11%。通过使用天冕联邦学习平台建模后,该头部互金公司本期营销收入增加了68万。

截至目前,天冕联邦学习平台已经与数十家金融及传统机构建立了合作,合作的内容主要是联合数据提供方,在各方数据不出私域的前提下,进行联合风控和联合营销模型训练。

探索中的隐私计算:天冕联邦学习平台落地案例相关推荐

  1. 隐私计算--23--纵向联邦学习

    一.纵向联邦学习的定义 纵向联邦学习(VFL)一般是适用于数据集上具有相同的样本空间.不同的特征空间的参与方所组成的联邦学习场景,纵向联邦学习也可以理解为按特征划分的联邦学习. 举个例子,我们假设有两 ...

  2. 苏州银行李伟:银行数字化转型中的隐私计算

    当前,全社会各行各业都在围绕大数据进行转型,人们的一举一动.一言一行等信息无时无刻地被各类电子终端收集和使用.人类社会实现了前所未有的高效连接,使得社会的运转效率得以大幅提升,也促成了大数据时代的到来 ...

  3. 字节跳动联邦学习平台通过中国信通院首批评估 数据安全能力得到专业验证

    近日,中国信息通信研究院(以下简称"中国信通院")公布了安全评估结果,字节跳动Fedlearner联邦学习平台(以下简称"字节跳动Fedlearner")成为顺 ...

  4. 洞见科技携手阿里云,以“隐私计算+云”推动场景应用大规模落地

    数字经济时代,数据已经成为企业的重要资产,企业对数据的保护意识日益增强,甚至频频出现画地为牢的现象.然而,数据作为第五大生产要素,其价值需在流通.共享环节进行释放.为解决这种"数据孤岛&qu ...

  5. 腾讯 AngelFL 联邦学习平台揭秘

    作者:AI前线 数据里蕴含着价值.在人工智能时代,机器学习尤其深度学习模型的获得需要大量的训练数据作为前提.但是在很多业务场景中,模型的训练数据往往分散在各个不同的业务团队.部门.甚至是不同的公司内的 ...

  6. 京东开源超大规模联邦学习平台(9NFL) 深度连接合作伙伴

    众所周知,数据是人工智能的基石,只有具备丰富和充分的数据,我们才能利用数据挖掘.机器学习等技术洞见深层次的行业趋势进而指导决策. 但与此同时所产生的数据隐私的保护问题也越来越受到关注,近年来国内外在逐 ...

  7. 【阅读笔记】联邦学习实战——联邦学习平台介绍

    前言 FATE是微众银行开发的联邦学习平台,是全球首个工业级的联邦学习开源框架,在github上拥有近4000stars,可谓是相当有名气的,该平台为联邦学习提供了完整的生态和社区支持,为联邦学习初学 ...

  8. 【阅读笔记】联邦学习实战——联邦学习智能用工案例

    联邦学习实战--联邦学习智能用工案例 前言 1. 智能用工简介 2. 智能用工平台 2.1 智能用工的架构设计 2.2 智能用工的算法设计 3. 利用横向联邦提升智能用工模型 4. 设计联邦激励机制 ...

  9. “海底数据中心”被打捞出水,故障率仅为陆地1/8;京东超大规模联邦学习平台开源...

    开发者社区技术周刊又和大家见面了,为了让大家在通勤路上随时随地掌握新鲜资讯,本周我们全新推出音频栏目--开发者技术联播.该栏目将在每周一播出,萌妹子主播将为您带来一周热门技术资讯与最新前沿技术. 那么 ...

最新文章

  1. 面经:为了拿到字节跳动offer,鬼知道我经历了啥...
  2. 卡尔曼滤波:从入门到精通
  3. 近些年有哪些口碑炸裂的项目管理工具?各具特色的项目管理工具我们该如何选择?
  4. AI芯片初创公司单纯卖芯片还是捆绑算法的商业模式更好?
  5. 【python】数据结构与算法之快速排序(重要)
  6. 样本距离计算、向量范数、矩阵范数
  7. css网页favicon_自用代码css获取任意网址的/favicon.ico的方法教程
  8. 这顶海贼王的帽子,我Python给你带上了 | 【人脸识别应用】
  9. mdadm管理raid
  10. mapxtreme for java_在MapXtreme for Java 4.8.0 中公布新制造的电子地图
  11. 二调建设用地地类代码_最新二调土地地类代码表
  12. 如何破解红蜘蛛(控屏软件)
  13. mooc-人工智能与信息社会-基于决策树和搜索的智能系统(上)
  14. 《五月集训》第二日——字符串
  15. 后代选择器和子选择器
  16. sun服务器多磁盘配置信息,配置 Solaris iSCSI initiator
  17. Android9.0 完全隐藏导航栏、状态栏
  18. 基础编程题目集(15 分题)
  19. 忘记数据库密码怎么办
  20. linux查找以c开头的的文件夹,文件查找命令find详解

热门文章

  1. java log4j jar下载_Log4j.jar下载
  2. Skype的P2P的技术特点是什么?
  3. Java GWT是什么?
  4. Springboot毕设项目生鲜超市管理的设计与实现dvzk6java+VUE+Mybatis+Maven+Mysql+sprnig)
  5. 求函数f(x)=sinx的导数,证明(sinx)'=cosx,详细过程
  6. 精品微信小程序二手汽车拍卖系统+后台管理系统|前后分离VUE
  7. 万字总结,体系化带你全面认识 Nginx !
  8. 《道德经》第四十五章
  9. \t\tVC 逃跑按钮
  10. Tigo Energy将在Intersolar Europe上展示太阳能机群管理与消防安全的新解决方案