晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI吃数据,越吃越便利。数据从哪来?很可能是从你的隐私里来。

但科技公司随意使用隐私数据的时代可能要终结了。

《个人信息保护法》草拟部分中已经规定个人公开的数据不得用于当初公开之初衷之外的目的使用。这意味着对数据产生的目的进行了界定。数据不能被随意使用。

如果没有隐私数据的“投喂”,科技公司的 AI算法还能继续走下去吗?我们也会因此失去算法带来的便利吗?

技术产生的问题,由技术解决。

此前,谷歌Chrome浏览器用“密码检查器”功能说明,即使不获取隐私,算法依旧能造福每个人。

当你在网站上输入一段密码后,Chrome可能会给你弹出如下提示:

你的密码可能已在其他网站泄露。

有些用户在很多网站上都用同一套密码。这些网站里如果有一个被黑客攻破,那么其他网站账户也都岌岌可危。

而谷歌的密码检查器很好地避免了一个账户泄露而导致其他账号连带遭殃的问题。

因为谷歌拥有一个总量40亿的密码泄露库,当谷歌用你的密码与这个数据库比对后,便知道你的密码是否泄露。

那么谷歌会在比对过程中获得你的密码吗?

要解答这个疑问,就要说到现在正得到广泛应用的“隐私计算”技术。

因为“隐私计算”的存在,你的密码在传输与比对过程中都经过了不可逆的加密,谷歌无从知晓你的数据,只能知道比对结果。

隐私计算是什么?

虽然Chrome最近两年才用上这项隐私保护功能,但实际上,隐私计算的相关技术已经发展了几十年。

简单来说,隐私计算就是通过技术实现数据隐私和安全保护下的数据共享。让不同来源的数据安全共享,产生更大价值,具体包括了如基于芯片的可信计算环境(TEE)、基于密码学的安全多方计算(MPC)、同态加密、源自人工智能的联邦学习等在内的各类技术的使用。

中国信通院去年12月发布了一份《隐私保护计算技术行业研究报告》,隐私计算的价值主要在于:消除数据孤岛,合规避险,弥合信任鸿沟。算是从应用角度上给隐私计算下了一个定义。

隐私计算四小龙

近年来随着数字化推进和个人隐私数据保护需求的激增,加之AI技术飞速发展,隐私计算逐渐得到业内外人士的关注,互联网大厂、传统信息化企业争相开始布局,也涌现了一批技术创业公司。

有四家公司被江湖冠以“隐私计算四小龙”的称号:蚂蚁金服微众银行华控清交翼方健数

蚂蚁金服拥有隐私保护的TED ENGINE引擎,以差分隐私作为技术重点。微众银行由著名AI学者杨强领队,开源了全球首个工业级联邦学习技术框架。

相比背靠阿里腾讯的前两家,后面两家公司较为年轻与陌生。

华控清交由于是清华姚班校友创立,头顶姚期智的光环,创立两年来一直倍受关注。之前量子位已在《清华姚班的科研能力,能孵化出一家怎样的公司?》一文中介绍过华控清交。

对于这个新兴的行业,不少人对数据“可用不可见”仍抱有疑惑。

其实这只回答了隐私计算的一个方面。

传统依靠保密协议来阻止数据泄露的共享方法,包含了巨大的安全隐患。而使用脱敏的方式已被证实并非完全“安全”。

所以,隐私计算与其说是某一种技术,更不如说是针对客户不同数据应用场景的解决方案。

因此,要让隐私在各个环节都能安全,必须从数据使用过程的各个风险点全盘考虑。

“四小龙”里的翼方健数从数据的使用过程中,描述了如何实现隐私计算技术:数据不出平台,数据在平台内授权使用,平台只输出数据的价值,达成数据安全、隐私保护和价值输出的目标。

 图片来自翼方健数官网

一家“0数据”的隐私计算公司

如何定义隐私计算,每个行业人士或许都有自己不同的看法。

但对用户隐私和数据安全的认知,行业正在逐渐加强。

2017年发布的《阿里云安全白皮书》曾指出,数据安全和用户隐私是其第一原则,并称阿里云有“极其严格的操作规范和审计制度”:未经用户授权,任何人不得触碰用户数据;工程师所有的运维管理操作,都会被记录并有审计;每次登录都需要通过双因素验证方可操作等。

“客户数据安全和隐私保护是最重要的事情,也是我们最基础的承诺,”阿里云总裁胡晓明曾表示。

而翼方健数则进一步加强对用户数据所有权的重视程度 :“0数据”是每一家隐私计算公司都应该坚持的。

前微软研究院全球合伙人、资深技术专家张霖涛,于去年12月选择加入翼方健数,成为这家公司的首席科学家。

张霖涛是普林斯顿大学计算机工程硕士、IEEE Fellow、ACM杰出科学家,在微软研究院工作17年之久,有着丰富的云计算、分布式计算的研究经验。

量子位与张霖涛进行了一次沟通。

关于加入翼方健数这一决定,张霖涛表示,自己关注隐私计算领域已经很久了,认可趋势也认可这个团队在做的事,通过技术让数据有序流通,构建基于数据全新的商业协作网络,更认同将“0数据”作为坚持和底线。

所谓的“0数据”是指“0数据留存”,即数据在翼方健数构建的网络或者平台上流动,翼方健数本身不持有任何他方数据。

毫无疑问,数据互联互通产生的价值对未来科技世界是能产生颠覆效应的,隐私计算本身在解决各方对于数据安全和隐私保护的顾虑。

但如何消除对技术方的不信任,现阶段用0数据的方式“独白自证”或许是一个可行的方式。

隐私计算的普及遇到了什么问题

可是为什么目前隐私计算仍未实现遍地开花?

新技术的下沉落地,需要一个接受和完善的过程。

举例来说,目前常见的隐私计算技术,如:可信计算环境,安全多方计算,联邦学习等,客户在使用这些技术时都会受制于技术的应用场景,并且需要做额外的准备工作。

这是客户期待的隐私计算方案吗?

隐私计算应该是一个集安全存储和安全计算一体化的方案,来帮助客户从数据准备、数据计算以及数据应用的完整解决方案,并在过程中保障数据隐私安全。

从数据的安全存储来看,市面上的文件系统可以解决“多源异构”数据的汇集和管理,但并不能完全应对隐私计算场景。安全存储会使用加密算法对数据进行加密,这会让数据计算复杂化,计算性能会大大降低。而当面对城市级别大数据的计算,性能尤为重要。

数据应用也面临问题,如何兼容各应用所使用的不同的计算模式,满足包括大数据、机器学习及高性能计算等不同计算应用的需求?

这又回到了开头的疑难,如何形成完整的客户满意的隐私计算解决方案。

深耕隐私计算的科技公司通过建立平台产品,并完善应用协作机制来满足客户的需求。

比如,华控清交推出了自主研发的数据安全融合平台,翼方健数有XDP翼数坊隐私计算平台。

我们看一下号称“全球首款医疗数据隐私计算平台”是怎么做的?

首先,翼方健数放弃传统的文件管理系统,而改为自研系统,实现“为隐私计算而生的XFS文件管理系统”

从上图中可以看出XFS文件管理系统向下兼容各种不同类型的文件系统和数据传输协议,向上兼容不同的大数据计算模式,帮助传统大数据计算应用以零成本移植到平台。

通过KMS(秘钥管理系统),XFS实现了对文件级别细粒度加密模式,分布式加密处理,实现单一文件级的风险管控和安全保护。

XFS将安全存储和安全计算有机结合,实现城市级数据处理能力。

翼方健数通过该技术也的确实现了区域和城市级的隐私计算场景。

经过隐私计算的数据,真的有用吗?

行业上,蚂蚁金服、微众银行、华控清交都不约而同在金融领域扎根,而翼方健数聚焦于医疗领域

医疗行业一直被标榜为隐私计算领域的3大典型应用场景之一,但是纵观行业内,涉及企业寥寥无几。

原因在于相比AI充分渗透的金融行业,医疗行业的数据应用成熟度不高、数据极度敏感、因安全的顾虑产生信息孤岛多,但共享价值极高。

根据翼方健数的官网,确实看到了诸多医疗行业的具体应用。

关于这点,张霖涛向量子位解释道,翼方健数在行业内实现端到端闭环,即从数据治理到通过数据形成AI模型,孕育出智能应用。在行业里跑通了隐私计算的闭环,也证实了数据经过隐私计算后的价值。

这样的做法对技术团队的专业领域提出了挑战,但或许正是因为这个目标反而让翼方健数建起了一定的行业壁垒。

迈入数据和算法连接的普惠时代

隐私计算元年已过,会迎来爆发式成长吗?

如何发挥数据价值,为不同行业、不同来源、不同类型的数据提供安全的交流中心和资产化机制/数据货币化机制,是隐私计算领域下一步的关键。

翼方健数提出要构建IoDC数据和计算互联网。

网络确实是一个能够囊括所有资源的方式,掌握数据的各个企业将数据安全地贡献出来,而那些数据不成熟的小企业,通过隐私计算获得普惠的数据价值。

听上去不错,那么数据和计算互联的价值,潜力到底有多大?

据第三方机构Statista数据统计,2020年,全球大数据数据量将达50.5ZB。

如果这50ZB是一个“可用不可见”的统一整体,其中所蕴含的能量,不可想象。

当然,打通数据绝非一项技术、一家企业就能完成。

如果说“AI四小龙”让我们享受到了算法的普惠,那么“隐私计算四小龙”则将我们带入AI落地的下一站:数据和算法连接的普惠。

华控清交和翼方健数只是这个赛道中两个新兴企业的缩影。也许就像“AI四小龙”的概念逐渐淡化一样,未来随着隐私计算的赛道越来越宽,这个行业会更加百花齐放。

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

无惧隐私泄露,企业修炼“看不见的数据圣手”相关推荐

  1. 科技领域看不见的手如何影响企业未来命运

    作者:刘锋 "看不见的手"像幽灵一样盘踞在人类社会的发展过程中,时隐时现,在亚当·斯密的<国富论>中,看不见的手推动了经济的发展:在达尔文的进化论中,看不见的手推动了生 ...

  2. 小伙居然查到了小学同学的信息,从微信撤回功能看个人隐私泄露

    最近,微信发布了最新版本,在新版本中,用户在两分钟之内发送的消息只有撤回功能,两分钟后的消息才能选择删除,这两项功能不再同时出现. 长按刚发的信息,只显示撤回,没有删除 这一人性化的设置也让不少网友点 ...

  3. 因看不见而恐惧!企业亟需“看得见”威胁

    在以云计算.大数据.移动互联网为代表的新一代信息通信技术的快速发展的今天,新兴的网络攻击也日益复杂多变,保障业务安全实现安全可视变得十分重要.我们只有"看见"风险,才能有效地进行预 ...

  4. 隐私泄露、AI换脸存风险 11家企业被约谈

    3月18日,网信办.公安部宣布,针对近期未履行安全评估程序的语音社交软件和涉"深度伪造"技术的应用,国家互联网信息办公室.公安部指导地方网信部门.公安机关依法约谈映客.阿里等11家 ...

  5. 3D打印攻破无人车激光雷达,这个奇怪的盒子它看不见

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 深度神经网络容易受到某些对抗样本的攻击,比如图像分类网络,只需在图中加入一点微小的扰动,就能让它把熊猫当成长臂猿. 如果把对抗攻击用在自动 ...

  6. 【Tableau Desktop 企业日常技巧15】tableau 为什么地图看不见,只有显示圆圈(地图被冲蚀了)

    文章目录 问题描述 问题解决 问题描述 我的地图看不见,只有白板和圆圈 问题解决 是因为你的地图被百分比冲蚀了,就好比沙滩上海水冲蚀石头一样,冲蚀了百分百就看不见了. GIF显示

  7. 企业微信来了,老板的消息再也无法装作看不见了?​

    马化腾:"企业微信是腾讯对企业工作场景的重要产品,期望帮助企业大大提升工作效率." 今天,企业微信上线了,在手机上就能轻松完成办公需求:公告.考勤.请假.报销.公费电话和邮件功能. ...

  8. Facebook隐私泄露事件继续发酵,黑客明码标价出售聊天信息

    2018年对于Facebook来说,是命运多舛的一年,此前曝光的隐私泄露事件如今又在持续发酵. 据BBC近日报道,有黑客宣称其已经窃取1.2亿个Facebook用户账号的私人信息,并试图以每个账户10 ...

  9. 隐私泄露中的人性剖析

    暂请点进来看的同学闲看故事二则. 故事一 今天早上发生了一件尴尬的事情. 我最好的闺蜜发来一条微信: 我的隐私泄露神经瞬间紧绷. 每天沉浸在"大数据之下无隐私"的氛围和恐惧中,我怎 ...

最新文章

  1. 深度!移动机器人(AGV)产业链全分析
  2. memcached监控的几种方法(nagios等)
  3. 推荐一个牛逼的 GitHub 项目+支付宝、微信支付项目实战!快来获取!
  4. c++语言 自己构造函数 成员对象构造函数 调用顺序,C++类成员构造函数和析构函数顺序示例详细讲解...
  5. PHP删除目录及目录下所有文件
  6. 2018-11-17 js的this引起的血案
  7. windows-7:系统利用终端cmd命令关机
  8. Lambda 表达式入门,这篇够了!
  9. like效率 regexp_Oracle中REGEXP_LIKE与LIKE的区别
  10. java拦截器放行_java拦截器放行某些请求
  11. 服务器的hosts文件位置,Hosts文件位置和书写规范
  12. arm linux开发板自动配置IP地址
  13. MongoDB分片集群部署(三)
  14. 计算机图形学(第四版)-第一个画线例子- 读书笔记P30
  15. 3Dmax调整材质的纹理方向有哪些步骤
  16. 玩客云刷甜糖(2022-7-26亲测)
  17. CART回归树原理及示例
  18. OpenSSL SSL_read: Connection was aborted, errno 10053的问题
  19. java jen部署_CSS布局:Jen Simmons的网格,区域和@Supports
  20. HBase快速导入巨量数据—— Bulk Loading

热门文章

  1. Node.js + Nginx-现在怎么办?
  2. 如何在另一个JavaScript文件中包含一个JavaScript文件?
  3. 自用Java爬虫工具JAVA-CURL已开源
  4. Python模拟弹道轨迹
  5. 使用 NLTK 对文本进行清洗,索引工具
  6. 《你的灯亮着吗》阅读笔记1
  7. 一台物理机上VMware虚拟机实现拨号上网同时内网通信
  8. jQuery弹出窗口浏览图片
  9. 基于Python语言Hamcrest断言的使用
  10. 用python分析excel数据_Python3分析Excel数据