2020 年 6 月 24 日北京智源大会上,微众银行 CAIO,兼香港科技大学讲席教授杨强做了题为《AI 的新三定律:隐私、安全和可解释性》的报告分享。杨强教授在开场便引用了《机械公敌》作者阿西莫夫所撰写的三大机器人定律,分别为:

  • 第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管

  • 第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外

  • 第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存

他解释道,人工智能的下一步是离不开人的。以 AlphaGo 为例,人类工程师会为其进行 Debug,但它还是会下错棋、下臭棋。这就意味着必须要有人监管其结果,才能实现保证人工智能得出正确的结论。

杨强认为,AI 的模型和系统在设计的时候就没有把人考虑进来,进而生成了一个全自动的过程,包括后面发展出来的 Self-supervised Learning 和 AlphaGo Zero。他特意讲到 “这就并不是今天我们在工业和社会上大家所想看到的。”

根据这个结果,杨强认为既然人工智能诞生于数据中,那么在创造它的时候就应该启用新的三大定律人工智能需要保护人的隐私、人工智能需要保护模型的安全、人工智能需要人类伙伴的理解。这也就意味着,人工智能不能脱离人去发展,需要让人和人工智能形成协作关系。

新三大定律之一:需要保护人的隐私

受此启发,杨强团队也开始了联邦学习的尝试,为此还推出了一本同名的书 ——《联邦学习》。其主要思想是可以总结为数据可以保持在原地,但模型通过孤岛不同机构之间加密的情况下的沟通,这个模型就会成长起来,效果就是这个数据可以被使用,但是各方都看不见对方的数据。用剪短的话概括联邦学习:数据不动模型动,数据可用不可见。

杨强表示,这种做法听起来天方夜谭,不过在技术上还真的可以做到。他把模型比喻为养羊,过去是从各个草场里运草过来喂羊,这个过程就是数据聚合过程。然而由于数据会离开其本身所处的数据库,因此各种各样的漏洞使得数据本身的隐私得到泄露。现在则是要让这个羊走动起来,模型去访问不同的草场,那么这个草就不用出本地了,这个羊也得到了壮大。

无独有偶,杨强又讲到了一个 Google 的例子。这家公司在 2016 年提出一个做法,叫做联邦平均 Federated Averaging,就是往云端传递的消息只包含模型的参数,并且是受到加密的保护,那么在云端就得到了一个更新,这个更新在这里是求一个平均值,更新后的模型就被下发到了各个终端,使得每个终端上面的模型得到更新,整个的过程动不泄露本地的隐私,也不泄露模型的参数 W1 到 WN,因此这种做法就被赋予用在 Android 系统。

联邦平均的关键技术就是加密和解密的算法,能够保护自己包进去的数据。这个数据可能本身是原始数据或者模型参数,而且还允许在加密层只上进行一系列的数学操作和数学运算,现在有一种加密的方法使得云端聚合和更新的效果可以在不暴露数据本身内容的情况下进行。

杨强补充道,联邦学习通过样本和特征的不同,可以分为纵向和横向两种联邦学习方式。不过无论是哪种类型的切割,都已在商用中发挥了巨大的功效。2019 年 6 月 28 日中国人工智能开源软件发展联盟 (AIOSS) 正式出台国内首个关于联邦学习的团体规范标准,《信息技术服务 联邦学习 参考架构》。而 IEEE 很快也会出台一个关于联邦学习的国际标准,在世界范围内推动联邦学习发展是利好。

新三大定律之二:需要保护模型的安全

可就算保护了数据的隐私,不过仍然不能防止数据本身被污染。杨强教授继续往下说着,可能被攻击的就是训练数据本身,叫做数据下毒,可能对模型进行攻击,也就是说模型的隐私可能会被泄露,测试数据可能会做假,模型本身可能是没有办法识别,这也相当于对模型的攻击。

训练下毒攻击可以叫做 Data Poisoning 毒化数据,可以在训练数据当中植入后门。Stop Sign 上面有一个黄色的像素点,对于这个攻击者来说是植入了训练数据,以致于这个模型见到了黄色的点就不顾其余了,没有把这个 Stop Sign 正确地说出来,车就直接开过去了没有 Stop,行人就会出事,就是这种恶意的攻击。

如图所示,Stop 标识牌下的黄色像素点

杨强指出,这个现象也有各种各样的解决方案,比如一种就是对抗测试样本,也是对原始数据进行一些扰动,使得我们证明模型具有一定的鲁棒性,也就是说这个小的领域当中要求是模型的输出必须一致,里面还有大量其它的工作。

最近 MIT 韩松教授正式证明了这一点,去年的深度泄露攻击 Deep Leak 意思就是当人们在多方沟通模型的 Gradient 梯度的时候,即使这个梯度当中是部分加密的,部分加噪的,对方还是不同程度地可以学到原始数据。这里做的实验有两个结论:噪音加得多对方学到的少,同时效果也会变差。杨强教授说,“真的变成了让人非常苦恼的事情。”

通过可解释人工智能,判断出原始模型维和将哈士奇识别为狼

新三大定律之三:需要人类伙伴的理解

可解释性分为两个部分:第一就是要让人明白在做什么,第二就是要让不同背景的人用不同的方式去明白。杨强以银行的AI风险评估算法为例,指出其既要让监管方和银监理解,即对银监解释整个结果产出的逻辑,又要对系统开发的工程师可解释,使得工程师随时能够进入系统去进行改进,此外对贷款的申请人要能够解释得到的结果。

IEEE 新成立了一个可解释人工智能的标准组,与此同时业界也出现了很多关于可解释人工智能的相关研究。业内对于可解释人工智能的定义为:模型本身要可解释,学习更多结构化、可解释、具有因果关系的模型。通过可解释人工智能,工程师、用户等多方参与者,都可以了解到模型的运行模式,从而强化人工智能的鲁棒性,以此来抗击噪点、下毒等多种攻击手段。

杨强最后补充说:“人工智能的发展不仅要芯片、数据和算法,同时也要注意人,我们要保护人的隐私,保护模型的安全,保证对人类可以解释。”

微众银行 CAIO 杨强:人工智能的新三大定律(附视频)相关推荐

  1. 腾讯天衍实验室联合微众银行研发医疗联邦学习 AI利器让脑卒中预测准确率达80%

    近几年,医疗行业正在经历一场数字化转型,这场基于大数据和AI技术的变革几乎改变了整个行业的方方面面,将"信息就是力量"这句箴言体现的淋漓尽致,人们对人工智能寄以厚望,希望它能真正深 ...

  2. 再领高校前沿科技风潮,微众银行第三届金融科技大赛落下帷幕

    11月8日, 2021年微众银行第三届金融科技高校技术大赛(以下简称"大赛")在深圳成功落下帷幕. 本届大赛历时80天,共有220余支队伍,总计800余名海内外高校学生参与.在人工 ...

  3. 微众银行殷磊:AI+卫星,从上帝视角洞察资产管理|BDTC 2019

    出品 | AI科技大本营(ID:rgznai100) 12月5日-7日,2019中国大数据技术大会(BDTC)于北京隆重举办,大会已成功举办十二届,是大数据领域极具影响力的行业盛会.本届大会汇聚了学术 ...

  4. 蚂蚁金服、微众银行、度小满都来了,智能金融将何去何从?(文末福利)

    (大会官网 https://t.csdnimg.cn/U1wA) 金融业是一个数据堆砌起来的行业,有客户信息.风险控制数据.交易数据等等,如果这些数据没有被有效的管理和分析,会增加企业的经营风险和降低 ...

  5. 微众银行首席AI官杨强:联邦学习理论基础、四大应用场景与微众的AI全布局

    本文作者:周蕾 2020-06-14 09:44 导语:HKSAIR<AI金融>系列线上讲座第一课. 近日,香港人工智能与机器人学会(HKSAIR)创会理事长.微众银行首席AI官.香港科技 ...

  6. 微众银行AI团队领衔推动人工智能国际标准的制定

    2月21日,由微众银行主办的IEEE P3652.1(联邦学习基础架构与应用)标准工作组第一次会议在深圳成功召开.微众银行首席人工智能官(CAIO).国际人工智能联合会(IJCAI)理事长杨强教授担任 ...

  7. 46 万奖金等你拿 | 微众银行第二届金融科技高校技术大赛报名中

    听说你是算法界的"最强大脑" 算法调优难不倒! 听说你是班级里的"链圈"极客 产品设计最在行! 那么,机会来了!2020 微众银行第二届金融科技高校技术大赛已经 ...

  8. 大道至简:微众银行区块链全栈技术体系纵览

    5月26日,微众银行区块链携全栈技术体系亮相贵阳数博会,并斩获领先科技成果奖.从2015年开始布局区块链,微众银行区块链已推出多项开源区块链技术,其首席架构师张开翔将从区块链发展娓娓道来,详细阐述对微 ...

  9. 微众银行马智涛:解放数据生产力,以金融科技助力数字经济发展|数字思考者50人...

    ▎钛媒体2022特别专题策划<数字思考者50人>:探访中国50位独具代表的数字化思考者.我们理解的 TechThinker ,涵盖了中国数字化浪潮中的技术践行者.政策制定者与投资决策者.在 ...

最新文章

  1. 三十六、请求分页管理方式
  2. Employee Bonus --leetcode
  3. 进程间通信--信号(SIG)
  4. windows消息机制-4(MFC)
  5. [BZOJ4698][SDOI2008]Sandy的卡片(后缀自动机)
  6. clover引导mbr安装黑苹果_安装黑苹果记录(一)
  7. css动画-模拟正余弦曲线
  8. MySQL5.6 新特性之GTID【转】
  9. 重构现有代码:Refactoring
  10. UVa140 Bandwidth 【最优性剪枝】
  11. 无烟会议室:CMMI vs. Scrum vs. XP(QCon 2010 感受)
  12. 综合后端各种类型文件
  13. overflow-x后覆盖滚动条
  14. 神通数据库打开服务_数据库周刊30丨数据安全法草案将亮相;2020数据库产业报告;云南电网上线达梦;达梦7误删Redo…...
  15. bitnami下mysql配置-包含phpMyAdmin配置
  16. Spark编程Tips
  17. 汇编语言王爽 实验十五
  18. 绿盟 java 面试_绿盟科技校园招聘面试经验|面试问题(共52条)- 职业圈
  19. 比较JPG、PNG、GIF、BMP图片格式
  20. JAVA百度校招笔试题(含答案、解析)

热门文章

  1. php 7.1 寿命,PHP 7.1新特性
  2. vue插槽面试题_Vue 的slot插槽 及一个奇怪的面试题
  3. oracle导入到mysql命令_oracle数据库导入导出命令
  4. java什么时候用有参_Java有陷阱——慎用入参做返回值
  5. jar java classpath_win7中java编程工具安装 java环境变量设置
  6. 【c语言】蓝桥杯算法训练 成绩的等级输出
  7. 陕西信息计算机学校,陕西计算机信息专业学校
  8. android 释放so,在安卓项目里部署so文件你需要知道的知识
  9. 撕裂者cpu三代文件服务器,AMD三代线程撕裂者CPU开盖:钎焊散热、64核若隐若现...
  10. 《TCP/IP详解卷1:协议》第6章 ICMP:Internet控制报文协议-读书笔记