让更多的优秀青年科学家齐聚一堂,实现「启迪、探索、突破」的目标,这正是「青年科学家50²论坛」举办的初衷。

8 月 1 日,「青年科学家50²论坛」开幕,数十位院士与知名高校校长、百余名「科学探索奖」获得者与青年科学家在这一天齐聚深圳。

「科学探索奖」是目前国内金额最高的青年科技人才资助计划之一。自 2018 年设立起,「科学探索奖」已经评选出了共 100 位来自各领域的优秀青年科学家,每位均获得由腾讯基金会资助的 300 万元奖金,并且能够自由支配。

昨日举办的「青年科学家50²论坛」,正是为所有「科学探索奖」获奖者提供的高水平、跨学科学术交流平台,今年是首次举办,此后每年也将举办一次。每位「科学探索奖」的获奖者在受资助的 5 年期间,都将来到这个论坛分享至少一次自己的 big idea 和最新探索。

清华大学教授朱军是 2020 年第二届「科学探索奖」信息电子领域的获奖者之一。正如当时的获奖理由所写,朱军教授在贝叶斯人工智能基础理论、高效算法和概率编程方面,都拥有一流的研究成果。今年不到 40 岁的朱军教授,已经是国内机器学习领域首屈一指的人物。

获奖之后,朱军教授决定将「科学探索奖」的奖金继续投入到人工智能的研究上来。在这场论坛上,朱军教授分享了一些关于「安全可靠人工智能」的思考,这也是他未来多年笃定的研究方向。

今天的人工智能,距离安全可靠还有多远?

人工智能的概念产生最早可追溯到 1956 年的达特茅斯会议,但直到近十年来的第三波人工智能发展浪潮,这一领域才真正地深刻改变了大众生活,甚至攻克了多种人类世界的顶级挑战,比如战胜围棋顶级选手、预测蛋白质结构、击败人类飞行员等等。

但当人工智能的发展进入瓶颈期,学界开始思考下一步的方向。来自清华大学的张钹、朱军、苏航三位学者提出了「第三代人工智能」,并在《迈向第三代人工智能》这篇署名文章中首次全面阐述了第三代人工智能的理念。文章提出,第三代人工智能的发展路径是融合第一代的知识驱动和第二代的数据驱动的人工智能, 同时利用知识、数据、算法和算力等 4 个要素, 建立新的可解释和鲁棒的 AI 理论与方法,发展安全、可信、可靠和可扩展的 AI 技术。这篇综述引发了学界和业界的讨论热潮。

「安全可靠」作为下一代人工智能的核心发展目标逐渐成为共识,数据与算法安全也成为学界和业界人士重点关注的研究主题之一。

在朱军看来,今天的人工智能远远算不上完美。首先是深度学习仍然面临着鲁棒性差的问题,比如很多手机都会配备人脸识别方案,但通过一副打印了特殊纹理图案的眼镜,就能轻松解锁很多手机;再说到安全需求更高的自动驾驶系统,黑客们只需要在标识牌上加上特定图案,就能让系统将限速标识识别为停止标识,导致致命事故的发生;就连 1750 亿参数的 GPT-3,虽然一贯被誉为全科优秀生,但答起题来也有驴唇不对马嘴的时候……

AI 为什么出错?如何防止 AI 出错?如果不能解决这些问题,那么 AI 就算不上是安全、可靠。

迄今为止,人类对深度神经网络等 AI 算法的出错机制知之甚少。一方面,数据的不确定性是广泛存在的,一旦遇到对抗样本攻击,哪怕是在一张图片中加上少量的噪音,虽然展示效果对人眼没有影响,但足以让人工神经网络产生误判。另一方面,数据中有用信息量的增长没跟上模型体量的增长,就会造成模型的不确定性。

朱军认为,这些问题都会造成「AI 不知道自己不知道」,而贝叶斯方法恰好能提供一种自然、严谨的不确定性计算方法。

贝叶斯与深度学习的结合

对于任何 AI 模型来说,无论开发过程如何,在现实世界中落地的过程一定是极具不确定性的。面对诸多未知,用贝叶斯方法建模是一种解决方法。图灵奖得主、贝叶斯之父 Judea Pearl 是朱军一直以来最崇拜的学者之一,而朱军的工作则推动了贝叶斯方法的「深度」变革,将这一方法在人工智能领域的应用发扬光大。

深度学习本身属于机器学习的一端,它会用到大量的训练样本和计算资源,再加上网络结构的人为调整,在特定环境、特定数据集上得到非常高的准确度。另外一端则是贝叶斯的学习方法,贝叶斯程序可以用少量的训练样本学习非常精确的模型,在数据的利用上更高效,而且对抗鲁棒性好、可解释性强。

这种结合贝叶斯方法和深度学习各自优势的研究方向被称为贝叶斯深度学习(Bayesian Deep Learning /BDL),它包括传统的贝叶斯方法、以概率推断(probabilistic inference)为主的深度学习方法,以及二者的交叉,因此它既有贝叶斯本身的可解释性,可以从少量数据中学习,又有深度学习强大的拟合能力。

近年来,朱军重点关注对抗攻击鲁棒性以及不完全信息下的决策问题,在探索的过程中,仍有三个问题要解决:

  • 如何融合二者的互补优点,发展统一的概率模型框架?
  • 如何应对高度非线性变换,发展高效准确的推断算法?
  • 如何自动 / 半自动地对模型进行可微分的概率编程?

从 2014 年起,机器学习界开始进行一些探索,朱军团队开发的「珠算」是最早的深度概率编程库之一。和现有的主要为监督式任务设计的深度学习库不同,珠算的特点是其在很大程度上根基于贝叶斯推理,因此支持各种生成模型:既包括传统的分层贝叶斯模型,也有最近的深度生成模型。

2017 年 5 月,朱军团队正式开源了「珠算」,研究者可以利用珠算强大的拟合能力和多 GPU 训练进行深度学习,同时可以用概率模型为复杂世界建模,开发无标注数据,根据贝叶斯推断的原则处理不确定性。「珠算」是首个与 TensorFlow 无缝衔接的概率编程库,全面支持 MindSpore、飞桨、Jittor、OneFlow 等国产平台。

目前,珠算已经支持变分和蒙特卡洛两大类的方法,包括了现在最主流的推理算法。珠算里也有很多已经实现的模型,比如像比较经典的 topic model、矩阵分解、贝叶斯高斯过程、卷积操作等等。新版本的珠算平台还加入了更多的模型实例,主题模型、概率矩阵分解;变分自编码器、贝叶斯神经网络、深度信念网络以及高斯过程。开发者和研究者们可以在珠算平台上使用已有的实现模型,并在此基础上开发新的模型。

朱军总结说,安全可靠的人工智能还需要从技术上进行突破,但也需要关注数据安全、系统安全。要想打造负责任的人工智能技术和应用,仍需群策群力和产学研用的深度合作。

清华大学朱军:发展安全可靠的AI,为什么依旧任重道远?相关推荐

  1. 【干货】百度联合清华大学发布国内首个基于AI实践的《产业智能化白皮书》(附报告全文)...

    来源:百度AI 在4月9日举行的"百度大学 Alpha 学院首期学员毕业典礼"上,百度联合清华大学发布国内首个基于 AI 实践的行业重磅报告,<产业智能化白皮书--人工智能产 ...

  2. 清华大学成立人工智能班 中国高校AI布局大盘点!

    清华大学成立人工智能班 中国高校AI布局大盘点! 摘要 近日,在清华大学校园开放日当天,清华大学宣布新增设"人工智能学堂班",拟招收30人!在北京大学2019年的招生亮点中:启动& ...

  3. AI TIME 走进企业 | 携手清华大学佛山先进制造研究院走进AI企业

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 撰写脚本.创作小说.编写代码,回答问题...,几乎无所不能的ChatGPT成了这几个月热搜榜上的常客,随着ChatGPT火爆全球,人工智 ...

  4. 世界人工智能融合发展大会开幕 山东AI产业未来可期

    11月19-20日,以"动能焕新·智慧融合"为主题的世界人工智能融合发展大会在山东济南隆重召开.大会由工业和信息化部.中国工程院.山东省人民政府指导,山东省工业和信息化厅.山东省教 ...

  5. Domain Specific Compiling: 领域编译器发展的前世今生 • 面向AI的编译技术

    from: 领域编译器发展的前世今生 • 面向AI的编译技术 作者简介: 张朔铭,博士研究生,正在中国科学院计算技术研究所崔慧敏研究员指导下攻读计算机系统结构博士学位,目前主要的研究方向是AI编译. ...

  6. 清华大学朱军详解珠算:贝叶斯深度学习的GPU库(附视频)

    5 月 27-28 日,机器之心在北京 898 创新空间顺利主办了第一届全球机器智能峰会(GMIS 2017).中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃为大会做了开幕式致辞.大 ...

  7. AI 技术发展飞快,高校 AI 教师的知识储备能满足学生旺盛的求知欲吗?

    2019 年,AI 技术以惊人的速度发展:2020 年,AI 技术成熟的时机已经到来,随之而来的,是越来越旺盛的 AI 人才需求. 近日,国家正式发布了一份<2020 年人工智能产业人才发展报告 ...

  8. 专访 | 清华大学朱军:深度学习“盛行”_传统方法何去何从?

    朱军博士是清华大学计算机系长聘副教授.智能技术与系统国家重点实验室副主任.卡内基梅隆大学兼职教授.2013年,入选IEEE Intelligent Systems的"人工智能10大新星&qu ...

  9. 北京明确AI发展时间表:现有AI企业400家,2020年达世界先进水平 | 聚焦

    ▼ 大型年度AI人物评选--2017中国AI英雄风云榜榜单评选出了年度技术创新人物TOP 10:商业创新人物TOP 10,获取完整榜单请关注网易智能公众号(ID:smartman163),回复关键词& ...

最新文章

  1. sklearn GBDT(梯度下降树)模型使用RandomSearchCV获取最优参数及可视化​​​​​​​
  2. 【效率工具】Linux服务器终端MobaXterm
  3. vbyone接口引脚定义_一文了解A、B、C、D、E 5 种HDMI接口类型!网友:今天总算明白了...
  4. The DVMM Lab at Columbia University
  5. 操作系统实验2—实现动态分区分配模拟程序
  6. EJS学习(二)之语法规则上
  7. 项目实例改编:利用structs2的action 实时显示图片、pdf和其他内容的框架抽取。(转)...
  8. 什么意思是谁_舔狗是什么意思?如果不是真的喜欢谁又愿意做舔狗呢出处?
  9. php refcount,php的函数的形参refcount为何要加2
  10. python动态创建字典_如何在Python中创建动态命名字典?
  11. webservice 参数为xml_CXF-web service之集大成者,想要学好web service,必须会
  12. 李宏毅机器学习——深度学习入门
  13. laravel mysql rand_Laravel-雄辩或流利的随机行
  14. Ubuntu 18.04修改默认源为国内源
  15. 蓝桥杯官网练习系统基础练习(十一)
  16. 【史上最全】数据分级分类标准、指南和模板
  17. H: Yet Another Crosses Problem
  18. 基于STM32F103C6T6HAL库控制SG90舵机
  19. php mocking,测试模拟器 Mocking
  20. 【OpenCV 4】图像像素的归一化

热门文章

  1. EntityFramework之领域驱动设计实践(十)(转)
  2. 数据库设计和管理规范
  3. 用Python解“两个数的简单计算器”题
  4. linux 查看进程端口_如何简单有效的查看windows进程使用了哪些端口
  5. suse卸载自带java_在openSUSE 13.1下安装卸载openjdk以及Oracle JDK
  6. linux6 yum安装mysql_linux CentOS6.5 yum安装mysql5.6
  7. mysql --initalize_MySQL初始化设置
  8. 机器学习(四)——模型调参利器 gridSearchCV(网格搜索) scoring的
  9. 清华北大浙大大学开放课程
  10. numpy.argwhere 返回的为索引值的array