与6位图灵奖得主和100多位专家

共同探讨人工智能的下一个十年

长按图片或点击阅读原文,内行盛会,首次免费注册


2020年6月21-24日,第二届北京智源大会(官网:https://2020.baai.ac.cn)将邀请包括6位图灵奖获得者在内的上百位人工智能领袖,一起回顾过去,展望未来,深入系统探讨“人工智能的下一个十年”。本次大会将开设19个专题论坛,主题涵盖人工智能数理基础、自然语言处理、智能体系架构与芯片、人工智能伦理治理与可持续发展、机器学习、智能信息检索与挖掘、认知神经基础、机器感知、决策智能、AI医疗、AI创业、AI交通、AI+大数据+防疫、AI框架、图神经网络、知识智能、强化学习、青年科学家机器学习前沿,以及AI科技女性,遍历人工智能基础研究及创新应用,结合时局解析人工智能最新动态,探索未来发展方向。

我们将带你走进各个分论坛,领略嘉宾风采、洞悉前沿趋势。今天介绍的是将于6月23日上午举行的决策智能论坛。

论坛主题:决策智能

感知与决策一直是人工智能领域的两个关键问题,尤其是近五年来深度强化学习在视频游戏和棋类问题上展现出超越人类的最高水平,表明了人工智能在复杂问题上的强大决策能力。与此同时,近几年在诸如德州扑克、多人在线战术竞技游戏、星际争霸等多智能体问题上人工智能也表现出了相当高的决策性能。现实世界广泛存在多智能体系统,与单智能体相比,智能体数量的增长带来的群体效应要远超倍数增长关系。但与此同时带来的状态空间和动作空间的组合爆炸,限制了多智能体的决策智能。因此从理论、方法、架构、硬件、运算等角度推动多智能体强化学习的发展,提高大规模多智能体系统和群体系统的智能决策能力,是人工智能下一个十年的集中发展方向。

本论坛我们将会对当前人工智能领域决策智能的进展进行深入交流,探讨未来发展趋势。我们有幸邀请了中科院自动化所的徐波所长作为分论坛主席,基于其从事人工智能研究二十多年的经验,点评各位专家学者的报告内容。

  • 清华大学张崇洁将会分享多智能体系统协同问题的挑战和最新研究成果;

  • OpenAI吴翼将会展示在捉迷藏问题上人工智能涌现出的各种复杂策略;

  • 北京大学卢宗青将会展现交流和通信在多智能体合作上的作用;

  • 启元世界袁泉将会带来他们“星际指挥官”在达到人类宗师水平背后的训练云平台和关键技术;

  • 中科院自动化所赵冬斌将会分享深度强化学习从仿真到实体应用的初步探索,包括机器人、智能驾驶、博弈对抗等方面的研究成果。

决策智能论坛议程

论坛主席

徐波 

中科院自动化所所长、中国科学院大学人工智能学院院长。兼任国家新一代人工智能战略咨询委员会委员,中国人工智能产业发展联盟副理事长,中国人工智能技术标准总体组副组长等。北京智源人工智能研究院理事。长期从事智能语音处理和人工智能技术的研究和应用。近年围绕听觉模型和类脑认知计算等进行前瞻性探索。

演讲主题及嘉宾介绍

1. Efficient Collaborative Multi-Agent Reinforcement Learning

议题简介:Due to the complex and combinatorial nature of real-world applications, deep reinforcement learning is shifting from single-agent to multi-agent settings. This talk will discuss challenges in cooperative multi-agent reinforcement learning and present approaches that exploit common interaction structures and enable efficient learning for multi-agent collaboration.

演讲嘉宾:张崇洁

Assistant Professor in the Institute for Interdisciplinary Information Sciences at Tsinghua University. Before joining the faculty, he was a postdoctoral associate in the Computer Science and Artificial Intelligence Lab (CSAIL) at MIT. He received his Ph.D. in Computer Science from the University of Massachusetts at Amherst. His research interests span deep reinforcement learning, multi-agent systems, robotics, and their interps.

2. Emergent Tool Use From Multi-Agent Autocurricula

议题简介:We show that through deep reinforcement learning and simple hide-and-seek objectives, simulated agents co-evolve jointly in an open-ended physical environment and create an autocurriculum inducing multiple distinct rounds of emergent strategies, many of which require sophisticated tool use and coordination resembling human beings. We believe such an automatic evolution procedure provides evidence towards Artificial General Intelligence (AGI). OpenAI blog about this work: https://openai.com/blog/emergent-tool-use

演讲嘉宾:吴翼

Researcher in the multi-agent team at OpenAI Inc. and will join the institute of interdisciplinary information sciences (IIIS), Tsinghua University, as an assistant professor in 2020 fall. He earned his PhD degree from UC Berkeley under the supervision of Prof. Stuart Russell. His research focuses on improving the generalization ability of artificial agents. He is broadly interested in a variety of topics in AI, including deep reinforcement learning, multi-agent systems, natural language understanding and probabilistic programming. His work, Value Iteration Network, won the only best paper award at NeurIPS 2016.

3. 通信驱动的合作学习

议题简介:在自然界中,交流与合作密切相关,且可能源于合作。例如,黑长尾猴可以发出不同的声音来提醒族群中其他成员附近的不同掠食者。同样的,交流/通信对于多智能体合作也至关重要。如何才能通过智能体通信实现高效的合作?本报告介绍对这个问题的一些探索和相关研究成果。

演讲嘉宾:卢宗青

北京大学计算机系研究员、博士生导师。担任Workshop on Network Intelligence 2020会议主席,NeurIPS、IJCAI、INFOCOM等国际会议的程序委员会委员,Nature Machine Intelligence等期刊审稿人。目前主要研究领域为(多智能体)深度强化学习、边缘智能系统。

4. StarCraft Commander: Grandmaster level Reinforcement Learning Agent Trained from Hyper Efficient AI Platform

议题简介:《星际争霸》是有史以来最成功的即时策略游戏,也是人工智能研究领域的重大挑战之一。它蕴含了长期策略规划、非完全信息博弈、超大规模动作空间等复杂决策问题,是研究深度学习、强化学习、分布式训练云平台等智能体关键技术的绝佳试炼场。2019年DeepMind训练出了能够击败99.8%人类选手的人工智能体AlphaStar,但所用算力巨大。启元世界经过近3年的努力,在AlphaStar近1%的算力上成功训练了”星际指挥官”智能体,并达到了人类宗师选手水平,使其商业应用成为可能。本次报告将分享“星际指挥官“背后的工业级大规模智能体训练云平台以及智能体演化计算等关键技术。

演讲嘉宾:袁泉

启元世界(inspir.ai)创始人兼CEO,前阿里认知计算实验室资深总监,淘宝推荐算法创始人,曾获双11 CEO特别贡献奖。加入阿里之前,袁泉是IBM中国研究院的研究员,从事个性化推荐等智能算法的研究,在ACM RecSys、SIGKDD等顶级会议发表文章和专利数十篇。目前主要研究方向包括深度强化学习、通用决策智能及智能体人机交互技术。

5.深度强化学习-从仿真到实体

议题简介:深度强化学习方法在棋牌类、视频游戏等领域取得了人工智能里程碑式的成果,在实际系统的应用还刚刚起步。本报告给出深度强化学习方法从仿真到实体应用的初步探索,包括机器人、智能驾驶、博弈对抗等方面的研究成果。

演讲嘉宾:赵冬斌

中国科学院自动化研究所研究员、中国科学院大学岗位教授、博士生导师、IEEE Fellow。任计算智能领域权威期刊IEEE TNNLS (Trans. Neural Networks and Learning Systems), IEEE TCyb (Trans. Cybernetics), IEEE TAI (Trans. Artificial Intelligence), IEEE CIM (Computational Intelligence Magazine)编委等,任IEEE TNNLS、IEEE CIM等国际期刊特邀编辑10余次。任权威国际会议的程序委员会主席(IJCNN 2019)等多次。任IEEE计算智能学会杰出讲座计划主席,曾任技术发展战略规划委员会主席,北京分会主席、自适应动态规划和强化学习技术委员会主席等。出版学术著作5本、译著1本。在国内外重要期刊会议上发表论文300余篇(SCI收录90余篇)。获北京市科学技术奖等省部级奖励6项等,获中国智能车未来挑战赛2项第一名等10余项竞赛奖励,获IEEE Trans. Cognitive Development Systems优秀论文奖等10项论文奖励。目前主要研究方向为计算智能、深度强化学习、自适应动态规划理论和方法,及其在智能车辆、机器人、自动机器学习、智能交通、能源系统等方面的应用。

- 点击阅读原文,内行盛会,首次免费注册-

论坛报名 | 从捉迷藏、星际争霸到新一代人工智能:多智能体深度强化学习的理论与实践...相关推荐

  1. 线下报名 | YOCSEF TDS:深度强化学习的理论、算法与应用

    时间:7月29日9:00-17:20 地点:北京中科院计算所,一层/四层报告厅(暂定) 报名方式:1.报名链接:http://conf2.ccf.org.cn/TDS  2.点击文末阅读原文报名  3 ...

  2. 面向星际争霸:DeepMind 提出多智能体强化学习新方法

    不久前 DeepMind 强化学习团队负责人.AlphaGo 项目负责人现身 Reddit 问答,其中一个问题是「围棋和星际争霸 2 哪个更难?潜在技术障碍是什么?」近日,DeepMind 发表论文, ...

  3. 【人工智能】院士谈新一代人工智能五大智能方向

    来源:德先生(D-Technologies) FITEE"人工智能2.0"专题导读 国务院近日印发<新一代人工智能发展规划>,提出了面向2030年我国新一代人工智能发展 ...

  4. 多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏

    大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...

  5. AlphaStar的游戏——星际争霸2 AI综述

    两天前,DeepMind直播展示了他们星际2AI的最新进展.AI名叫Alphastar,它在与两位职业选手的比赛录像中获得了全胜,其中一位还是世界前10的顶尖神族选手Mana.在与Mana最后一场万众 ...

  6. 麻省、北大、清华等顶尖高校与企业 20 位强化学习专家齐聚,RLChina 2021 强化学习暑期课免费报名啦!

    2016 年,AlphaGo 宛然横空出世,凭借精湛的棋艺接连战胜韩国围棋九段棋手李世石.中国围棋九段棋手柯洁之后,更是以 60 局无败绩的成绩轰动整个科技圈,人工智能的新纪元也因此开启.站在技术角度 ...

  7. 麻省、北大、清华等顶尖高校与企业 20 位强化学习专家齐聚,RLChina 2021 强化学习暑期课免费报名啦!...

    2016 年,AlphaGo 宛然横空出世,凭借精湛的棋艺接连战胜韩国围棋九段棋手李世石.中国围棋九段棋手柯洁之后,更是以 60 局无败绩的成绩轰动整个科技圈,人工智能的新纪元也因此开启.站在技术角度 ...

  8. 《星际争霸II》AI机器人挑战顶级职业选手,你Pick谁?

    2020年6月21日下午2点,启元"星际指挥官"AI将迎战人类顶级职业选手,这将是全国首次现场直播星际AI与人类顶级职业选手的对战.其智能体训练云部署在滴滴云,利用滴滴云的底层计算 ...

  9. DeepMind科学家:AI对战《星际争霸》胜算几何?

    记者 | 周翔 AI科技大本营1月29日消息,在<麻省理工科技评论>与深科技举办的新兴科技峰会上,谷歌DeepMind科学家Oriol Vinyals在会上发表了主题为<AI对战星际 ...

最新文章

  1. SpringBoot实战(四)之使用JDBC和Spring访问数据库
  2. linux g 手动安装,linux上oracle11g 手动安装
  3. 1、spring的IOC
  4. webpack 合并压缩_webpack的运用
  5. C#LeetCode刷题之#234-回文链表(Palindrome Linked List)
  6. Maven-依赖调解/查看项目依赖了哪些包
  7. Java知识积累——参数个数可变的函数(Varargs)
  8. TiDB 源码阅读系列文章(二十)Table Partition
  9. UDP数据包的产生和发送
  10. 下载Google Play上面的应用
  11. 关于iPhone改变的一切,这也许是史上最详细的盘点
  12. php laravel框架笔记
  13. 吉利汽车、京东数科、盛美半导体……来了解下科创板排队的“高研值”企业...
  14. 数据库实验三:完整性语言实验
  15. 存储fc交换机配置小结
  16. 用Flink SQL流化市场数据2:盘中风险价值
  17. 利用swftools将pdf转换为swf小例
  18. Redis管道Pipelining原理详解
  19. 趣玩算法--OpenCV华容道AI自动解题
  20. 教师计算机培训网站,教师计算机培训材料..pdf

热门文章

  1. katalon进行app测试_使用Katalon Studio创建你的第一个API测试
  2. java pdf转swf_pdf转换成swf的代码
  3. tomcat 连接oracle重连,JSP+Tomcat连接Oracle数据库
  4. spi的dma方式前四个字节_UTF-16是固定两个字节长度吗?
  5. python字符串压缩字_gzip如何在Python中压缩字符串?
  6. phpmyadmin执行mysql语句_如何在phpMyAdmin中执行sql语句
  7. 个人网站第四次改版了
  8. 中介者模式 调停者 Mediator 行为型 设计模式(二十一)
  9. Linux系统设置全局的默认网络代理
  10. java产生随机数(学习)