人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远。要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进行互动,由此产生了人工智能的一个前沿研究领域:多智能体学习。

很多领域中都存在多智能体学习的问题,在这些问题中,多个智能体不仅能与环境相互作用,而且彼此相互作用,由此造成的复杂和多变也为研究带来了诸多挑战。多智能体学习在现实生活中有着广泛的应用,比如无人机群的控制、仓库机器人的合作、分布式传感器网络/交通的优化、机器竞标,等等。

课程介绍

本课程基于伦敦大学学院(UCL)计算机系2020-2021学年度课程Multi-agent Artificial Intelligence (20/21),主要介绍多智能体机器学习。课程将机器学习的研究与博弈论和经济学的研究相结合,包括博弈论、拍卖理论、算法机制设计、多智能体(深度)强化学习等主题,同时还将讨论相关的实际应用,包括在线广告、在线拍卖、生成模型的对抗训练、机器人规划,以及玩在线游戏的智能体。

本课程适合计算机科学以及机械和航空工程等专业的本科生、研究生,从事机器学习、多智能体协同控制等领域的工程技术人员。

本课程完全免费,为英文授课,与UCL授课进度同步,每周五更新。

讲师简介

汪军,伦敦大学学院(UCL)计算机系教授,阿兰·图灵研究所 Turing Fellow,华为诺亚方舟实验室决策推理首席顾问。主要研究智能信息系统,包括机器学习、强化学习、多智能体,数据挖掘、计算广告学、推荐系统等。已发表了 120 多篇学术论文,出版两本学术专著,多次获得最佳论文奖。

课程目录

一、博弈论基础介绍

1.1 博弈论的基本概念

1.2 纯策略纳什均衡

1.3 混合策略纳什均衡

1.4 纳什均衡的存在性证明

1.5 古诺双寡头模型

二、更多博弈形式

2.1 重复博弈(Repeated Games)

2.2 拓展形式的博弈(Extensive-form game)

2.3 位势博弈(Potential Game)

三、纳什均衡

3.1 零和博弈及纳什均衡计算

3.2 极大极小博弈(Minmax Game)介绍

3.3 纳什均衡的线性规划解法

3.4 线性互补问题

3.5 Lemke–Howson 算法求解线性互补问题

四、贝叶斯博弈与拍卖理论

4.1 贝叶斯博弈(Bayesian Game)

4.2 在线拍卖的设置与步骤

4.3 拍卖模式:一口价拍卖与密封式拍卖

4.4 竞价策略与纳什均衡

五、神经网络与深度学习

5.1 深度学习基础

5.2 词嵌入

5.3 深度神经网络层

5.4 卷积神经网络

5.5 循环神经网络

5.6 网络信息检索

5.7 表征学习

5.8 深度强化学习

六、基于值函数的单智能体强化学习

6.1 强化学习基础

6.2 Model-based 方法:马尔科夫决策过程,动态规划求解

6.3 Model-free方法:蒙特卡洛,时序差分,Q-learning

6.4 深度强化学习实例:Atari,Alpha Go

七、多智能体强化学习(一)

7.1 多智能体强化学习介绍及基本概念

7.2 值迭代与策略迭代

7.3 均衡学习:纳什-Q,Minmax-Q,Friend-Foe-Q

7.4 最佳对策:JAL与对手建模,梯度提升,Wolf-IGA

八、基于策略的单智能体强化学习

8.1 策略梯度

8.2 策略梯度理论证明

8.3 函数近似

九、多智能体强化学习(二)

9.1 策略预测的IGA

9.2 动态系统的梯度提升优化

9.3 虚拟博弈

9.4 理性学习

9.5 演化博弈论

9.6 复制动态方程

十、多智能体强化学习(三)

10.1 Emergent behaviours

10.2 智能体建模

10.3 多智能体通信

10.4 多智能体合作

10.5 Many-agent 学习

举报/反馈

ucl计算机教授汪军,UCL汪军教授开课:带你入坑多智能体机器学习(免费)!相关推荐

  1. ucl计算机教授汪军,UCL汪军教授:多智能体机器学习

    与UCL授课进度同步,每周五更新 人工智能已经在围棋.图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远.要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进 ...

  2. ucl计算机教授汪军,UCL多智能体机器学习课程上线,计算机系教授汪军主讲

    来源:机器之心 本文约1500字,建议阅读5分钟 本课程基于伦敦大学学院计算机系2020-2021学年度课程Multi-agent Artificial Intelligence (20/21),主要 ...

  3. 牛津教授吐槽DeepMind心智神经网络,还推荐了这些多智能体学习论文

    夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI DeepMind最近又有一篇论文刷了屏: 在Machine Theory of Mind中,DeepMind提出了"机器心智理论网 ...

  4. 计算机组装论文关于显示器,显示器参数扫盲—小白入坑篇

    显示器参数扫盲-小白入坑篇 2019-05-01 14:11:35 24点赞 103收藏 20评论 事情经历 上周六(2019年4月27日)在bilibili刷到一个组装台式机的视频,总的算下来花费小 ...

  5. ucl计算机教授汪军,AI特辑#2:对话UCL汪军教授,机器有意识吗

    嘉宾:汪军,UCL 计算机系教授,   MediaGamma 联合创始人, 阿兰·图灵研究所 Turing Fellow 主播:Linda 和汪教授很跨界的讨论了决策智能和多智体强化学习的应用, 机器 ...

  6. UCL 教授汪军:多智能体强化学习的两大挑战 | CCF-GAIR 2017

    2017 年 7 月 7 日,由中国计算机学会(CCF)主办,雷锋网(公众号:雷锋网)与香港中文大学(深圳)承办的 CCF - GAIR 大会,在深圳大中华喜来登酒店开幕.在 AI 学术前沿专场的第三 ...

  7. 计算机学院王春枝教授实验室,全国高等学校计算机科学与技术教学成果获奖证书.doc...

    全国高等学校计算机科学与技术教学成果获奖证书 全国高等学校计算机科学与技术教学成果获奖证书由教育部高等学校计算机科学与技术教学指导委员会和全国高等学校计算机课件评比评测委员会盖章,由教育部.科技部.人 ...

  8. 大连理工大学计算机学院院长,大连理工大学计算机学院姚念民教授团队最新成果被人工智能顶级期刊TNNLS录用...

    大连理工大学计算机学院姚念民教授团队在自然语言处理表示学习领域取得重要进展.课题组提出一种新颖的文本表示模型,在intrinsic和extrinsic的国际标准自然语言处理任务上取得领先性能.所撰写的 ...

  9. 武大教授计算机学院,武汉大学计算机学院董文永教授受邀到我院进行学术交流...

    武汉大学计算机学院董文永教授受邀到我院进行学术交流 发表时间:2019年11月29日 &nbsp&nbsp 作者:工程中心 &nbsp&nbsp阅读量:868 View ...

最新文章

  1. 使用git上传代码到github
  2. 企业服务内部接口校验方案
  3. PHPCMS 学习
  4. Git 添加到Git 仓库
  5. ofbiz修改mysql_如何将OFBIZG的默认数据库更改mysql的方法(只求参考 )
  6. java observer模式_Java观察者模式(Observer)详解及应用
  7. awk工具的简单使用
  8. 二分法查找 - python实现
  9. 查找算法(一)顺序查找
  10. Session优缺点
  11. linux内核包转发过程(三)NIC帧接收分析
  12. java低层源码_Java线程池及其底层源码实现分析
  13. Hbase之表的设计
  14. python百度地图显示路径_百度地图获取规划路径信息
  15. [英语阅读]你的英文名特别吗
  16. mybatis插入数据到数据库成功,数据库却没有数据
  17. 3DS Max 2014启动报错的解决方案
  18. 静态网页与动态网页的区别
  19. 金域医学:规模+技术,ICL领军者迈入新篇章
  20. 河南大学2019计算机专业录取分数线,河南大学优势热门专业分析及2019、2018、2017年各省录取分数线...

热门文章

  1. C语言strtok函数使用实例以及注意事项
  2. 100条令人啼笑皆非的幽默墓志铭
  3. 广州优漫动游公司:UI设计中的详情页怎么设计?
  4. 数位DP--由一道微软笔试题引起
  5. 8.0强行转换后变成了7_爱剪辑:如何把竖屏视频变成横屏
  6. 水仙花问题的两种解决方法
  7. mysql.lib 是mtd mdd_MTD/MT/MDD/MD以及LIB/DLL之间的一些联系和问题
  8. angular实现div盒子高度自适应
  9. 电商商城之分类实现(重点)
  10. 移动端、公众号、小程序pdf转图片,pdfh5.js