关注上方深度学习技术前沿”,选择“星标公众号”

资源干货,第一时间送达!

人工智能是21世纪最激动人心的技术之一。人工智能,就是像人一样的智能,而人的智能包括感知、决策和认知(从直觉到推理、规划、意识等)。其中,感知解决what,深度学习已经超越人类水平;决策解决how,强化学习在游戏和机器人等领域取得了一定效果;认知解决why,知识图谱、因果推理和持续学习等正在研究。强化学习,采用反馈学习的方式解决序贯决策问题,因此必然是通往通用人工智能的终极钥匙。我特别喜欢强化学习,深深被其框架所吸引,智能体通过与环境交互来成长,这不就是生命的进化规律嘛!个人作为一名AI独立研究员,一路也是通过知乎、b站、GitHub、公众号和各类博客学习过来,非常感谢网络时代大家的分享,同时将自己在强化学习方面的经验总结整理分享,既是方便自己学习,也希望能帮助一点刷到这条知乎的朋友们。当然,强化学习也面临很多问题,希望我们一起解决,让强化学习变得更好![1]

1. 视频(从入门到放弃)

1.1 腾讯_周沫凡_强化学习、教程、代码

  • https://www.bilibili.com/video/av16921335?from=search&seid=7037144790835305588

  • https://morvanzhou.github.io/

  • https://github.com/AndyYue1893/Reinforcement-learning-with-tensorflow 1.2 DeepMind_David Silver_UCL深度强化学习课程(2015)、PPT、笔记及代码

  • https://www.bilibili.com/video/av45357759?from=search&seid=7037144790835305588

  • https://blog.csdn.net/u_say2what/article/details/89216190

  • https://zhuanlan.zhihu.com/p/37690204 1.3 台大_李宏毅_深度强化学习(国语)课程(2018)、PPT、笔记

  • https://www.bilibili.com/video/av24724071?from=search&seid=7037144790835305588

  • http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS18.html

  • https://blog.csdn.net/cindy_1102/article/details/87904928 1.4 UC Berkeley_Sergey Levine_CS285(294)深度强化学习(2019)、PPT、代码

  • https://www.bilibili.com/video/av69455099?from=search&seid=7037144790835305588

  • http://rail.eecs.berkeley.edu/deeprlcourse/

  • https://github.com/berkeleydeeprlcourse/homework

2. 书籍

2.1 强化学习圣经_Rich Sutton_中文书、英文电子书、代码 ★★★★★(基础必读,有助于理解强化学习精髓)

  • https://item.jd.com/12696004.html

  • http://incompleteideas.net/book/the-book-2nd.html

  • https://github.com/AndyYue1893/reinforcement-learning-an-introduction

2.2 Python强化学习实战_Sudharsan Ravichandiran、代码 ★★★★★(上手快,代码清晰)

  • https://item.jd.com/12506442.html

  • https://github.com/AndyYue1893/Hands-On-Reinforcement-Learning-With-Python

2.3 强化学习精要_冯超 ★★★★(从基础到前沿,附代码)

  • https://item.jd.com/12344157.html

2.4 Reinforcement Learning With Open AI TensorFlow and Keras Using Python_OpenAI(注重实战)

  • https://pan.baidu.com/share/init?surl=nQpNbhkI-3WucSD0Mk7Qcg(提取码: av5p)

3. 教程

3.1 OpenAI Spinning Up英文版、中文版、介绍by量子位(在线学习平台,包括原理、算法、论文、代码)

  • https://spinningup.openai.com/en/latest/

  • https://spinningup.readthedocs.io/zh_CN/latest/index.html

  • https://zhuanlan.zhihu.com/p/49087870

3.2 莫烦Python( 通俗易懂)

  • https://morvanzhou.github.io/

4. PPT

4.1 Reinforcement learning_Nando de Freitas_DeepMind_2019

  • https://pan.baidu.com/s/1KF10W9GifZCDf9T4FY2H9Q

4.2 Policy Optimization_Pieter Abbeel_OpenAI/UC Berkeley/Gradescope

  • https://pan.baidu.com/s/1zOOZjvTAL_FRVTHHapriRw&shfl=sharepset

5. 算法

请问DeepMind和OpenAI身后的两大RL流派有什么具体的区别?

  • https://www.zhihu.com/question/316626294/answer/627373838 三大经典算法

5.1 DQN

Mnih. Volodymyr, et al. "Human-level control through deep reinforcement learning." Nature 518.7540 (2015): 529. (Nature版本)

  • https://storage.googleapis.com/deepmind-data/assets/papers/DeepMindNature14236Paper.pdf

5.2 DDPG

David. Silver, et al. "Deterministic policy gradient algorithms." ICML. 2014.

  • http://proceedings.mlr.press/v32/silver14.pdf

5.3 A3C

Mnih. Volodymyr, et al. "Asynchronous methods for deep reinforcement learning." International conference on machine learning. 2016.

  • https://www.researchgate.net/publication/301847678_Asynchronous_Methods_for_Deep_Reinforcement_Learning

6. 环境

6.1 OpenAI Gym

  • http://gym.openai.com/

6.2 Google Dopamine 2.0

  • https://github.com/google/dopamine

6.3 Emo Todorov Mujoco

  • http://www.mujoco.org/

6.4 通用格子世界环境类

  • https://zhuanlan.zhihu.com/p/28109312

  • https://cs.stanford.edu/people/karpathy/reinforcejs/index.html

7. 框架

7.1 OpenAI Baselines(代码简洁,使用广泛)

  • https://github.com/openai/baselines

7.2 百度 PARL( 扩展性强,可复现性好,友好)

  • https://github.com/paddlepaddle/parl

7.3 DeepMind OpenSpiel(仅支持Debian和Ubuntu,28种棋牌类游戏和24种算法)

  • https://github.com/deepmind/open_spiel

8. 论文

8.1 清华张楚珩博士 ★★★★★[2]

  • https://zhuanlan.zhihu.com/p/46600521 张楚珩:强化学习论文汇总

8.2 NeuronDance ★★★★

  • https://github.com/AndyYue1893/DeepRL-1/tree/master/A-Guide-Resource-For-DeepRL

8.3 paperswithcode ★★★★

  • https://www.paperswithcode.com/area/playing-games

  • https://github.com/AndyYue1893/pwc

8.4 Spinning Up推荐论文 ★★★★★

  • https://zhuanlan.zhihu.com/p/50343077

9. 会议&期刊

9.1 会议:AAAI、NIPS、ICML、ICLR、IJCAI、 AAMAS、IROS等

9.2 期刊:AI、 JMLR、JAIR、 Machine Learning、JAAMAS等

9.3 计算机和人工智能会议(期刊)排名

  • https://www.ccf.org.cn/xspj/rgzn/

  • https://mp.weixin.qq.com/s?__biz=Mzg4MDE3OTA5NA==&mid=2247490957&idx=1&sn=b9aa515f7833ba1503be298ac2360960&source=41#wechat_redirect

  • https://www.aminer.cn/ranks/conf/artificial-intelligence-and-pattern-recognition

10. 公众号

10.1 深度强化学习实验室 ★★★★★

10.2 机器之心 ★★★★★

10.3 AI科技评论 ★★★★

10.4 新智元 ★★★

11.知乎

11.1 用户

  • 许铁-巡洋舰科技(微信公众号同名)、Flood Sung(GitHub同名)

  • 田渊栋、周博磊、俞扬、张楚珩、天津包子馅儿、JQWang2048 及其互相关注大牛等

11.2 专栏

  • David Silver强化学习公开课中文讲解及实践(叶强,很经典)

  • 强化学习知识大讲堂(《深入浅出强化学习:原理入门》作者天津包子馅儿)

  • 智能单元(杜克、Floodsung、wxam,聚焦通用人工智能,Flood Sung:深度学习论文阅读路线图 Deep Learning Papers Reading Roadmap很棒)

  • 深度强化学习落地方法论(西交 大牛,实操经验丰富)

  • 深度强化学习(知乎:JQWang2048,GitHub:NeuronDance,CSDN:J. Q. Wang)

  • 神经网络与强化学习(《Reinforcement Learning: An Introduction》读书笔记)

  • 强化学习基础David Silver笔记(陈雄辉,南大,DiDi AI Labs)

12. 博客

12.1 草帽BOY

  • https://blog.csdn.net/u013236946/category_6965927.html

12.2 J. Q. Wang

  • https://blog.csdn.net/gsww404

12.3 Keavnn

  • https://stepneverstop.github.io/

12.4 大卜口

  • http://blog.otoro.net/

13. 官网

13.1 OpenAI

  • https://www.openai.com/

13.2 DeepMind

  • https://www.deepmind.com/

13.3 Berkeley

https://bair.berkeley.edu/blog/?refresh=1

作者简介:

岳博士,西交大博士研究生,研究多智能体协同控制领域。知乎:https://www.zhihu.com/people/du-li-ren-ge-41

长按,识别,加关注

你的关注,我们的热度,

我们一定给你学习最大的帮助!

深度强化学习入门到精通--资料综述相关推荐

  1. 【大全】深度强化学习入门到精通

    聚焦AI干货,关注:决策智能与机器学习 人工智能是21世纪最激动人心的技术之一.人工智能,就是像人一样的智能,而人的智能包括感知.决策和认知(从直觉到推理.规划.意识等).其中,感知解决what,深度 ...

  2. 《强化学习周刊》第26期:UCL UC Berkeley发表深度强化学习中的泛化研究综述、JHU推出基于强化学习的人工决策模型...

    No.26 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

  3. 用深度强化学习玩atari游戏_(一)深度强化学习·入门从游戏开始

    1.在开始正式进入学习之前,有几个概念需要澄清,这样有利于我们对后续的学习有一个大致的框架感 监督型学习与无监督型学习 深度强化学习的范畴 监督型学习是基于已有的带有分类标签的数据集合,来拟合神经网络 ...

  4. 【强化学习】深度强化学习入门介绍

    深度强化学习是一种机器学习,其中智能体(Agent,也翻译作代理)通过执行操作(Action)和查看结果(Reward)来学习如何在环境中采取最佳的动作或策略. 自 2013 年Deep Q-Lear ...

  5. 深度强化学习入门介绍

    深度强化学习是一种机器学习,其中智能体(Agent,也翻译作代理)通过执行操作(Action)和查看结果(Reward)来学习如何在环境中采取最佳的动作或策略. 自 2013 年Deep Q-Lear ...

  6. 深度强化学习入门:马尔可夫决策过程(井字棋案例理解)

    注:笔记 来自知乎文章 深度强化学习综述(上) Tips①:只是记录从这个文章学到的东西 Tips②:只摘选了文章中部分理论阅读整理 Tips③:重点是对文章中的一些公式进行理解,方便自己回顾 Tip ...

  7. 深度强化学习入门:用TensorFlow构建你的第一个游戏AI

    本文通过一种简单的 Catch 游戏介绍了深度强化学习的基本原理,并给出了完整的以 Keras 为前端的 TensorFlow 代码实现,是入门深度强化学习的不错选择. GitHub 链接:https ...

  8. 【论文笔记】基于深度强化学习的机器人操作行为研究综述

    目录 摘要 关键词 1 引言 2 概念和术语 2.1 深度学习 2.2 强化学习 2.2.1 强化学习算法原理 2.2.2 强化学习算法分类 1. 无模型(model-free)算法和基于模型(mod ...

  9. 深度强化学习入门-05DQN实现高速超车(复现 deeptraffic:MIT 6.S094: Deep Learning for Self-Driving Cars)

    总的来说问题还有许多,希望感兴趣的同学朋友多多交流. 最近对强化学习比较感兴趣,发现强化学习工作较多的地方是无人驾驶决策规划这一块,我自己对这方面也比较感兴趣,就想做一个超车模型,设计交互环境如下,让 ...

最新文章

  1. 计算机应用基础网络统考操作,全国网络统考《计算机应用基础》完整最新题库及答案[整理].pdf...
  2. 安装oracle到create inventory时卡住了怎么办_「推荐」wacom数位板怎么用?教你如何正确的安装数位板驱动...
  3. 京东API网关实践之路!
  4. 量子纠缠真的很怪异吗?
  5. Dremel - Interactive Analysis of WebScale Datasets
  6. C++ Primer 5th笔记(10)chapter10 泛型算法 :谓词
  7. css-如何对每行中最后一个元素删除边距?
  8. idea配置svn地址
  9. AHCI驱动下载与手动安装图解
  10. Vue3简单实现元素周期表
  11. 书摘—吃我吃我:38种改善情绪和恢复精力的神奇食材
  12. [Linux]history命令用法详解
  13. C++ 实现mystring类型
  14. flutter整合极光推送完美版
  15. 双十一第二波活动来了,酷客scrm助力商家大卖
  16. Windows Phone 游戏 Roll In The Hole 去除 XBL 服务
  17. 传奇服务器开区修改,怎么修改传奇登陆器开区时间提前?
  18. AI在零售业的五大应用场景:消费者喜欢苹果时,不要给他一箱梨
  19. 正方形里面两个扇形相交部分_边长为1的正方形内,两个扇形,一个半圆,求阴影面积....
  20. java oval 使用_java开源验证框架OVAL应用实例

热门文章

  1. CodeSmith 学习资料收集
  2. Radware负载均衡项目配置实战解析之四-VRRP双机配置与同步
  3. windows2003前言
  4. pytorch Bert 情感分类
  5. RemoveError: ‘requests‘ is a dependency of conda and cannot be removed from conda‘s operating envir
  6. pandas 字符串数据类型转换成数字型
  7. 一。深入了解JDK1.8 从Package java.io开始
  8. logback节点配置详解
  9. 打通新场景,源创计划第一弹!“悟道”大模型应用合作交流会
  10. 《预训练周刊》第8期:首个千亿中文大模型「盘古」问世、谷歌等提出视频音频文本转换器VATT...