深度强化学习（资源篇）（更新于2020.11.22）

理论

项目

北航与第四范式团队KDD Cup RL Track冠军方案：解密共享出行场景中的优化问题
夺魁NeurIPS 2020电网调度大赛，百度PARL实现NeurIPS强化学习竞赛三连冠
PaddlePaddle版Flappy-Bird—使用DQN算法实现游戏智能
不吃蘑菇，不捡金币，我用强化学习跑通29关马里奥，刷新最佳战绩
机器人强化迁移学习指南：架设模拟和现实的桥梁
GitHub万星资源：强化学习算法实现，教程代码样样全，还有详细学习规划
深度强化学习入门难？这份资料手把手教会你
AI交易系统建设指南：如何使用强化学习建立可盈利的算法交易系统
德州农工大学开源RLCard：帮你快速训练会斗地主的智能体
不需要借助GPU的力量，用树莓派也能实时训练agent玩Atari
谷歌、DeepMind 联合发布 Dreamer：性能远超 PlaNet，数据效率创新高
强化学习常用算法+实际应用，必须get这些核心要点！
干货 | 深度强化学习实现全家桶
百度PARL再度夺冠NeurIPS仿生人挑战赛：强化学习控制的流畅行走
IJCAI 2019 | 有趣！这是一篇玩倩女幽魂的多智能体强化学习研究
6行代码搞定基本的RL算法，速度围观Reddit高赞帖
快速上手深度强化学习？学会TensorForce就够了
仅需2小时学习，基于模型的强化学习方法可以在Atari上实现人类水平
用深度Q网络玩电子游戏
DeepMind让AI组队踢足球学会“合作”，并开源训练环境
Github项目推荐 | GtS 仿真泛化：将仿真和真实数据集成到基于视觉的自主飞行深度强化学习中
围棋 AI ELF OpenGo 迎来更新，另有田渊栋呈上开源项目的详细解读
详解深度强化学习展现TensorFlow 2.0新特性(代码)
如何在TensorFlow 2.0中构建强化学习智能体
开源啦：连DeepMind也捉急的游戏，OpenAI给你攻破第一关的高分算法
如何保持运动小车上的旗杆屹立不倒？TensorFlow利用A3C算法训练智能体玩CartPole游戏
基于TensorFlow的强化学习，在《毁灭战士》游戏里训练Agent
<博客 | 任务型对话系统公式建模&&实例说明

/模型框架/

谷歌发布最新元学习框架「DVRL」，用强化学习量化模型中每个数据点的价值
诺亚高性能强化学习库“刑天”开源(文末彩蛋)
谷歌重磅开源RL智能体Dreamer，仅靠图像学习从机器人到Atari的控制策略，样本效率暴增20倍
DeepMind发布Acme，高效分布式强化学习算法框架轻松编写RL智能体
DeepMind重磅开源强化学习框架！覆盖28款游戏，24多个算法
DeepMind开源强化学习环境，灵活可配置，计算资源有限的小型实验室也能用
谷歌造了个虚拟足球场，让AI像打FIFA一样做强化学习训练丨开源有API
用C++实现强化学习，速度不亚于Python，这里有个框架可用
DeepMind开源强化学习游戏框架，25款线上游戏等你来挑战
清华大学人工智能研究院开源“天授”强化学习平台
DeepMind发布神经网络、强化学习库，网友：推动JAX发展
17种深度强化学习算法用Pytorch实现
清华本科生开发强化学习平台「天授」：千行代码实现，性能吊打国外成熟平台，刚刚开源
谷歌推出分布式强化学习框架SEED，性能“完爆”IMPALA，可扩展数千台机器，还很便宜
从“小”培养AI安全意识：OpenAI开源最新强化学习训练工具，安全约束自由定制，开箱即用
集合三大类无模型强化学习算法，BAIR开源RL代码库rlpyt
花最少的钱，训超6的机器人：谷歌大脑推出机器人强化学习平台，硬件代码全开源
卡牌游戏八合一，华人团队开源强化学习研究平台RLCard
谷歌发布一个新的强化学习环境：Google Research Football
OpenAI重磅发布Nueral MMO：一个CPU支撑大量智能体同时在线
3D 环境训练智能体时代来临？Facebook 开源仿真 3D 环境平台 Habitat
谷歌开源强化学习深度规划网络 PlaNet
夺魁NeurIPS 2018强化学习大赛，百度正式发布RL模型库和算法框架PARL
DeepMind 开源TRFL，又一个强化学习复现、创新好帮手
强化学习工具Horizon开源：Facebook曾用它优化在线视频和聊天软件
Facebook开源首个适应大规模产品的强化学习平台Horizon，基于PyTorch 1.0
探索新的强化学习算法遇到困难？不怕不怕，谷歌为你带来「多巴胺」
「多巴胺」来袭！谷歌推出新型强化学习框架Dopamine
TensorFlow Agents日前开源，轻松在TF中构建并行强化学习算法

资讯

【重磅整理】提前看287篇ICLR-2021 "深度强化学习"领域论文得分汇总列表
重磅整理】180篇NIPS-2020顶会《强化学习领域》Accept论文大全
ICML 2020|华为诺亚方舟8篇论文入选，多智能体强化学习成热点
谷歌大脑和DeepMind联合发布离线强化学习基准，将各种RL研究从线上转为线下
首家强化学习大规模落地工业应用，快手是如何做到的？
文末送书 | 你了解强化学习吗？强化学习研究什么？
百度PARL再度夺冠NeurIPS仿生人挑战赛：强化学习控制的流畅行走
是否要入坑强化学习，看了这篇文章再说
DeepMind大放送：开放4个多物体表征学习数据集，还有一篇智能体新研究
MIT用深度强化学习控制麻醉患者的无意识状态，获2020AI医学国际会议最佳论文
是时候抄底了？强化学习炒股，走向人生巅峰（或倾家荡产）
7 Papers & Radios | DeepMind等用AI小鼠探索神经网络；伯克利数据增强RL实现SOTA
一周AI最火论文 | 使用图形界面就能搭建的强化学习模型
6小时完成芯片布局，谷歌用强化学习助力芯片设计
“国产莱卡狗”走进谷歌AI Lab，强化学习算法让机器狗漫步溜达似真狗
FIFA变身AI主场：谷歌推出强化学习“足球引擎”完爆人类玩家
人类一败涂地？DeepMind推出Agent57，在所有雅达利游戏上超越人类玩家
《强化学习》可复现性？稳健性？Joelle Pineau无情揭示问题
强化学习大佬, TRPO/GAE/PPO提出者 || John Schulman谈：“如何做科研？”
观点 | 深度强化学习这块，有人说我们已经触顶了……
机器人学前班助力机器人简单快速学习，给予强化学习的自动驾驶策略
从头开始强化学习
如何利用强化学习设计出更好的火箭发动机
O’Reilly纽约AI Conference“游记”：AI应用加速落地，强化学习更受关注
观点 | 我在谷歌大脑工作的 18 个月中，是怎样研究强化学习的？
Facebook在加拿大成立AI实验室，专注强化学习研究
一图尽展视频游戏AI技术，DQN无愧众算法之鼻祖
使用强化学习训练机械臂完成人类任务
《经济学人》万字长文：DeepMind和谷歌的AI拉锯战
深度强化学习新趋势：谷歌如何把好奇心引入强化学习智能体
业界 | BAIR讲述如何利用深度强化学习控制灵活手
华为 AAAI 2019 入选论文出炉，两篇论文都是强化学习相关
谷歌和UC伯克利的新式Actor-Critic算法快速在真实世界训练机器人
新的一年，DeepMind准备让AI学会「放烟花」
真的超越了波士顿动力！深度强化学习打造的 ANYmal 登上 Science 子//刊
用AI设计微波集成电路，清华大学等提出深度强化学习方法RINN
EMNLP 2018 | 用强化学习做神经机器翻译：中山大学&MSRA填补多项空白
你需要新的好奇心方法克服强化学习中的拓展症
超越DQN和A3C：深度强化学习领域近期新进展概览
谷歌大脑用强化学习为移动设备量身定做最好最快的CNN模型

/课程、书籍、文档/
外网最火的RL课更新！GitHub标星2.5k，文档视频实操全套配齐
UC伯克利出品，2020深度强化学习最新课程已上线
2019 UC 伯克利 CS285 深度强化学习课程即将上线；深度学习局限性的反思，Yoshua Bengio NeurIPS 2019 演讲 PPT 下载
B站学强化学习？港中文周博磊变身up主，中文课程已上线
UC伯克利最新深度强化学习课程上线，视频已上传到B站
斯坦福2019强化学习课程完结，讲义、PPT、视频已提供下载
B站教学，全中文课程：港中文周博磊强化学习课程完结
2小时学强化学习？DeepMind 首席科学家、原牛津大学教授Nando教程来了
Bengio、Sutton的深度学习&强化学习暑期班又来了，2019视频已放出
赠书：Sutton老爷子经典之作，《强化学习》中文第2版
资料 | 强化学习精要：核心算法与TensorFlow 实现
博客 | ICML 2019 深度强化学习文章汇总
博客 | 过去10年NIPS顶会强化学习论文（100多篇）汇总（2008-2018年）
【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载
Github项目推荐 | 最优控制、强化学习和运动规划等主题参考文献集锦
Github项目推荐 | 中文整理的强化学习资料（Reinforcement Learning）
资源|434页《python强化学习实践》（附 pdf 与完整代码）
2019年度最佳书单：深度学习+机器学习+强化学习
【干货】谷歌大脑：元学习最新进展与挑战（40 PPT下载）
<140页《深度强化学习入门》发布
DeepMind推出深度学习与强化学习进阶课程（附视频）
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
<伯克利CS294深度强化学习课程资料放出（PPT+录像）,
<重磅 | CS 294 2018 今日开课！双语字幕独家上线！
动态 | 从零开始快速入门深度强化学习，OpenAI 发布学习资源 Spinning Up
人人能上手：OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
MILA 2018夏季深度学习与强化学习课程资源大放送
《深度强化学习》手稿开放了！
OpenAI开课了！深度强化学习最全课程包，教程、代码、习题、文档一网打尽
从Zero到Hero，OpenAI重磅发布深度强化学习资源
MIT 6.S094· 深度增强学习 | 学霸的课程笔记，我们都替你整理好了

深度强化学习（资源篇）（更新于2020.11.22）相关推荐

必看！52篇深度强化学习收录论文汇总 | AAAI 2020
所有参与投票的 CSDN 用户都参加抽奖活动群内公布奖项,还有更多福利赠送来源 | 深度强化学习实验室(ID:Deep-RL) 作者 | DeepRL AAAI 2020 共收到的有效论文投稿超过 ...
30+博士、100+硕士整理的超全深度强化学习资源清单
作者 | Deep-RL 来源 | 深度强化学习实验室(ID:Deep-RL) 今天为大家推荐一个开源.开发的 Github 好项目<A Guide for Deep Reinforcement ...
从Zero到Hero，OpenAI重磅发布深度强化学习资源
https://zhuanlan.zhihu.com/p/49044306 https://spinningup.openai.com/en/latest/ 转载于:https://www.cnblo ...
中科院自动化所介绍深度强化学习进展：从AlphaGo到AlphaGo Zero
来源:德先生概要:2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果. 深度强化学习进展: 从AlphaGo ...
深度学习（三十九）——深度强化学习（2）概述, Deep Q-learning Network（1）
概述上图是深度强化学习的脉络图,参考文献中还有该领域的关键论文列表. 原图地址: http://louiskirsch.com/maps/reinforcement-learning 参考: htt ...
Deep Reinforcement Learning 深度增强学习资源
http://blog.csdn.net/songrotek/article/details/50572935 1 学习资料增强学习课程 David Silver (有视频和ppt): http:/ ...
【ML4CO论文精读】基于深度强化学习的组合优化问题研究进展(李凯文, 2020)
基于深度强化学习的组合优化研究进展本人研究方向(博士期间):多目标组合优化与决策研究--致力于多约束多目标多任务组合优化算法和多目标决策系统的研究与开发,以及多目标优化技术在一些工程实践中的应用. ...
AAAI 2020使用深度强化学习的MOBA游戏《Towards Playing Full MOBA Games with Deep Reinforcement Learning》打败王者荣耀顶尖选手
不知道你是否玩过王者荣耀,不知道你是不是经历过被人机疯狂怼在塔下强杀然后嘲讽你的经历?就,真说多了就是泪. 最近,NeurlPS2020会议收录了来自腾讯AI Lab的一篇强化学习的论文<Tow ...
【ICML2021】 9篇RL论文作者汪昭然：构建“元宇宙”和理论基础，让深度强化学习从虚拟走进现实...
深度强化学习实验室官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 来源:转载自AI科技评论作者 | 陈彩娴深度强 ...

深度强化学习（资源篇）（更新于2020.11.22）

深度强化学习（资源篇）（更新于2020.11.22）相关推荐

最新文章

热门文章