理论

1种策略就能控制多类模型,华人大二学生提出RL泛化方法,LeCun认可转发 | ICML 2020
AlphaGo原来是这样运行的,一文详解多智能体强化学习的基础和应用
【DeepMind总结】279页PPT总结"基于模型的强化学习方法"
探索(Exploration)还是利用(Exploitation)?强化学习如何tradeoff?
【总结】强化学习需要批归一化(Batch Norm)吗?
BAIR最新RL算法超越谷歌Dreamer,性能提升2.8倍
谷歌大脑提出并发RL算法,机器人也可以「边行动边思考」
概念深奥看不懂?一文读懂元学习原理
【72页理论综述】MARL: A Selective Overview of Theories and Algorithms
兼顾公平与效率?北大NeurIPS 19论文提出多智能体强化学习方法FEN
Salesforce开发「AI经济学家」,用强化学习设计税收策略
通用强化学习用算法发现算法:DeepMind 数据驱动「价值函数」自我更新,14款Atari游戏完虐人类!
征服强化学习! Google AI 如何用ConQUR算法解决强化学习在应用落地上的难题
Facebook推基于NetHack的深度强化学习利器,超轻量级架构性价比远超GPT-2和BERT
强化学习也能用attention,Google最新智能体可「疏忽性失明」更像生物
DeepMind最新力作:分布式强化学习框架Acme,智能体并行性加强
大脑也在用分布式强化学习?DeepMind新研究登上《Nature》
AAAI 2020 | 腾讯AI Lab:深度强化学习打王者荣耀SOLO职业玩家
华为诺亚ICLR 2020满分论文:基于强化学习的因果发现算法
谷歌大脑新研究:单一任务的强化学习遇瓶颈?是「灾难性遗忘」的锅!图灵奖得主Bengio参与
向前、向后、横着走,双足机器人Cassie,靠深度强化学习学会了走路丨论文
推特800赞,DeepMind强化学习综述:她可以很快,但快从慢中来
将离策略评估看作「分类」问题,谷歌提出新型强化学习模型选择方法OPC
让知识来指引你:序列推荐场景中以知识为导向的强化学习模型
协作多智能体强化学习中的回报函数设计
最新综述 | 强化学习中从仿真器到现实环境的迁移
鱼和熊掌如何兼得?基于强化学习的多尺度信息传播预测
多智能体强化学习(MARL)近年研究概览
谣言止于智者:基于深度强化学习的谣言早期检测模型
MSU最新《深度强化学习中的迁移学习》2020综述论文,22页pdf
【综述】多智能体强化学习算法理论研究
强化学习《奖励函数设计: Reward Shaping》详细解读
漫谈强化学习中的引导搜索策略
田渊栋从数学上证明ICLR最佳论文“彩票假设”,强化学习和NLP也适用
CVPR 2020 | 基于多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准
如何解决稀疏奖励下的强化学习?
ICLR2020 || 106篇深度强化学习顶会论文汇总
前沿技术 || UC Berkeley开源RAD来改进强化学习算法
加速RL探索效率,CMU、谷歌、斯坦福提出以弱监督学习解纠缠表征
强化学习如何使用内在动机?
边做边思考,谷歌大脑提出并发RL算法,机械臂抓取速度提高一倍!
除了网红,强化学习也能带货?
David Sliver || 2020年最新讲解AlphaGo, AlphaZero and DeepRL
博士万字总结 || 多智能体强化学习(MARL)大总结与论文详细解读
谷歌发布离线强化学习新范式,克服RL智能体只能在线训练难题,训练集相当于200多个ImageNet
谷歌推出全新强化学习智能体,1秒处理240万帧大幅超越IMPALA
霸榜马里奥赛车,谷歌将神经进化引入自解释智能体,强化学习训练参数锐减1000倍
“事后诸葛亮”经验池:轻松解决强化学习最棘手问题之一:稀疏奖励
顶会论文 || 65篇"IJCAI"深度强化学习论文汇总
强化学习之路——清华博士后解读83篇文献,万字长文总结
2019年深度强化学习十大必读论文!DeepMind、OpenAI等上榜
超有趣!LSTM之父团队最新力作:将强化学习“颠倒”过来
<八千字长文深度解读,迁移学习在强化学习中的应用及最新进展
获顶会最佳论文,天津大学等用强化学习寻找游戏bug
通往量子霸权之路:谷歌用强化学习优化量子门控制策略
<ICML 2019 | 强化学习用于推荐系统,蚂蚁金服提出生成对抗用户模型
学界 | 如何得到稳定可靠的强化学习算法?微软两篇顶会论文带来安全的平滑演进
学界 | 让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法
<从认知学到进化论,详述强化学习两大最新突破
<谷歌的 PlaNet 强化学习网络
<谷歌提出强化学习新算法SimPLe,模拟策略学习效率提高2倍
DeepMind综述深度强化学习中的快与慢,智能体应该像人一样学习
<ICLR 2019 | 骑驴找马:利用深度强化学习模型定位新物体
DeepMind发布新奖励机制:让智能体不再“碰瓷”
Pieter Abbeel:深度强化学习加速方法
从虚拟到现实,北大等提出基于强化学习的端到端主动目标跟踪方法
DeepMind提出关系RNN:构建关系推理模块,强化学习利器
AAAI 2019 | 基于分层强化学习的关系抽取
动态 | 谷歌 AI 最新博文:视频模型中的模拟策略学习
PARL源码走读:使用策略梯度算法求解迷宫寻宝问题
在线元学习:通过持续元学习解决传统机器学习方式的致命不足
强化学习中,如何从稀疏和不明确的反馈中学习泛化
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AAAI 2019论文解读:机器人和认知学习
一行代码搞定 Scrapy 随机 User-Agent 设置
让智能体主动交互,DeepMind提出用元强化学习实现因果推理
<效率提高50倍!谷歌提出从图像中学习世界的强化学习新方法
<用于深度强化学习的结构化控制网络(ICML 论文讲解)
强化学习基础-对偶梯度上升
<强化学习基础 - 共轭梯度
<量化深度强化学习算法的泛化能力
<让机器帮你做决策!强化学习在智能交互搜索的应用分享
<深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)
<深度强化学习从入门到大师:简单介绍A3C (第五部分)
<深度强化学习从入门到大师:以 Cartpole 和 Doom 为例介绍策略梯度 (第四部分)
<深度强化学习从入门到大师:进一步了解深度Q学习(第三部分 - 下)
<深度强化学习从入门到大师:以Doom为例一文带你读懂深度Q学习(第三部分 - 上)
<深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)
<深度强化学习从入门到大师:简介篇(第一部分)
<学习何时做分类决策,深度好奇提出强化学习模型Jumper
<深度强化学习中的好奇心
<NIPS 2018 | Spotlight论文:凭借幻想的目标进行视觉强化学习
<伯克利、OpenAI等提出基于模型的元策略优化强化学习
<BAIR讲述如何利用深度强化学习控制灵活手
<自学习 AI 智能体第二部分:深度 Q 学习
<自学习 AI 智能体第一部分:马尔科夫决策过程
<滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型
<澳门大学讲座教授陈俊龙:从深度强化学习到宽度强化学习:结构,算法,机遇及挑战

项目

北航与第四范式团队KDD Cup RL Track冠军方案:解密共享出行场景中的优化问题
夺魁NeurIPS 2020电网调度大赛,百度PARL实现NeurIPS强化学习竞赛三连冠
PaddlePaddle版Flappy-Bird—使用DQN算法实现游戏智能
不吃蘑菇,不捡金币,我用强化学习跑通29关马里奥,刷新最佳战绩
机器人强化迁移学习指南:架设模拟和现实的桥梁
GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划
深度强化学习入门难?这份资料手把手教会你
AI交易系统建设指南:如何使用强化学习建立可盈利的算法交易系统
德州农工大学开源RLCard:帮你快速训练会斗地主的智能体
不需要借助GPU的力量,用树莓派也能实时训练agent玩Atari
谷歌、DeepMind 联合发布 Dreamer:性能远超 PlaNet,数据效率创新高
强化学习常用算法+实际应用 ,必须get这些核心要点!
干货 | 深度强化学习实现全家桶
百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走
IJCAI 2019 | 有趣!这是一篇玩倩女幽魂的多智能体强化学习研究
6行代码搞定基本的RL算法,速度围观Reddit高赞帖
快速上手深度强化学习?学会TensorForce就够了
仅需2小时学习,基于模型的强化学习方法可以在Atari上实现人类水平
用深度Q网络玩电子游戏
DeepMind让AI组队踢足球学会“合作”,并开源训练环境
Github项目推荐 | GtS 仿真泛化:将仿真和真实数据集成到基于视觉的自主飞行深度强化学习中
围棋 AI ELF OpenGo 迎来更新,另有田渊栋呈上开源项目的详细解读
详解深度强化学习展现TensorFlow 2.0新特性(代码)
如何在TensorFlow 2.0中构建强化学习智能体
开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法
如何保持运动小车上的旗杆屹立不倒?TensorFlow利用A3C算法训练智能体玩CartPole游戏
基于TensorFlow的强化学习,在《毁灭战士》游戏里训练Agent
<博客 | 任务型对话系统公式建模&&实例说明

/模型框架/

谷歌发布最新元学习框架「DVRL」,用强化学习量化模型中每个数据点的价值
诺亚高性能强化学习库“刑天”开源(文末彩蛋)
谷歌重磅开源RL智能体Dreamer,仅靠图像学习从机器人到Atari的控制策略,样本效率暴增20倍
DeepMind发布Acme,高效分布式强化学习算法框架轻松编写RL智能体
DeepMind重磅开源强化学习框架!覆盖28款游戏,24多个算法
DeepMind开源强化学习环境,灵活可配置,计算资源有限的小型实验室也能用
谷歌造了个虚拟足球场,让AI像打FIFA一样做强化学习训练丨开源有API
用C++实现强化学习,速度不亚于Python,这里有个框架可用
DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
清华大学人工智能研究院开源“天授”强化学习平台
DeepMind发布神经网络、强化学习库,网友:推动JAX发展
17种深度强化学习算法用Pytorch实现
清华本科生开发强化学习平台「天授」:千行代码实现,性能吊打国外成熟平台,刚刚开源
谷歌推出分布式强化学习框架SEED,性能“完爆”IMPALA,可扩展数千台机器,还很便宜
从“小”培养AI安全意识:OpenAI开源最新强化学习训练工具,安全约束自由定制,开箱即用
集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
谷歌发布一个新的强化学习环境:Google Research Football
OpenAI重磅发布Nueral MMO:一个CPU支撑大量智能体同时在线
3D 环境训练智能体时代来临?Facebook 开源仿真 3D 环境平台 Habitat
谷歌开源强化学习深度规划网络 PlaNet
夺魁NeurIPS 2018强化学习大赛,百度正式发布RL模型库和算法框架PARL
DeepMind 开源TRFL,又一个强化学习复现、创新好帮手
强化学习工具Horizon开源:Facebook曾用它优化在线视频和聊天软件
Facebook开源首个适应大规模产品的强化学习平台Horizon,基于PyTorch 1.0
探索新的强化学习算法遇到困难?不怕不怕,谷歌为你带来「多巴胺」
「多巴胺」来袭!谷歌推出新型强化学习框架Dopamine
TensorFlow Agents日前开源,轻松在TF中构建并行强化学习算法

资讯

【重磅整理】提前看287篇ICLR-2021 "深度强化学习"领域论文得分汇总列表
重磅整理】180篇NIPS-2020顶会《强化学习领域》Accept论文大全
ICML 2020|华为诺亚方舟8篇论文入选,多智能体强化学习成热点
谷歌大脑和DeepMind联合发布离线强化学习基准,将各种RL研究从线上转为线下
首家强化学习大规模落地工业应用,快手是如何做到的?
文末送书 | 你了解强化学习吗?强化学习研究什么?
百度PARL再度夺冠NeurIPS仿生人挑战赛:强化学习控制的流畅行走
是否要入坑强化学习,看了这篇文章再说
DeepMind大放送:开放4个多物体表征学习数据集,还有一篇智能体新研究
MIT用深度强化学习控制麻醉患者的无意识状态,获2020AI医学国际会议最佳论文
是时候抄底了?强化学习炒股,走向人生巅峰(或倾家荡产)
7 Papers & Radios | DeepMind等用AI小鼠探索神经网络;伯克利数据增强RL实现SOTA
一周AI最火论文 | 使用图形界面就能搭建的强化学习模型
6小时完成芯片布局,谷歌用强化学习助力芯片设计
“国产莱卡狗”走进谷歌AI Lab, 强化学习算法让机器狗漫步溜达似真狗
FIFA变身AI主场:谷歌推出强化学习“足球引擎”完爆人类玩家
人类一败涂地?DeepMind推出Agent57,在所有雅达利游戏上超越人类玩家
《强化学习》可复现性?稳健性?Joelle Pineau无情揭示问题
强化学习大佬, TRPO/GAE/PPO提出者 || John Schulman谈:“如何做科研?”
观点 | 深度强化学习这块,有人说我们已经触顶了……
机器人学前班助力机器人简单快速学习,给予强化学习的自动驾驶策略
从头开始强化学习
如何利用强化学习设计出更好的火箭发动机
O’Reilly纽约AI Conference“游记”:AI应用加速落地,强化学习更受关注
观点 | 我在谷歌大脑工作的 18 个月中,是怎样研究强化学习的?
Facebook在加拿大成立AI实验室,专注强化学习研究
一图尽展视频游戏AI技术,DQN无愧众算法之鼻祖
使用强化学习训练机械臂完成人类任务
《经济学人》万字长文:DeepMind和谷歌的AI拉锯战
深度强化学习新趋势:谷歌如何把好奇心引入强化学习智能体
业界 | BAIR讲述如何利用深度强化学习控制灵活手
华为 AAAI 2019 入选论文出炉,两篇论文都是强化学习相关
谷歌和UC伯克利的新式Actor-Critic算法快速在真实世界训练机器人
新的一年,DeepMind准备让AI学会「放烟花」
真的超越了波士顿动力!深度强化学习打造的 ANYmal 登上 Science 子//刊
用AI设计微波集成电路,清华大学等提出深度强化学习方法RINN
EMNLP 2018 | 用强化学习做神经机器翻译:中山大学&MSRA填补多项空白
你需要新的好奇心方法克服强化学习中的拓展症
超越DQN和A3C:深度强化学习领域近期新进展概览
谷歌大脑用强化学习为移动设备量身定做最好最快的CNN模型

/课程、书籍、文档/
外网最火的RL课更新!GitHub标星2.5k,文档视频实操全套配齐
UC伯克利出品,2020深度强化学习最新课程已上线
2019 UC 伯克利 CS285 深度强化学习课程即将上线;深度学习局限性的反思,Yoshua Bengio NeurIPS 2019 演讲 PPT 下载
B站学强化学习?港中文周博磊变身up主,中文课程已上线
UC伯克利最新深度强化学习课程上线,视频已上传到B站
斯坦福2019强化学习课程完结,讲义、PPT、视频已提供下载
B站教学,全中文课程:港中文周博磊强化学习课程完结
2小时学强化学习?DeepMind 首席科学家、原牛津大学教授Nando教程来了
Bengio、Sutton的深度学习&强化学习暑期班又来了,2019视频已放出
赠书:Sutton老爷子经典之作,《强化学习》中文第2版
资料 | 强化学习精要:核心算法与TensorFlow 实现
博客 | ICML 2019 深度强化学习文章汇总
博客 | 过去10年NIPS顶会强化学习论文(100多篇)汇总(2008-2018年)
【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载
Github项目推荐 | 最优控制、强化学习和运动规划等主题参考文献集锦
Github项目推荐 | 中文整理的强化学习资料(Reinforcement Learning)
资源|434页《python强化学习实践》(附 pdf 与完整代码)
2019年度最佳书单:深度学习+机器学习+强化学习
【干货】谷歌大脑:元学习最新进展与挑战(40 PPT下载)
<140页《深度强化学习入门》发布
DeepMind推出深度学习与强化学习进阶课程(附视频)
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
<伯克利CS294深度强化学习课程资料放出(PPT+录像),
<重磅 | CS 294 2018 今日开课!双语字幕独家上线!
动态 | 从零开始快速入门深度强化学习,OpenAI 发布学习资源 Spinning Up
人人能上手:OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
MILA 2018夏季深度学习与强化学习课程资源大放送
《深度强化学习》手稿开放了!
OpenAI开课了!深度强化学习最全课程包,教程、代码、习题、文档一网打尽
从Zero到Hero,OpenAI重磅发布深度强化学习资源
MIT 6.S094· 深度增强学习 | 学霸的课程笔记,我们都替你整理好了

深度强化学习(资源篇)(更新于2020.11.22)相关推荐

  1. 必看!52篇深度强化学习收录论文汇总 | AAAI 2020

    所有参与投票的 CSDN 用户都参加抽奖活动 群内公布奖项,还有更多福利赠送 来源 | 深度强化学习实验室(ID:Deep-RL) 作者 | DeepRL AAAI 2020 共收到的有效论文投稿超过 ...

  2. 30+博士、100+硕士整理的超全深度强化学习资源清单

    作者 | Deep-RL 来源 | 深度强化学习实验室(ID:Deep-RL) 今天为大家推荐一个开源.开发的 Github 好项目<A Guide for Deep Reinforcement ...

  3. 从Zero到Hero,OpenAI重磅发布深度强化学习资源

    https://zhuanlan.zhihu.com/p/49044306 https://spinningup.openai.com/en/latest/ 转载于:https://www.cnblo ...

  4. 中科院自动化所介绍深度强化学习进展:从AlphaGo到AlphaGo Zero

    来源:德先生 概要:2016年初,AlphaGo战胜李世石成为人工智能的里程碑事件.其核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果. 深度强化学习进展:  从AlphaGo ...

  5. 深度学习(三十九)——深度强化学习(2)概述, Deep Q-learning Network(1)

    概述 上图是深度强化学习的脉络图,参考文献中还有该领域的关键论文列表. 原图地址: http://louiskirsch.com/maps/reinforcement-learning 参考: htt ...

  6. Deep Reinforcement Learning 深度增强学习资源

    http://blog.csdn.net/songrotek/article/details/50572935 1 学习资料 增强学习课程 David Silver (有视频和ppt): http:/ ...

  7. 【ML4CO论文精读】基于深度强化学习的组合优化问题研究进展(李凯文, 2020)

    基于深度强化学习的组合优化研究进展 本人研究方向(博士期间):多目标组合优化与决策研究--致力于多约束多目标多任务组合优化算法和多目标决策系统的研究与开发,以及多目标优化技术在一些工程实践中的应用. ...

  8. AAAI 2020使用深度强化学习的MOBA游戏《Towards Playing Full MOBA Games with Deep Reinforcement Learning》打败王者荣耀顶尖选手

    不知道你是否玩过王者荣耀,不知道你是不是经历过被人机疯狂怼在塔下强杀然后嘲讽你的经历?就,真说多了就是泪. 最近,NeurlPS2020会议收录了来自腾讯AI Lab的一篇强化学习的论文<Tow ...

  9. 【ICML2021】 9篇RL论文作者汪昭然:构建“元宇宙”和理论基础,让深度强化学习从虚拟走进现实...

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 来源:转载自AI科技评论 作者 | 陈彩娴 深度强 ...

最新文章

  1. Java基础10:全面解读Java异常
  2. Luence初始与简单应用-Document的增删改查.
  3. android 剩余内存,Android:如何检查剩余的内存量?
  4. 为部署ASP.NET Core准备:使用Hyper-V安装Ubuntu Server 16.10
  5. Hadoop Yarn任务优先级(作业优先级、应用优先级)设置
  6. 2.linux换源问题
  7. C# 委托链、多路广播委托
  8. Python day16(JavaScript)
  9. (23)VHDL实现乘法器
  10. 任正非华为为什么暂不推出鸿蒙,任正非表示,华为的鸿蒙系统已经上网?惊喜吗...
  11. 小程序开发前端和后台技术你都了解吗?
  12. 老MacBook升级内存记
  13. php 背单词系统_网上背单词程序PHP
  14. android iphone 开发者选项,手机开发者选项中的妙用,让你的安卓系统流畅如iOS
  15. 同一个服务器装oracle,windows下同一台服务器上装有两个ORACLE数据库实例,通过命令启停数据库...
  16. 解决:No routes matched location “/“
  17. AIX 上总有一种压缩方式适合你
  18. tiktok 手机验证_TikTok经过验证的硅谷正在创新
  19. 【实战】PyTorch 在 CIFAR-10 数据集上的训练及测试过程
  20. SQL 分析大盘走势

热门文章

  1. python中判断类型函数isinstance()
  2. 计算机分辨率无法调整,电脑分辨率无法调整怎么解决?
  3. 我的Unity(5)一点一滴 利用贴图制作弹痕
  4. html简单的登录界面制作
  5. Mac及Pycharm安装Z3
  6. 开箱即用!让世界最强AI成为你的生产力
  7. 分享30个优秀的iPad界面设计案例
  8. 将所有的input框设置为只读
  9. 网络地址转换(NAT)配置
  10. html5获取播放器实时进度