郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five，背后是强化学习的助推。

其实不仅仅是OpenAI Five，下围棋的AlphaGo和AlphaGo Zero、玩雅达利街机游戏的DeepMind DQN（deep Q-network），都离不开强化学习（Reinforcement Learning）。

现在，谷歌发布了一个基于TensorFlow的强化学习开源框架，名叫Dopamine。

另外，还有一组Dopamine的教学colab。

和它的名字Dopamine（多巴胺）一样，新框架听上去就令人激动。

清晰，简洁，易用

新框架在设计时就秉承着清晰简洁的理念，所以代码相对紧凑，大约是15个Python文件，基于Arcade Learning Environment (ALE)基准，整合了DQN、C51、 Rainbow agent精简版和ICML 2018上的Implicit Quantile Networks。

可再现

新框架中代码被完整的测试覆盖，可作为补充文档的形式，也可以用ALE来评估。

基准测试

为了让研究人员能快速比较自己的想法和已有的方法，该框架提供了DQN、C51、 Rainbow agent精简版和Implicit Quantile Networks的玩ALE基准下的那60个雅达利游戏的完整训练数据，以Python pickle文件和JSON数据文件的格式存储，并且放到了一个可视化网页中。

另外，新框架中还有训练好的深度网络、原始统计日志，以及TensorBoard标注好的TensorFlow事件文件。

传送门

开源框架资源

Dopamine谷歌博客：
https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html

Dopamine github下载：
https://github.com/google/dopamine/tree/master/docs#downloads

colabs：
https://github.com/google/dopamine/blob/master/dopamine/colab/README.md

游戏训练可视化网页：
https://google.github.io/dopamine/baselines/plots.html

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...相关推荐

提高复杂网络分析效率！中国科学家研发强化学习新框架
提高复杂网络分析效率!中国科学家研发强化学习新框架近日,中国国防科技大学.美国加州大学洛杉矶分校和哈佛医学院的研究人员研发了一个深度强化学习框架FINDER.相比于现有的解决方案,FINDER能够更 ...
最新！李飞飞提出深度进化强化学习新框架
点上方蓝字计算机视觉联盟获取更多干货在右上方 ··· 设为星标 ★,与你不见不散仅作学术分享,不代表本公众号立场,侵权联系删除转载于:新智元 AI博士笔记系列推荐周志华<机器学习> ...
李飞飞提出深度进化强化学习新框架：创建具身智能体学会动物进化法则
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达转自 | 新智元来源 | 外媒编辑 | Yaxin, LQ 6亿 ...
一文看懂深度学习新王者「AutoML」：是什么、怎么用、未来如何发展？
原作:George Seif 夏乙安妮编译整理量子位出品 | 公众号 QbitAI AutoML和神经架构搜索(NAS),是深度学习领域的新一代王者. 这些方法能快糙猛地搞定机器学习任务,简单 ...
ChatGPT还在2G冲浪？新模型「youChat」：我已能够解说2022世界杯
视学算法报道编辑:蛋酱.小舟 youChat 能成为搜索引擎变革的先行者吗? ChatGPT 自推出以来就被寄予厚望,一些人认为它会取代搜索引擎,成为「改变游戏规则的人」. 真的会有这一天吗?至少, ...
业界 |「多巴胺」来袭！谷歌推出新型强化学习框架Dopamine
作者:Pablo Samuel Castro.Marc G. Bellemare 来源:Google AI Blog,机器之心摘要:在过去几年里,强化学习研究取得了多方面的显著进展. 在过去几年里, ...
DeepMind:星际争霸2：强化学习新挑战（翻译）
DeepMind:StarCraftII:A New Challenge for Reinforcement Learning 星际争霸2:强化学习新挑战原文下载链接:https://deepmin ...
DeepMind:星际争霸2：强化学习新挑战（论文翻译）
星际争霸2:强化学习新挑战原文下载链接:https://deepmind.com/documents/110/sc2le.pdf 整个论文分为: 摘要(Abstract) 1.介绍(Introduc ...
谷歌发布深度学习新算法，适用于真实机器人的技能学习
https://www.toutiao.com/a6649215346496504327/ 2019-01-22 15:11:28 通过这种名叫SAC(柔性致动/评价)的强化学习算法,机器人能很快地完 ...

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

清晰，简洁，易用

可再现

基准测试

传送门

开源框架资源

相关资料

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...相关推荐

最新文章

热门文章

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...

郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI

清晰，简洁，易用

可再现

基准测试

传送门

开源框架资源

相关资料

令人激动！谷歌推强化学习新框架「多巴胺」，基于TensorFlow，已开源丨附github...相关推荐

最新文章

热门文章

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI