https://www.cnblogs.com/DicksonJYL/p/9569139.html

Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

  • 清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

  • Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 Machado 等学者给出的建议,使用街机学习环境(Arcade Learning Environment)标准化经验评估。

基准测试

  • 对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的完整训练数据,包括Arcade Learning Environment 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供一个网站,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。

更多细节根据相关链接进行查阅。

相关链接

  • Dopamine 的详细介绍

    https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html

  • Dopamine 的Github 地址

    https://github.com/google/dopamine

-END-

多巴胺:谷歌开源新型增强学习框架相关推荐

  1. 业界 |「多巴胺」来袭!谷歌推出新型强化学习框架Dopamine

    作者:Pablo Samuel Castro.Marc G. Bellemare 来源:Google AI Blog,机器之心 摘要:在过去几年里,强化学习研究取得了多方面的显著进展. 在过去几年里, ...

  2. 35 万行代码,旷视重磅开源天元深度学习框架 ,四大特性实现简单开发

    [导读]2020 年 3 月 25 日,人工智能企业旷视科技举办线上发布会,旷视联合创始人兼 CTO 唐文斌宣布正式开源其 AI 生产力平台 Brain++ 的核心组件--天元(MegEngine). ...

  3. (ICLR2019)论文阅读-使用深度增强学习框架的基于场景先验知识的视觉语义导航

    论文地址: VISUAL SEMANTIC NAVIGATION USING SCENE PRIORS 1. 介绍   论文的目标是使用场景先验知识来改善陌生场景中未知物体的导航效果,具体地,如下图所 ...

  4. MindSpore!这款刚刚开源的深度学习框架我爱了!

    犹记得今年的华为开发者大会 HDC 2020 上,一直受人瞩目的深度学习框架 MindSpore 终于开源了. 我之前一直关注 MindSpore,还是挺期待的.MindSpore 是一款支持端.边. ...

  5. 谷歌开源了量子算法框架CIRQ,拥抱NISQ新时代

    量子栗 发自 凹非寺  量子位 报道 | 公众号 QbitAI NISQ,是嘈杂中型量子 (Noisy Intermediate-Scale Quantum) 的简称. 今年年初,美国人John Pr ...

  6. 化学人学python有前途吗-Java之父点赞的开源Java深度学习框架,你不学下吗?

    深度学习领域中有很多面向Python开发者的资源与教程,比如使用NumPy进行数据分析.使用MatPlotlib进行可视化等:深度学习框架方面,TensorFlow.PyTorch.MXNet等常用框 ...

  7. 面向高维稀疏数据场景,阿里妈妈宣布开源XDL深度学习框架

    据介绍,作为阿里巴巴旗下的大数据营销平台,阿里妈妈基于自身广告业务自主研发了深度学习框架X-Deep Learning(XDL),且已经大规模部署应用在核心生产场景. 阿里妈妈表示,这也是业界首个面向 ...

  8. AI + 3D!英伟达开源3D深度学习框架Kaolin

    点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...

  9. 微软和谷歌分别开源分布式深度学习框架,各自厉害在哪?

    微软和谷歌一直在积极研究用于训练深度神经网络的新框架,并且在最近将各自的成果开源--微软的PipeDream和谷歌的GPipe. 原则上看,他们都遵循了类似的原则来训练深度学习模型.这两个项目已在各自 ...

最新文章

  1. MySQL高级理论-MVCC提交查询相关(版本链)
  2. C语言中的类模拟(C++编程思想)
  3. Web设计里的软件工程思想
  4. 利用“Java同包同名类执行顺序”取消Java 网站应用程序Licence验证
  5. iOS开发Cocoapods执行命令pod setup,执行失败解决RPC failed; curl 56 LibreSSL SSL_read: SSL_ERROR_SYSCALL, errno 54
  6. dell 服务器ghost系统,Dell 5000笔记本装win7 64位Ghost系统真正成功教程
  7. cad导出pdf_CAD手机看图软件中dwg格式图纸导出为PDF格式后没有颜色怎么办?
  8. xp启用计算机共享打印机,Win7如何共享xp的打印机
  9. 比夏洛克还厉害:人工智能开始协助警方破案
  10. python getmenu不到菜单句柄_Python and Menu[编程点滴1]
  11. 【ECSHOP】在任意页面调用商品属性的方法
  12. 【Shecan Notes】从二叉树出发浅谈风险中性定价
  13. 前端怎么从H5调起微信扫描二维码?小程序使用扫码功能.
  14. Percona-toolkit工具详解
  15. Easypack之Alpine容器系列:Sonarqube
  16. 软件工程 chap-5 需求分析方法
  17. python官方下载链接_Python下载、安装及简单操作介绍(附下载链接)
  18. NumPy 基础教程
  19. 输入法/非输入法切换 无法取消快捷键问题 以及 shift按键关闭CapsLock问题
  20. 极智Paper | 单级特征检测网络 YOLOF

热门文章

  1. 我放弃了年薪200万的岗位,因为“复制粘贴”的技术活让人厌恶
  2. 用Ajax构建关键任务的企业级Web应用 ——《深入Ajax:架构与最佳实践》
  3. GAN(Generative Adversarial Nets)研究进展
  4. 使用Tensorflow实现残差网络ResNet-50
  5. 手绘图解 | 机器学习最常见的30个基本概念
  6. 数据蒋堂 | 人工智能中的“人工”
  7. 一行命令,瞬间从“马赛克”到高清影像
  8. github总star超9K!一个超赞的 PyTorch 资源大列表,有人把它翻译成了中文版!
  9. 阿里腾讯裁员冲上热搜,消息称最高涉及30%,官方未回应
  10. SAP WM高阶之Storage Type上架策略L下的Mixed Storage