https://www.toutiao.com/a6656320158287528461/

2019-02-10 18:41:46

写在前面

去年八月,谷歌发布了 Dopamine,这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究:基于 Arcade 学习环境(一个成熟的、易于理解的基准)和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本以及隐式分位数网络代理实现的。

开源地址:https://github.com/google/dopamine

据官方博客介绍:

开发小组收到的最常见的请求之一是对更多环境的支持。这证实了他们在内部看到的情况,在测试新算法时,OpenAI 的 Gym 支持的简单环境非常有用。于是,谷歌正式发布 Dopamine 2.0,这一版本包括了对离散域 Gym 环境 (如离散状态和动作) 的支持。框架的核心保持不变,只是简单地概括了与环境的接口。为了向后兼容,用户仍然可以下载 1.0 版本。

此外,新版本还包括两个经典控制环境的默认配置:CartPole 和 Acrobot;在这些环境中,用户可以在几分钟内训练 Dopamine 代理。与标准 Atari 2600 游戏的训练时间(标准 GPU 上大约 5 天)相比,这些环境允许研究人员在更大规模的 Atari 游戏上测试比之前更快地迭代研究思路。新版本还包括一个合作实验室,演示如何在 Cartpole 和 Acrobot 上训练代理。最后,GymPreprocessing 类为如何将 Dopamine 与其他自定义环境一起使用提供了示例。

谷歌发布开源Dopamine 2.0相关推荐

  1. 微信打开时支持消息通知横幅引热议;​Google和甲骨文的云服务因英国高温天气而下线;谷歌发布开源开发语言Carbon|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  2. tensorflow 版本列表_最新|谷歌发布TensorFlow 1.3.0版本,都更新了哪些内容?

    我们所有预构建的二进制文档已用 cuDNN6 构建.我们预期在 TensorFlow 1.4 中用 cuDNN7 import tensorflow 运行地更快 向 GCS 文件系统中增加了一个文件缓 ...

  3. 【历史上的今天】10 月 5 日:Linux 内核正式面世;乔布斯逝世;谷歌发布 Android 6.0

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 10 月 5 日,历史上的今天是科技史上令人难忘的一天,在 8 月 25 日的"历史上的今 ...

  4. 曾遭作者“删库”的faker.js,现被社区接手;Apache Ambari 项目被弃用;FFmpeg 5.0 发布 | 开源日报

    整理 | 宋彤彤 责编 | 屠敏 开源吞噬世界的趋势下,借助开源软件,基于开源协议,任何人都可以得到项目的源代码,加以学习.修改,甚至是重新分发.关注「开源日报」,一文速览国内外的开源大事件吧! 一分 ...

  5. 华为麒麟990芯片发布;谷歌宣布开源创新隐私保护技术;阿里20亿美元全资收购网易考拉;中国联通将设立100亿5G创新基金……...

    关注并标星星CSDN云计算 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快.更全了解泛云圈精彩news g ...

  6. Java APNS开源库apns4j-1.0.1发布

    Java APNS开源库apns4j-1.0.1发布 开源地址:https://github.com/teaey/apns4j maven依赖: <dependency><group ...

  7. android6.0最新补丁,谷歌发布安卓补丁修复漏洞 支持6.0之后所有版本

    原标题:谷歌发布安卓补丁修复漏洞 支持6.0之后所有版本 [PConline资讯]7月9日消息,上周在谷歌7月份安全公告中显示,7月发布的安卓补丁对系统44个漏洞进行了修复,其中有11个漏洞被评为严重 ...

  8. 百度谷歌双搜1.3.0已发布

    百度谷歌双搜1.3.0系统特性: 1.新增隐藏百度或谷歌搜索的结果,或者全部显示 2.解决谷歌下新闻频道和问答频道乱码的问题 3.修改部分BUG 4.感谢"飘云"妹妹的支持和&qu ...

  9. 《预训练周刊》第27期:谷歌发布最新看图说话模型、GitHub:平台上30%的新代码受益于AI助手Copilot...

    No.27 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 本期周刊,我们选择了9篇预训练相关的论文,涉及少样本理解.图像检测.决策图.大模型微调.对话微调.分子建模.蛋白质结构预测 ...

最新文章

  1. 速度超Mask RCNN四倍,仅在单个GPU训练的实时实例分割算法
  2. 【深度学习】模式识别技术探索之决策树(Decision tree)
  3. Spring Aspect 获取请求参数
  4. 很炫的shell theme
  5. vue如何封装请求接口方法
  6. 计算机学院 储昭坤,我校在“展航杯”安徽省大学生信息安全作品赛荣获佳绩...
  7. 牛客题霸 SQL3 查找当前薪水详情以及部门编号dept_no
  8. c语言随机抽取小程序_C语言整人小程序,慎用,谨记!
  9. python在人工智能应用锁_python实现人工智能Ai抠图功能
  10. 如何过滤掉xml中的转义字符_水肥一体化应用中如何选择过滤器?
  11. Activity详解 Intent显式跳转和隐式跳转, 及多个Activity之间传值 总结
  12. IIC加载以及存在的问题---lattice XO3
  13. maven配置访问nexus私服,从nexus私服下载依赖
  14. 你们公司用的 Maven 私服就是这么搭建的,头条抖音后端技术3面
  15. 路由器装mentohust插件破解锐捷认证(Pandorabox固件)
  16. RK平台HDMI、喇叭音频同时输出
  17. 【蓝牙sbc协议】sbc源码阅读笔记(一)——编码过程
  18. qrcode增加二维码中心图片
  19. linux函数参数的长度限制,关于命令行长度限制
  20. 一入编码深似海,在达观数据做程序员是怎样一种体验?

热门文章

  1. 9.19scikit-learn安装方法
  2. 雍培:电力遇上大数据,使我的科研如鱼得水 | 提升之路系列(九)
  3. NeurIPS 2021 | 寻MixTraining: 一种全新的物体检测训练范式
  4. 如何撰写好一篇论文?密歇根Andrew教授这篇《撰写高影响力论文指南》为你细致讲解论文写作,附视频与pdf...
  5. 独家|OpenCV 1.4 对图像的操作
  6. 小孩子如何学会语言?科学家使用计算机模型解释儿童语言学习过程
  7. AI把爱豆变胖视频火遍B站,我们找到了背后的技术团队:你是怎么把刘亦菲变胖的?...
  8. 数据蒋堂 | 多维分析预汇总的功能盲区
  9. 带你测试对比深度学习框架!TensorFlow,Keras,PyTorch...哪家强?(附数据集)
  10. 调参到头秃?你需要这份自动超参搜索技术攻略