【重磅】Tensorflow2.0实现29种深度强化学习算法大汇总
点击上方,选择星标或置顶,不定期资源大放送!
阅读大概需要3分钟
Follow小博主,每天更新前沿干货
来源:深度强化学习实验室
作者:王健树
【导读】今天给大家推荐一个超赞的强化学习项目资料,该项目作者使用gym,Unity3D ml-agents等环境,利用tensorflow2.0版本对29种算法进行了实现的深度强化学习训练框架,该框架具有如下特性:
实现单智能体强化学习、分层强化学习、多智能体强化学习算法等约29种
适配gym、MuJoCo、PyBullet、Unity ML-Agents等多种训练环境
支持多向量信息、多图像信息同时输入
实现多种高性能经验池,如并行PER、episode replay buffer
跨平台支持Windows、Linux、OSX三种操作系统
实现Noisy Net、ICM等多种探索机制
下面是具体算法执行列表。
传送门:https://github.com/StepNeverStop/RLs
推荐阅读
(点击标题可跳转阅读)
强化学习最新作品:谷歌最新思想、MIT新书推荐、Sutton经典之作!
撒花!港中文周博磊--强化学习课程完结(附课件下载!)
【强化学习】ICLR 2020 强化学习相关论文与会议slides分享
多智能体机器学习:强化学习方法(附pdf下载)
重磅!DLer-强化学习交流群已成立!
欢迎各位RLer加入强化学习微信交流大群,本群旨在交流强化学习框架、策略梯度、DQN、理论推导与算法实现、前沿技术与顶会文章解读、应用场景等内容。更有求职内推、算法竞赛、资源干货、业界前沿资讯等,欢迎加群交流学习!
进群请备注:研究方向+学校/公司+昵称(如强化学习+上交+王明)
广告商、博主请绕道!
???? 长按识别添加,邀请您进群!
【重磅】Tensorflow2.0实现29种深度强化学习算法大汇总相关推荐
- 17种深度强化学习算法用Pytorch实现(附链接)
来源:新智元 本文约1300字,建议阅读5分钟. 本文为你介绍一个用PyTorch实现了17种深度强化学习算法的教程和代码库,帮助大家在实践中理解深度RL算法. [ 导读 ]深度强化学习已经在许多领域 ...
- openssl 添加自定义算法_GitHub:用PyTorch实现17种深度强化学习算法
[新智元导读]深度强化学习已经在许多领域取得了瞩目的成就,并且仍是各大领域受热捧的方向之一.本文推荐一个用 PyTorch 实现了 17 种深度强化学习算法的教程和代码库,帮助大家在实践中理解深度 R ...
- 两种深度强化学习算法在网络调度上的应用与优化(DQN A3C)
首先给出论文地址和代码, Reinforcement Learning Based Scheduling Algorithm for Optimizing Age of Information in ...
- 【招聘推荐】启元世界招聘深度强化学习算法工程师
深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 编辑.排版:DeepRL 深度强化学习算法工程师 ...
- 近端策略优化深度强化学习算法
PPO:Proximal Policy Optimization Algorithms,其优化的核心目标是: ppo paper 策略梯度 以下是马尔可夫决策过程MDP的相关基础以及强化学习的优化目标 ...
- 深度强化学习算法调参
深度强化学习调参技巧:以D3QN.TD3.PPO.SAC算法为例 这个参考链接. 如何选择深度强化学习算法? 参考链接. 影响PPO算法性能的10个关键技巧(附PPO算法简洁Pytorch实现) 主要 ...
- 基于值的深度强化学习算法
目录 DQN2013 -- Playing Atari with Deep Reinforcement Learning DQN2015 -- Human-level control through ...
- AlphaGo之父亲授深度强化学习十大法则
原则 #1 评价驱动发展 客观.量化的评价驱动进展: 评价指标的选择决定了进展的方向 这可以说是项目过程中最重要的决策 排行榜驱动的研究: 确保评价指标紧贴最终目标 避免主观评估(如人为监测) 假设驱 ...
- 必看!52篇深度强化学习收录论文汇总 | AAAI 2020
所有参与投票的 CSDN 用户都参加抽奖活动 群内公布奖项,还有更多福利赠送 来源 | 深度强化学习实验室(ID:Deep-RL) 作者 | DeepRL AAAI 2020 共收到的有效论文投稿超过 ...
最新文章
- 技术18期:数据安全之加密与实现
- linux centos7不能ssh免密登录自己的问题解决
- java内存系列:测试JDK最大内存
- 识别和追踪主题层次的影响力者(来自2018 Machine Learning 论文学习笔记)
- FPGA开平方的实现
- Django + Uwsgi + Nginx 实现生产环境部署
- 图案设计灵感怎么写_设计理念怎么写
- CPU测评程序、指标、工具
- cad里面f命令用不了_cad命令_CAD命令中 F 命令是什么作用?
- linux磁盘写保护怎么修改_linux
- SQL server 2019和 SSMS下载与安装教程
- Anaconda安装Jupyter Notebook的常用方法(安装失败解决方法)
- 翻译: Github Copilot 可以创作艺术吗?
- 开发自己的脚手架(Rollup+Typescript)-(03)-(CAC 命令行交互)
- Ubuntu服务器更改远程端口号的方法
- 欧洲统一语言参考标准C1,CEFR(欧洲共同语言参考标准)与英语考试换算标准
- 用CV曲线确定肖特基势垒高度
- Elasticsearch 查询超出10000条时
- zoj 3734 LIKE vs CANDLE
- SolidWorks--快捷键