[环境]CartPole-v0

聊一聊我对强化学习的理解
对应的代码请访问我的GitHub:fxyang-bupt(可能你进去之后发现什么都没有,那是因为我注册了新的账号还在整理,这并不影响你先follow一下我的GitHub~)
目前正在把我的文字内容和代码整理成网络书籍的方式发布出来,敬请期待…

我很想把它做成一套简单易懂的白话系列,奈何做这种事真的不简单。我参考了很多资料,比如:
《白话强化学习与PyTorch》
《深入浅出强化学习:原理与入门》
《强化学习入门:从原理到实践》
“莫烦Python”
博客园 “刘建平Pinard” 的博客
北大 “ShusenTang” 的GitHub
……
这是一门比较前言的理论,目前正在发光发热。我并不推荐大家一开始就阅读大部头的《Reinforcement Learning》这本书,假期我花了一个月的时间去啃,效果并不好。反而是这种“平易近人”的教程更适合入门。不过各种“平易近人”的教程都会充斥着笔者自己的理解,这种事容易陷入到自嗨的怪圈,笔者自认为自己举了一个特别通俗的例子,而读者却一头雾水。
所以我把我在学习和实践过程中遇到的困惑,又做了二次解读的加工。有了这个系列的文章,希望能够有所贡献。成为帮助你入门的N多资料的其中之一。
我的代码用的框架比较杂,PyTorch TensorFlow1 TensorFlow2……都有。有人会在意TensorFlow2出来以后,1不是被淘汰了,为什么还要用?
5G都出了多长时间了,你那个卡的要死的4G手机换了吗?企业也是一样的。所以还是得用

希望毕业后我也能成为像 莫烦 和 Charlotte77 一样的知识分享者~这是自己的一个小兴趣

关于环境的介绍可以通过下面几篇文章了解,还能搞清楚gym包的组织规则。

OpenAI Gym: the CartPole-v0 environment

OpenAI Gym 经典控制环境介绍–CartPole(倒立摆)_思绪无限的博客-CSDN博客_cartpole

openai/gym

强化学习实践二 理解gym的建模思想

深度剖析 OpenAI Gym(持续更新)_taoyafan的博客-CSDN博客


但是,打开cartpole.py的源码可以发现,官方文档写的居然是错的!
果然最靠得住的还是源码,如果编程中碰到一些问题感觉可能有错误,就大胆怀疑吧,找到源码去验证你的猜想~

[环境] OpenAI gym经典控制环境CartPole-v0 介绍相关推荐

  1. OpenAI Gym 经典控制环境介绍——CartPole(倒立摆)

    摘要:OpenAI Gym是一款用于研发和比较强化学习算法的工具包,本文主要介绍Gym仿真环境的功能和工具包的使用方法,并详细介绍其中的经典控制问题中的倒立摆(CartPole-v0/1)问题.最后针 ...

  2. OpenAI Gym 是一个优秀开发和比较强化学习算法的工具

    OpenAI Gym 是一个优秀开发和比较强化学习算法的工具. gym的核心接口是Env方法: reset(self):重置环境的状态,返回观察.     step(self, action):推进一 ...

  3. DRL实战:DDPG A3C | Gym环境中经典控制问题Pendulum-v0

    文章目录 (一)"Pendulum-v0" Observation & State Action Reward (二)A3C & DDPG A3C Test 1 T ...

  4. Ubuntu下常用强化学习实验环境搭建(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)

    原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590 和其它的机器学习方向一样,强化学习(Reinforcement Learni ...

  5. 常用增强学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)

    常用增强学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2) 标签: 强化学习OpenAI GymMuJoCoStarCra ...

  6. 强化学习——环境库OpenAI Gym

    前言 前段时间各大新闻媒体都在报道SpaceX的马斯克,因为其公司成功发射"猎鹰9号"火箭.马斯克是一个极具传奇色彩的人物,其成就也足以让他名垂青史.但今天我们要讨论的不是马斯克这 ...

  7. 强化学习Openai Gym基础环境搭建

    ​ Gym提供了一些基础的强化学习环境,并且集成了许多有意思的环境,下面我们来一起看下如何在你的电脑上搭建Gym的开发环境吧. ​ Gym的Github地址. 1. ReadMe解读 ​ Gym 是一 ...

  8. 强化学习环境库 Gym 发布首个社区发布版,全面兼容 Python 3.9

    作者:肖智清 来源:AI科技大本营 强化学习环境库Gym于2021年8月中旬迎来了首个社区志愿者维护的发布版Gym 0.19.该版本全面兼容Python 3.9,增加了多个新特性. 强化学习环境库的事 ...

  9. RL gym 环境(2)—— 自定义环境

    本文介绍如何在 gym 套件中使用自己创建的环境,改编自官方文档 Make your own custom environment 关于 gym 套件的基础介绍参考:RL gym 环境(1)-- 安装 ...

最新文章

  1. 3ds Max V-Ray5 完整指南大师班视频教程
  2. ASP.NET Core 2.1 : 十五.图解路由(2.1 or earler)
  3. kappa一致性检验教程_SPSS在线_SPSSAU_Kappa一致性检验
  4. 简单工厂 jdk源码解析
  5. RN做的Android应用反编译,macOS Catalina配置Android反编译三件套 apktool/dex2jar/enjarify/jd-gui...
  6. python最小公倍数 菜鸟_Python实现的求解最小公倍数算法示例
  7. 自己闲来无事做的工作日志WEB程序(VB.NET)
  8. linux系统获取光盘信息api,在Visual C#中运用API函数获取系统信息
  9. [分享]四杂.cn中未被注册的好组合
  10. 通过Python获取维基百科中概念词条的维基信息
  11. flux mono 转_自语之Reactor中FluxMono的粗略使用
  12. 多商户商城系统功能拆解39讲-平台端营销-砍价记录
  13. Three.js加载外部模型骨骼动画
  14. css 一行超出显示省略号 多行超出显示省略号
  15. 【BZOJ1004】【HNOI20008】cards
  16. word字号 html,word排版一般字号用的字号是多少
  17. 一键卸载宝塔Linux面板及运行环境命令
  18. 以股票weekday和涨幅关系为例创建dataframe交叉表与透视表
  19. AMD FM2+平台 PVE proxmox RX560D显卡直通
  20. 怎么删除计算机网络连接不上去,怎么删除多余本地连接2 本地连接无法连接原因及解决方法介绍...

热门文章

  1. Cisco路由器 VOIP 配置
  2. Java集合系列---红黑树(基于HashMap 超详细!!!)
  3. 用matlab找出所有真因子,在matlab中找出与fmincon匹配两条曲线的缩放因子
  4. Payroll Calculation的Process Rule
  5. 学以致用十-----centos7.2+python3.6+vim8.1+YouCompleteMe
  6. 【UI插件】简单的日历插件(下)—— 学习MVC思想
  7. linux动态库加载RPATH,RUNPATH
  8. 关于机器学习会议的点评
  9. ruby编程API阅读之BasicObject阅读
  10. linux用户和账号管理