Gym实践(一)——环境安装
提示:转载请注明出处,若本文无意冒犯到您的合法权益,请及时与作者联系。
Gym实践(一)——环境安装
一、Gym是什么?
OpenAI Gym
OpenAI Gym 评估平台
二、安装步骤
1.安装Anaconda和PyCharm
2.创建虚拟环境
3.安装Gym库
4.设置PyCharm的Python解析器
5.在PyCharm中验证Gym程序
一、Gym是什么?
OpenAI Gym是一款用于研发和比较强化学习算法的工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。
OpenAI Gym包含两部分:
gym 开源 包含一个测试问题集,每个问题成为环境(environment),可以用于自己的强化学习算法开发,这些环境有共享的接口,允许用户设计通用的算法,例如:Atari、CartPole等。
OpenAI Gym 服务
提供一个站点和api ,允许用户对自己训练的算法进行性能比较。OpenAI Gym 环境
OpenAI Gym
提供了多种多样的环境,从简单到困难,并涉及到许多不同类型的数据。
- Classic control and toy text:
提供了一些RL相关论文中的一些小问题,开始学习Gym从这开始! - Algorithmic:
提供了学习算法的环境,比如翻转序列这样的问题,虽然能很容易用直接编程实现,但是单纯用例子来训练RL模型有难度的。这些问题有一个很好的特性: 能够通过改变序列长度改变难度。 - Atari:
这里提供了一些小游戏,比如我们小时候玩过的小蜜蜂,弹珠等等。这些问题对RL研究有着很大影响! - Board games:
提供了Go这样一个简单的下棋游戏,由于这个问题是多人游戏,Gym提供有opponent与你训练的agent进行对抗。 - 2D and 3D robots:
机器人控制环境。 这些问题用 MuJoCo 作为物理引擎。
当然还有很多好玩的问题,比如CNN的自动调参、Minecraft等。
OpenAI Gym 评估平台
用户可以记录和上传算法在环境中的表现,生成评估报告。
在每个环境下都有一个排行榜,用来比较大家的模型表现。
- 用户可以使用Monitor Wrapper包装自己的代码环境,Gym记录算法的性能。
- 用户上传自己模型的Gist,可以生成评估报告,还能录制模型玩游戏的小视频。
二、安装步骤
1.安装Anaconda和PyCharm
使用Anaconda3可以参考博客:环境安装——Anaconda安装(https://blog.csdn.net/qq_41959920/article/details/109095410)
安装PyCharm可以参考网络资料。
2.创建虚拟环境
通过输入以下命令行来创建一个虚拟环境
conda create --name gym_py_3.6_Lab python=3.6
创建好后激活该环境
activate gym_py_3.6
3.安装Gym库
通过输入以下命令行来安装Gym库:
pip install gym -i https://pypi.tuna.tsinghua.edu.cn/simple
以上的意思是通过pip通过https://pypi.tuna.tsinghua.edu.cn/simple地址来安装gym,这里设置为清华镜像地址是为了让下载速度更快,一般它原本默认的下载地址速度会比较慢。
安装成功后,界面会出现如下命令:
该界面显示已经成功安装了Gym-0.17.3及其相应的依赖包
4.设置PyCharm的Python解析器
如果我们想要在PyCharm中使用刚刚的Gym库,就要先将其Python解析器切换到对应虚拟环境中的Python.exe
具体办法就是打开项目/设置:
5.在PyCharm中验证Gym程序
新建一个Python3文件,在其中输入如下代码来调用Gym库:
import gymdef main():env = gym.make('CartPole-v0')for i_episode in range(20):observation = env.reset()for t in range(100):env.render()print(observation)action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished after {} timesteps".format(t + 1))breakif __name__ == "__main__":main()
运行后出现如下训练场景即表示Gym已经可以正常调用:
Gym实践(一)——环境安装相关推荐
- 安装gym库_DRL环境安装:Win10+Anaconda+PyTorch+PyCharm+Gym
1 介绍 本文提供一份安装深度强化学习环境的教程: Win10+Anaconda+PyTorch+PyCharm+Gym. 2 各软件/模块简介 2.1 Anaconda 如果从事python开发,那 ...
- Grpc+Grpc Gateway实践一 介绍与环境安装
介绍与环境安装 假定我们有一个项目需求,希望用Rpc作为内部API的通讯,同时也想对外提供Restful Api,写两套又太繁琐不符合 于是我们想到了Grpc以及Grpc Gateway,这就是我们所 ...
- GYM雅达利打砖块环境安装
GYM雅达利打砖块环境安装 前情提要 卸载之前安装的GYM 下载 VS build tools 运行 VS build tools并安装以下工具 重启电脑 安装cmake, atari-py 和 gy ...
- Flash从入门到实践系列(一):环境安装
目录 环境 安装 requirement: (1)-------------------anaconda---------------------------- (2)---------------- ...
- Py之gym:gym的简介、安装、使用方法之详细攻略
Py之gym:gym的简介.安装.使用方法之详细攻略 目录 gym的简介 gym的安装 gym的使用方法 gym的简介 gym是开发和比较强化学习算法的工具包.它对代理的结构不做任何假设,并且与任何数 ...
- xen虚拟化实战系列(一)之xen虚拟化环境安装
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://koumm.blog.51cto.com/703525/1284516 xen目前 ...
- hyperledge环境安装
1.安装环境 1)本机安装 前提是已经安装好了docker\docker-compose\go,相应的内容可见 docker-1-环境安装及例子实践 docker官方文档学习-1-Docker for ...
- 时空大数据实践之GeoWave安装部署实践
2019独角兽企业重金招聘Python工程师标准>>> 时空大数据实践之GeoWave安装部署实践 GeoWave是由国家地理空间情报局(NGA)与RadiantBlue和Booz ...
- [环境] OpenAI gym经典控制环境CartPole-v0 介绍
[环境]CartPole-v0 聊一聊我对强化学习的理解 对应的代码请访问我的GitHub:fxyang-bupt(可能你进去之后发现什么都没有,那是因为我注册了新的账号还在整理,这并不影响你先fol ...
最新文章
- runtime系统的Cello
- sql语句中left join和inner join中的on与where的区别分析
- 中国AI开发者真实现状:写代码这条路,会走多久?
- 低时延AI完美适配工业场景,边缘智能如何构建数字工业新生态?
- 省二计算机二级vb程序设计题,江苏省计算机二级考试VB程序设计复习题(分类汇总)...
- 35载再忆华罗庚精神:我们应培养怎样的数学大师?​
- Python | Socket02 - 使用with语句建立一个TCP服务器(阻塞+单线程),将TCP客户端发过来的字符串原路返回
- ASP.NET企业开发框架IsLine FrameWork系列之十三--框架配置信息大全(上)
- 事件处理-注册时间 // 事件处理-修饰符 // 事件处理-键盘事件的修饰符 // 事件处理-系统修饰符 // 事件处理-鼠标修饰符
- docker学习(一)在centos7上安装与启动docker
- redis常用命令(基础篇)
- 用 Python 训练自己的语音识别系统,这波操作稳了
- noi 7627 鸡蛋的硬度
- 解决Eclipse自动补全变量名的问题
- Jmeter(十一)测试监听
- sql sever2005中实现“级联删除”
- 车牌识别 php,eoLinker-API_Shop_OCR-车牌识别_API接口_PHP调用示例代码
- 机器学习最常用的算法
- R语言-两总体均值对比
- python实际应用2-拆分PDF