提示:转载请注明出处,若本文无意冒犯到您的合法权益,请及时与作者联系。

Gym实践(一)——环境安装

一、Gym是什么?

OpenAI Gym

OpenAI Gym 评估平台

二、安装步骤

1.安装Anaconda和PyCharm

2.创建虚拟环境

3.安装Gym库

4.设置PyCharm的Python解析器

5.在PyCharm中验证Gym程序


一、Gym是什么?

OpenAI Gym是一款用于研发和比较强化学习算法的工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。

OpenAI Gym包含两部分:

  • gym 开源 包含一个测试问题集,每个问题成为环境(environment),可以用于自己的强化学习算法开发,这些环境有共享的接口,允许用户设计通用的算法,例如:Atari、CartPole等。

  • OpenAI Gym 服务
    提供一个站点和api ,允许用户对自己训练的算法进行性能比较。OpenAI Gym 环境

OpenAI Gym

提供了多种多样的环境,从简单到困难,并涉及到许多不同类型的数据。

  • Classic control and toy text:
    提供了一些RL相关论文中的一些小问题,开始学习Gym从这开始!
  • Algorithmic:
    提供了学习算法的环境,比如翻转序列这样的问题,虽然能很容易用直接编程实现,但是单纯用例子来训练RL模型有难度的。这些问题有一个很好的特性: 能够通过改变序列长度改变难度
  • Atari:
    这里提供了一些小游戏,比如我们小时候玩过的小蜜蜂,弹珠等等。这些问题对RL研究有着很大影响!
  • Board games:
    提供了Go这样一个简单的下棋游戏,由于这个问题是多人游戏,Gym提供有opponent与你训练的agent进行对抗。
  • 2D and 3D robots:
    机器人控制环境。 这些问题用 MuJoCo 作为物理引擎。

当然还有很多好玩的问题,比如CNN的自动调参、Minecraft等。

OpenAI Gym 评估平台

用户可以记录和上传算法在环境中的表现,生成评估报告。

在每个环境下都有一个排行榜,用来比较大家的模型表现。

  • 用户可以使用Monitor Wrapper包装自己的代码环境,Gym记录算法的性能。
  • 用户上传自己模型的Gist,可以生成评估报告,还能录制模型玩游戏的小视频。

二、安装步骤

1.安装Anaconda和PyCharm

使用Anaconda3可以参考博客:环境安装——Anaconda安装(https://blog.csdn.net/qq_41959920/article/details/109095410)

安装PyCharm可以参考网络资料。

2.创建虚拟环境

通过输入以下命令行来创建一个虚拟环境

conda create --name gym_py_3.6_Lab python=3.6

创建好后激活该环境

activate gym_py_3.6

3.安装Gym库

通过输入以下命令行来安装Gym库:

pip install gym -i https://pypi.tuna.tsinghua.edu.cn/simple

以上的意思是通过pip通过https://pypi.tuna.tsinghua.edu.cn/simple地址来安装gym,这里设置为清华镜像地址是为了让下载速度更快,一般它原本默认的下载地址速度会比较慢。

安装成功后,界面会出现如下命令:

该界面显示已经成功安装了Gym-0.17.3及其相应的依赖包

4.设置PyCharm的Python解析器

如果我们想要在PyCharm中使用刚刚的Gym库,就要先将其Python解析器切换到对应虚拟环境中的Python.exe

具体办法就是打开项目/设置:

5.在PyCharm中验证Gym程序

新建一个Python3文件,在其中输入如下代码来调用Gym库:

import gymdef main():env = gym.make('CartPole-v0')for i_episode in range(20):observation = env.reset()for t in range(100):env.render()print(observation)action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished after {} timesteps".format(t + 1))breakif __name__ == "__main__":main()

运行后出现如下训练场景即表示Gym已经可以正常调用:

Gym实践(一)——环境安装相关推荐

  1. 安装gym库_DRL环境安装:Win10+Anaconda+PyTorch+PyCharm+Gym

    1 介绍 本文提供一份安装深度强化学习环境的教程: Win10+Anaconda+PyTorch+PyCharm+Gym. 2 各软件/模块简介 2.1 Anaconda 如果从事python开发,那 ...

  2. Grpc+Grpc Gateway实践一 介绍与环境安装

    介绍与环境安装 假定我们有一个项目需求,希望用Rpc作为内部API的通讯,同时也想对外提供Restful Api,写两套又太繁琐不符合 于是我们想到了Grpc以及Grpc Gateway,这就是我们所 ...

  3. GYM雅达利打砖块环境安装

    GYM雅达利打砖块环境安装 前情提要 卸载之前安装的GYM 下载 VS build tools 运行 VS build tools并安装以下工具 重启电脑 安装cmake, atari-py 和 gy ...

  4. Flash从入门到实践系列(一):环境安装

    目录 环境 安装 requirement: (1)-------------------anaconda---------------------------- (2)---------------- ...

  5. Py之gym:gym的简介、安装、使用方法之详细攻略

    Py之gym:gym的简介.安装.使用方法之详细攻略 目录 gym的简介 gym的安装 gym的使用方法 gym的简介 gym是开发和比较强化学习算法的工具包.它对代理的结构不做任何假设,并且与任何数 ...

  6. xen虚拟化实战系列(一)之xen虚拟化环境安装

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://koumm.blog.51cto.com/703525/1284516 xen目前 ...

  7. hyperledge环境安装

    1.安装环境 1)本机安装 前提是已经安装好了docker\docker-compose\go,相应的内容可见 docker-1-环境安装及例子实践 docker官方文档学习-1-Docker for ...

  8. 时空大数据实践之GeoWave安装部署实践

    2019独角兽企业重金招聘Python工程师标准>>> 时空大数据实践之GeoWave安装部署实践 GeoWave是由国家地理空间情报局(NGA)与RadiantBlue和Booz ...

  9. [环境] OpenAI gym经典控制环境CartPole-v0 介绍

    [环境]CartPole-v0 聊一聊我对强化学习的理解 对应的代码请访问我的GitHub:fxyang-bupt(可能你进去之后发现什么都没有,那是因为我注册了新的账号还在整理,这并不影响你先fol ...

最新文章

  1. runtime系统的Cello
  2. sql语句中left join和inner join中的on与where的区别分析
  3. 中国AI开发者真实现状:写代码这条路,会走多久?
  4. 低时延AI完美适配工业场景,边缘智能如何构建数字工业新生态?
  5. 省二计算机二级vb程序设计题,江苏省计算机二级考试VB程序设计复习题(分类汇总)...
  6. 35载再忆华罗庚精神:我们应培养怎样的数学大师?​
  7. Python | Socket02 - 使用with语句建立一个TCP服务器(阻塞+单线程),将TCP客户端发过来的字符串原路返回
  8. ASP.NET企业开发框架IsLine FrameWork系列之十三--框架配置信息大全(上)
  9. 事件处理-注册时间 // 事件处理-修饰符 // 事件处理-键盘事件的修饰符 // 事件处理-系统修饰符 // 事件处理-鼠标修饰符
  10. docker学习(一)在centos7上安装与启动docker
  11. redis常用命令(基础篇)
  12. 用 Python 训练自己的语音识别系统,这波操作稳了
  13. noi 7627 鸡蛋的硬度
  14. 解决Eclipse自动补全变量名的问题
  15. Jmeter(十一)测试监听
  16. sql sever2005中实现“级联删除”
  17. 车牌识别 php,eoLinker-API_Shop_OCR-车牌识别_API接口_PHP调用示例代码
  18. 机器学习最常用的算法
  19. R语言-两总体均值对比
  20. python实际应用2-拆分PDF

热门文章

  1. Web前端之布局模型
  2. win10去除桌面快捷方式小箭头
  3. Gerrit版本升级
  4. 计算机考研面试自我介绍范文英语,研究生英语面试自我介绍范文三篇
  5. GitChat文章推荐
  6. Java要学到什么程度?
  7. JS设计模式初识(七)-组合模式
  8. 使用java进行SSL证书的签名与签验
  9. python+selenium实现微博登录和自动评论
  10. 二叉树的基本运算实验报告C语言,实验三 二叉树基本操作与应用实验