强化学习环境全库安装(从mujoco到spinningup)
强化学习环境全库安装 从mujoco200到spinningup (上篇)
- 前言
- 一: 安装Mujoco200物理引擎
- 二. 创建conda虚拟环境
- 1:选择python版本
- 2.创建conda虚拟环境
- 三. 安装tensorflow-gpu==1.14.0
- 四、安装mujoco_py 2.2.0.7版本
- 五、安装robosuite
- 1、查看和删改robosuite对应的numpy等依赖库的版本(要删改啊,别跳过)
- 2、安装robosuite
- 六、安装gym
- 1、直接pip安装gym
- 七、openai/spiningup的两个依赖预装和openmpi安装
- 八、安装spiningup
前言
本教程从mujoco物理仿真引擎安装,到spiningup安装,都做了详细描述。注意,官方github下载的源码可能需要修改依赖,避免冲突或者覆盖。因此,为了避免意外,请安装本文安装顺序进行安装,本文优先把最可能出错的库,安装顺序放到前面。
本教程与前面我的博客mujoco-py,tensorflow-gpu,robosuite,gym多版本安装有很多重复的地方,本篇的最终目的是spinningup库的安装,因此gym,tensorflow等库最终以spinningup的依赖为准。
一: 安装Mujoco200物理引擎
稍后补充
二. 创建conda虚拟环境
1:选择python版本
不废话,spinningup支持的python>=3.6,因此选择python==3.6.
2.创建conda虚拟环境
conda create -n spinningup_env_012 python==3.6
三. 安装tensorflow-gpu==1.14.0
conda activate spinningup_env_012
#注意,一定要用conda来安装,而不是pip,conda会帮你安装相关依赖。依赖冲突后面我们再解决
conda install tensorflow-gpu==1.14.0
# 若上行命名安装的太慢,ctrl+c停止,用国内源安装,下面是科大源
conda install -n spinningup_env --channel https://mirrors.ustc.edu.cn/anaconda/pkgs/main/ tensorflow-gpu==1.14.0
测试tensorflow是否安装成功。若下述命名执行没有报错,则说明tensorflow安装成功。后面其它步骤还有注意,虽然tensorflow能运行了,可能运行别的库,可能会报错numpy库冲突。
source activate spinningup_env_012 python# 进入python程序import tensorflow as tfsess = tf.Session()#若上述命名执行没有报错,则说明tensorflow安装成功。
conda安装tensorflow-gpu会帮你安装cudatoolkit,cudnn等工具包,见图示:
四、安装mujoco_py 2.2.0.7版本
从github上下载mujoco_py 2.2.0.7版本源码,
在对应虚拟环境下面(激活虚拟环境),进入到mujoco-py-master(下载的mujoco-py源码)目录下,可以看见setup.py,requirement.txt,requirement.dev.txt文件。执行下面命令:
#在对应虚拟环境下面,进入到mujoco-py-master目录下。命名执行等待时间较长,耐心等待
pip install -r requirement.txt
pip install -r requirement.dev.txt
python setup.py install
#测试mujoco_py是否安装成功.出行画面说明成功。第一次运行等待时间较长,耐心等待
python example/body_interaction.py
五、安装robosuite
1、查看和删改robosuite对应的numpy等依赖库的版本(要删改啊,别跳过)
同mujoco_py查看依赖库的方法一样,我们发现setup.py并没有提到requirement.txt或者requirements-extra.txt中,那么这两个文件用python setup.py install是不会影响的。但是,我们发现setup.py提到了mujoco_py,那样会影响我们之前的安装,我们选择把这一行删掉,如下图阴影部分删除。
2、安装robosuite
在对应虚拟环境下面,进入到robosuite-master(下载的mujoco-py源码)目录下,可以看见setup.py文件。执行下面命令:
#在对应虚拟环境下面,进入到解压下载的robosuite-master目录下。命名执行等待时间较长,耐心等待
python setup.py install
#测试robosuite是否安装成功.出行画面说明成功。第一次运行等待时间较长,耐心等待
python robosuite/demo.py
我们没有安装requirement.txt或者requirements-extra.txt的依赖包,不影响。
六、安装gym
1、直接pip安装gym
#在对应虚拟环境下面,下面命令执行完,居然没有任何信息,没报错就是好的吧
pip install gym>=0.10.8
#测试gym是否安装成功
# 进入python程序
python
import gym
print(gym.__version__)
#若上行没有错误,说明gym安装成功
pip纯净安装不负责依赖包安装,若以后执行gym的复杂操作,若涉及其他库,等报错缺少哪个包,就再pip安装那个包即可。注意,不要用pip install gym[–all]等命令,可能会安装依赖的mujoco_py版本,使得原先mujoco_py被丢失。
七、openai/spiningup的两个依赖预装和openmpi安装
1、mpi4py:在conda虚拟环境下conda install mpi4py
2、joblib:在conda虚拟环境下pip install joblib
3、sudo apt-get update && sudo apt-get install libopenmpi-dev
八、安装spiningup
1、进入到spiningup-master目录下,可以看见setup.py文件,执行命令
#在对应虚拟环境下面,即激活虚拟环境后
python setup.py install
# 进入python程序
python
import spinup
#若上行没有错误,说明spinup安装成功
强化学习环境全库安装(从mujoco到spinningup)相关推荐
- 【开发随笔】以强化学习环境 gym 库为例:为什么日常中我应该试图标准化接口?
前言: 这两天在看 openAI 的 gym ,并尝试用其测试自己写的 Sarsa .一塌糊涂,这里来记录下经验教训.官网对于 gym 的文档不多,也不详细,读了 gym 的源码,很直观,也确实用不着 ...
- 强化学习环境库 Gym 发布首个社区发布版,全面兼容 Python 3.9
作者:肖智清 来源:AI科技大本营 强化学习环境库Gym于2021年8月中旬迎来了首个社区志愿者维护的发布版Gym 0.19.该版本全面兼容Python 3.9,增加了多个新特性. 强化学习环境库的事 ...
- openai的gym baseline spiningup 深度强化学习环境安装 手撸gym环境demo
按照spiningup我们学习DRL,链接 https://github.com/openai/gym https://github.com/openai/baselines 1. 安装anacond ...
- PyTorch强化学习实战(1)——强化学习环境配置与PyTorch基础
PyTorch强化学习实战(1)--强化学习环境配置与PyTorch基础 0. 前言 1. 搭建 PyTorch 环境 2. OpenAI Gym简介与安装 3. 模拟 Atari 环境 4. 模拟 ...
- Docker实操3——配置强化学习环境镜像
手动配置一遍docker中的强化环境 一.安装基本操作 1.1 查看基础信息 1.2 国内换源 1.3 安装nvidia-docker 二.docker基本操作 三.例子:强化学习库的docker环境 ...
- 目前最好用的大规模强化学习算法训练库是什么?
点击蓝字 关注我们 本文整理自知乎问答,仅用于学术分享,著作权归作者所有.如有侵权,请联系后台作删文处理. 本文精选知乎问题"目前最好用的大规模强化学习算法训练库是什么?"评论区 ...
- DeepMind开源强化学习环境,灵活可配置,计算资源有限的小型实验室也能用
铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 想搞强化学习,但算力门槛让不少人望而却步. 想想DeepMind训练的通用棋类AI AlphaZero,碾压一票同类选手,但堆砌了实验室里5 ...
- 星际争霸2 AI 强化学习环境部署
星际争霸2 AI 强化学习环境部署 PySC2是DeepMind开发的星际争霸Ⅱ学习环境(SC2LE)的Python组件. 它封装Blizzard Entertainment的星际争霸Ⅱ机器学习API ...
- 第四范式陈雨强:企业智能决策的下一代技术「强化学习 + 环境学习」
机器之心报道 以下文章转载自机器之心 过去数年,以强化学习为代表的决策智能技术战胜人类玩家的新闻屡屡进入人们的视野,直观地展示了这种技术赋予 AI 的强大智能.同时,业界也开始思考,该技术能否像之前的 ...
最新文章
- 【数据挖掘笔记五】数据立方体技术
- MyBatis Generator配置文件翻译
- 16字节 oracle md5,Oracle中的MD5加密
- python中if控制语句_Python中流程控制语句之IF语句
- java access 2013_jdk1.8环境下的java如何直连接microsoft access2013(都是64位系统也是)...
- 自动化测试-selenium初始化Driver参考
- Briefly unavailable for scheduled maintenance. Check back in a minute.
- Codeforces Problem-705A Hulk
- 高清视频录制工具(Bandicam)v2.1.2.740中文使用技巧
- vuejs开发H5页面总结
- 不爱打空格的小孟c语言,语言学专家:很多年轻人发信息不爱用句号,其实都是有原因的...
- 使用python进行普通日期和儒略历的转换
- GPS模块资料,链接
- 【无标题】相册排版软件
- 企业内训实录:三子棋版阿尔法狗项目及视频面试应用开发
- linux 媒体管理器,Linux系统的多媒体管理大师-Compupic
- openglshader实现虚拟场景_基于OpenGL的雨雪场景仿真
- DAY6:利用 PHP 编写登陆页面
- Linux特殊权限之umask,SBIT,SUID,SGID及ACL权限列表
- Day01 数据爬取并可视化数据
热门文章
- Urban Radiance Fields
- Decal Buffer相关
- 最小费用流算法不完全指南-2017华为软件精英挑战赛
- 安卓平台中国眼实时视频软件之视频源分析
- giflib加载GIF文件
- 送书【新书】 |《python数据科学实战》
- Warshell算法实现
- 网络维护工程师的要求是什么?
- 深度学习·理论篇(2023版)·第001篇快速了解人工智能与Pytorch:机器/表示/深度学习定义+端到端的学习+神经网络在计算机视觉应用+深度学习的技术蓝图
- python遥控汽车玩具_分享 | 撞坏遥控车后,有个技术大牛爸爸是种怎样的体验