日萌社

人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新)


Mujoco 安装1.MuJoCo是一个物理模拟器,可以用于机器人控制优化等研究。官网下载MuJoCo 2.0 对应平台的安装包:https://www.roboti.us/index.html 中的 mujoco200 linux安装包mkdir ~/.mujococp mujoco200_linux.zip ~/.mujococd ~/.mujocounzip mujoco200_linux.zip注意:必须把 ~/.mujoco/mujoco200_linux 修改为 ~/.mujoco/mujoco200,不论解压出来的文件名是什么都必须改为mujoco200,因为import mujoco_py的时候,会报错  You appear to be missing MuJoCo.  We expected to find the file here: /home/用户名/.mujoco/mujoco200正是因为默认只从~/.mujoco/mujoco200这个路径找。2.注册通过邮件获取注册码License文件:https://www.roboti.us/license.html注意:MuJoCo 为收费的,30 days免费,下载免费30天的license,可以申请获取学生免费license,可以试用1年仅限教育邮箱,所以如果你有教育邮箱的话,就可以申请1年的试用期。1.Computer id填写框旁边点击下载对应平台的获取Computer id的程序此处下载的是linux平台的getid_linux可执行文件chmod 777 getid_linux ./getid_linux 2.提交注册信息后,收到邮件,下载附件:LICENSE.txt、mjkey.txt3.拷贝许可证:cp mjkey.txt ~/.mujococp mjkey.txt ~/.mujoco/mujoco200/bin4.添加环境变量vim ~/.bashrcexport LD_LIBRARY_PATH=~/.mujoco/mujoco200/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}使配置马上生效 source ~/.bashrc  5.测试是否安装成功:进入bin目录下 即可运行simulate 打开软件界面cd ~/.mujoco/mujoco200/bin./simulate ../model/humanoid.xml

mujoco200_linux 安装后运行 simulate 的图像 


mujoco-py 安装 1.更新、安装依赖项(可选择是否更新、安装)sudo apt-get updatesudo apt-get upgradesudo DEBIAN_FRONTEND=noninteractive apt-get install -y curl git libgl1-mesa-dev libgl1-mesa-glx libglew-dev libosmesa6-dev python3-pip python3-numpy python3-scipy net-tools unzip vim wget xpra xserver-xorg-dev   sudo apt-get install -y python-numpy python-dev cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig2.安装 mujoco-py1.下载mujoco-py源码包然后解压直接mujoco-py源码包:https://github.com/openai/mujoco-py或者 用git下载mujoco-py源码包:git clone https://github.com/openai/mujoco-py.gitsudo apt install git #安装 git2.安装依赖cd ~/mujoco-py 或者为 cd ~/mujoco-py-masterpip3 install -r requirements.txtpip3 install -r requirements.dev.txt3.安装方式一:pip3 install -U 'mujoco-py<2.1,>=2.0'报错:Could not build wheels for mujoco-py which use PEP 517 and cannot be installed directly解决:pip install --no-use-pep517 'mujoco-py<2.1,>=2.0'报错:No such file or directory: 'patchelf': 'patchelf'解决:sudo apt-get update -ysudo apt-get install -y patchelf4.安装方式二:cd ~/mujoco-py/vendor 或者为 cd ~/mujoco-py-master/vendor./Xdummy-entrypointcd ..注意:使用python、pip命令安装时,应注意你的python、pip命令对应的是python的什么版本,否则可能会默认使用python2,同时也要注意mujoco-py安装到是哪个版本的python环境,后面运行mujoco-py的库代码就必须该python版本的环境。sudo python3 setup.py install 报错:ImportError: No module named setuptools解决:sudo apt-get install python-setuptools5.测试是否安装成功例子1:import mujoco_pyimport osmj_path, _ = mujoco_py.utils.discover_mujoco()xml_path = os.path.join(mj_path, 'model', 'humanoid.xml')model = mujoco_py.load_model_from_path(xml_path)sim = mujoco_py.MjSim(model)print(sim.data.qpos)#[0.  0.  1.4 1.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.# 0.  0.  0.  0.  0.  0.  0.  0.  0.  0. ]sim.step()print(sim.data.qpos)#[-1.12164337e-05  7.29847036e-22  1.39975300e+00  9.99999999e-01#  1.80085466e-21  4.45933954e-05 -2.70143345e-20  1.30126513e-19# -4.63561234e-05 -1.88020744e-20 -2.24492958e-06  4.79357124e-05# -6.38208396e-04 -1.61130312e-03 -1.37554006e-03  5.54173825e-05# -2.24492958e-06  4.79357124e-05 -6.38208396e-04 -1.61130312e-03# -1.37554006e-03 -5.54173825e-05 -5.73572648e-05  7.63833991e-05# -2.12765194e-05  5.73572648e-05 -7.63833991e-05 -2.12765194e-05]5.测试是否安装成功例子2:cd ~/mujoco-py/examples/python3 setting_state.py 

测试是否安装mujoco-py的成功例子 

 mjpro150_linux 安装后运行 simulate 的图像


gym 安装1.sudo apt install git #安装 git2.git clone https://github.com/openai/gym.git #拉取源代码cd ~/gympip install -e '.[all]' # 安装 Gym1.报错:注意该gym版本要求安装的是mjpro150You appear to be missing MuJoCo.  We expected to find the file here: /home/nagisa/.mujoco/mjpro150   2.解决:类似安装mujoco200 linux一样的步骤1.官网 https://www.roboti.us/index.html 下载 mjpro150 linux安装包mkdir ~/.mujococp mjpro150_linux.zip ~/.mujococd ~/.mujocounzip mjpro150_linux.zip2.拷贝许可证:cp mjkey.txt ~/.mujococp mjkey.txt ~/.mujoco/mjpro150/bin3.添加环境变量:vim ~/.bashrcexport LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}使配置马上生效 source ~/.bashrc4.测试是否安装成功:cd ~/.mujoco/mjpro150/bin./simulate ../model/humanoid.xml3.测试是否安装成功例子1:import gymenv = gym.make("CartPole-v1") # 创建游戏环境observation = env.reset() # 游戏回到初始状态for _ in range(1000):env.render() # 显示当前时间戳的游戏画面action = env.action_space.sample() # 随机生成一个动作# 与环境交互,返回新的状态,奖励,是否结束标志,其他信息observation, reward, done, info = env.step(action)if done:#游戏回合结束,复位状态observation = env.reset()env.close()4.测试是否安装成功例子2:import gymenv = gym.make('Hero-ram-v0')for i_episode in range(20):observation = env.reset()for t in range(100):env.render()print(observation)action = env.action_space.sample()observation, reward, done, info = env.step(action)if done:print("Episode finished after {} timesteps".format(t+1))break

测试是否安装成功gym的例子1 

测试是否安装成功gym的例子2


baseline 安装OpenAI Baseline是一系列高质量的强化学习控制算法,需要python>=3.5,且需要OpenMPI和zlib,有些Baseline example是基于Mujoco 物理仿真环境的。1.baseline 安装git clone https://github.com/openai/baselines.gitcd ~/baselinespip install -e .2.在baseline 中对算法进行测试,需要安装pytestpip install pytest3.测试是否安装成功cd ~/baselines/baselines/her/experiment#play.py为调用训练好的参数进行执行python play.py policy_best.pkl (后面需要跟着训练好的参数文件)注意:还必须安装 Nvidia驱动、tensorflow-gpu、CUDA、cuDNNpip install tensorflow-gpuimport tensorflow as tfprint(tf.__version__)

强化学习平台安装 Mujoco、mujoco-py、gym、baseline相关推荐

  1. Ubuntu下常用强化学习实验环境搭建(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)

    原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590 和其它的机器学习方向一样,强化学习(Reinforcement Learni ...

  2. openai的gym baseline spiningup 深度强化学习环境安装 手撸gym环境demo

    按照spiningup我们学习DRL,链接 https://github.com/openai/gym https://github.com/openai/baselines 1. 安装anacond ...

  3. 清华本科生开发强化学习平台「天授」:千行代码实现,性能吊打国外成熟平台,刚刚开源...

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 江山代有才人出,开源一波更比一波强. 就在最近,一个简洁.轻巧.快速的深度强化学习平台,完全基于Pytorch,在Github上开源. 如 ...

  4. 【强化学习】grid_mdp创建自己的gym环境

    一.参考资料 强化学习实战 第一讲 gym学习及二次开发 [深入浅出强化学习原理入门]grid_mdp.py运行几个问题的解决方法] reinforcement-learning-code源代码 二. ...

  5. Facebook开源Horizon:首个用于大规模产品和服务的强化学习平台

    Horizon是首个使用应用强化学习(RL)在大规模生产环境中优化系统的端到端开源平台. 这个版本中包含的工作流和算法是以开放框架为基础构建的--PyTorch 1.0.Caffe2和Spark--使 ...

  6. 清华大学人工智能研究院开源“天授”强化学习平台

    深度强化学习(deep RL)近年来取得了令人瞩目的进步,在Atari游戏.围棋等领域战胜了人类.但是,在面对不确定环境.不完全信息的任务时仍然面临很大的挑战.如何求解非完全信息.不确定条件下的决策问 ...

  7. 【强化学习探索01】Win10 下gym安装

    一.序言 ⾸先, gym 是 OpenAI 开发的通⽤强化学习算法测试平台, 背后有⼤神 Pieter Abbeel. Sergey Levine 等⼈率领的强⼤团队的⽀持.其次, 学会了gym的基本 ...

  8. 花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平台: 而像这样的一只PR2,售价高达40万美元( ...

  9. classin安卓手机安装条件_Classin在线学习平台安装指引——从这里打开知识的大门与北京四中网校名师面对面交流学习!...

    中华教育与北京四中网校名师联袂执教,从这里打开知识的大门与北京四中网校名师面对面交流学习! 中华教育 16年精磨教学 北京四中网校 国内教育排头兵 Classin 学习平台下载步骤 登录官网下载Cla ...

  10. 谷歌大脑推出机器人强化学习平台,硬件代码全开源,花最少的钱,训超6的机器人...

    点击我爱计算机视觉标星,更快获取CVML新技术 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平 ...

最新文章

  1. Failed to load the native TensorFlow runtime.
  2. 面试题总结15 自己构建一个哈希表
  3. Scala 闭包详解
  4. oracle如何配置dns连接,图文详解添加DNS服务器的操作步骤
  5. python自定义colorbar_python可视化 matplotlib画图使用colorbar工具自定义颜色
  6. 成像数据更好的展示_为什么更多的数据并不总是更好
  7. AptanaStudio3+PHP程序远程调试的方法和步骤
  8. SecureCRT 连数据库,启动tomcat操作命令
  9. oc渲染器中文手册_C4D·OC高级渲染视频教程,带你玩转质感渲染
  10. checkbox未赋值时获取value是on_【漏洞分析】关于mysqlconnectorjava连接时的反序列化...
  11. 我的QQ斗地主史及斗地主经验
  12. 关于cocos2d引擎写的手游加速
  13. SAR—距离向脉冲压缩的一些理解
  14. 台式计算机有乱码如何解决,电脑乱码怎么办,开机乱码解决方法
  15. la是什么牌子_la bruket是什么牌子_哪个国家的_什么档次
  16. 塑料件设计-筋厚度与主体壁厚的关系
  17. js 比较啷个日期的大小
  18. 【Unity Shader学习】边缘泛光效果
  19. Android 听筒模式和扬声器模式切换的 实现
  20. 计算机属性中只有远程协助,使用Windows自带的远程协助功能解决电脑问题

热门文章

  1. C语言 通讯录项目完整代码
  2. 基于stm32F4的项目总结:控制层设计(四)直流有刷电机驱动原理及驱动器选型
  3. 2021最新一线互联网大厂常见高并发面试题解析,快手Java面试算法题
  4. 【OpenCV】 车牌识别检测
  5. VC-MFC程序设计精讲
  6. 用python进行小波包分解
  7. linux 运行可执行文件
  8. 基于百度云AI开发车型识别车牌识别案例详解
  9. arduino+无源蜂鸣器制作音乐《诺言》(实战篇)——从识读简乐谱到程序编写
  10. k2p拆机ttl刷breed_最新k2p 22.10.3.42;22.10.3.38和k2 22.6.532.231拆机ttl刷breed图文教程