ML-Agents安装教程(Unity机器学习/2020.6.30最新更新)
目录
1.安装Anaconda
2.在Anaconda中创建ML-agent环境,并更换Python版本
3.激活项目环境
4.安装Tensorflow
5.安装ML-Agent扩展工具
6.安装环境依赖
7.启动项目
8.开始训练
9. 查看训练结果
1.安装Anaconda
先贴一个官方安装教程。
关于安装Anaconda,之前写过相关教程:链接地址
注意,最新版的Anaconda默认配置Python版本为3.7,而目前ML-agent支持3.6版本,后面需要我们在项目环境中更换Python版本。
添加系统环境变量:在PATH中添加
%UserProfile%\Anaconda3\Scripts
%UserProfile%\Anaconda3\Scripts\conda.exe
%UserProfile%\Anaconda3
%UserProfile%\Anaconda3\python.exe
2.在Anaconda中创建ML-agent环境,并更换Python版本
打开Prompt
conda create -n ml-agents python=3.6
出现以上结果代表安装成功。
3.激活项目环境
activate ml-agents
4.安装Tensorflow
pip install tensorflow==1.7.1
关于tensorflow版本,官方安装文档这样解释:TensorFlow的其他版本可能不起作用,因此您需要确保安装版本为1.7.1。
由于我当时安装网络不太稳定,并且电脑上有多个pip版本,自己用的下面这条指令安装的:
python -m pip --default-timeout=100 install tensorflow==1.7.1
也可以更换镜像源下载,举个清华镜像的栗子:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow==1.7.1
安装结果:
5.安装ML-Agent扩展工具
(1)使用git下载ml-agents工程文件:
git clone --branch latest_release https://github.com/Unity-Technologies/ml-agents.git
或者通过此链接直接下载最新的ml-agents工程文件
注意自己的下载路径,后续训练要用到
(2)上一步完成后,再通过pip安装mlagent的Python扩展包
pip install mlagents
官方文档中提到windows有时候会出现缓存不足(就是出现读取时间超时的提示)的情况,如果遇到可以通过以下命令安装
pip install mlagents --no-cache-dir
当然,还是因为网络问题和环境问题,自己是这样安装的(镜像下载):
python -m pip --default-timeout=100 install mlagents
安装结果:
6.安装环境依赖
首先在cmd中找到之前的下载安装路径并激活ml-agents环境
(1)配置相关环境一
cd ml-agents
pip install -e ./
安装完成提示
(2)配置相关环境二(别忘了返回路径)
cd ..
cd ml-agents-envs
pip install -e ./
安装完成提示
7.启动项目
(1)打开Unity
(2)打开新工程——打开下载的文件中的Unity SDK文件夹
2021.5.18更新:最新文件名改成了Project,其实找这个Unity SDK不难,翻一翻,有Assets目录肯定是
(3)选择菜单Edit > Project Settings > Player
(4)选择对应平台:PC、IOS或者Android均可,并且运行环境选择(.NET 4.6 Equivalent 或者 .NET 4.x Equivalent)
8.开始训练
(1)检测1-6步是否安装成功
mlagents-learn
如果任意路径此命令都不会出现错误提示,代表安装成功。
你应该会看到如下画面
(2)键入安装路径,激活环境,
然后输入
(此为前几个版本的训练指令):
mlagents-learn <trainer-config-path> --run-id=<run-identifier> --train
<trainer-config-path> 是训练的路径,一般默认config/trainer_config.yaml
<run-identifier> 是对应Prefabs中3DBall的Behavior Name属性
注意,官方最新的release doc给的训练指令为
mlagents-learn <trainer-config-file> --env=<env_name> --run-id=<run-identifier>
此命令并非训练指令,如需训练请在结尾加上--train
mlagents-learn <trainer-config-file> --env=<env_name> --run-id=<run-identifier> --train
同样
<trainer-config-path> 是训练的路径,一般默认config/ppo/xxx.yaml
<env_name>(可选填)关于Unity中环境搭配(类似Anaconda中环境搭配)访问这里
<run-identifier> 是对应Prefabs中3DBall的Behavior Name属性
就我自己的情况就是:
mlagents-learn config/ppo/3DBall.yaml --run-id=3DBall --train
第一次运行还碰到了Window的防火墙提示,允许后再次运行此命令就行了。
OK,如果出现让你启动Unity Play按钮的提示,就代表配置大功告成了:
Unity中点击Play运行,应该会看到如下提示:
Unity中训练画面:
可以看到后面的都是训练结果:
2020-06-30 14:06:06 INFO [stats.py:111] 3DBall: Step: 12000. Time Elapsed: 17.647 s Mean Reward: 1.193. Std of Reward: 0.776. Training.
2020-06-30 14:06:15 INFO [stats.py:111] 3DBall: Step: 24000. Time Elapsed: 26.153 s Mean Reward: 1.256. Std of Reward: 0.764. Training.
2020-06-30 14:06:23 INFO [stats.py:111] 3DBall: Step: 36000. Time Elapsed: 34.166 s Mean Reward: 1.548. Std of Reward: 1.008. Training.
2020-06-30 14:06:32 INFO [stats.py:111] 3DBall: Step: 48000. Time Elapsed: 43.122 s Mean Reward: 2.247. Std of Reward: 1.422. Training.
2020-06-30 14:06:40 INFO [stats.py:111] 3DBall: Step: 60000. Time Elapsed: 51.094 s Mean Reward: 3.385. Std of Reward: 2.459. Training.
2020-06-30 14:06:47 INFO [stats.py:111] 3DBall: Step: 72000. Time Elapsed: 58.951 s Mean Reward: 6.397. Std of Reward: 5.280. Training.
2020-06-30 14:06:55 INFO [stats.py:111] 3DBall: Step: 84000. Time Elapsed: 66.782 s Mean Reward: 14.555. Std of Reward: 17.268. Training.
2020-06-30 14:07:04 INFO [stats.py:111] 3DBall: Step: 96000. Time Elapsed: 75.288 s Mean Reward: 27.898. Std of Reward: 17.444. Training.
2020-06-30 14:07:13 INFO [stats.py:111] 3DBall: Step: 108000. Time Elapsed: 84.793 s Mean Reward: 75.456. Std of Reward: 33.044. Training.
2020-06-30 14:07:21 INFO [stats.py:111] 3DBall: Step: 120000. Time Elapsed: 92.778 s Mean Reward: 92.992. Std of Reward: 16.129. Training.
2020-06-30 14:07:33 INFO [stats.py:111] 3DBall: Step: 132000. Time Elapsed: 105.000 s Mean Reward: 96.162. Std of Reward: 10.186. Training.
2020-06-30 14:07:42 INFO [stats.py:111] 3DBall: Step: 144000. Time Elapsed: 113.634 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:07:49 INFO [stats.py:111] 3DBall: Step: 156000. Time Elapsed: 120.907 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:07:57 INFO [stats.py:111] 3DBall: Step: 168000. Time Elapsed: 128.464 s Mean Reward: 97.133. Std of Reward: 9.508. Training.
2020-06-30 14:08:04 INFO [stats.py:111] 3DBall: Step: 180000. Time Elapsed: 135.820 s Mean Reward: 95.838. Std of Reward: 13.877. Training.
2020-06-30 14:08:12 INFO [stats.py:111] 3DBall: Step: 192000. Time Elapsed: 143.559 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:08:20 INFO [stats.py:111] 3DBall: Step: 204000. Time Elapsed: 151.464 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
旧:
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 1000. Time Elapsed: 71.770 s Mean Reward: 1.134. Std of Reward: 0.696. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 2000. Time Elapsed: 86.892 s Mean Reward: 1.239. Std of Reward: 0.806. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 3000. Time Elapsed: 100.753 s Mean Reward: 1.564. Std of Reward: 0.967. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 4000. Time Elapsed: 371.056 s Mean Reward: 2.150. Std of Reward: 1.344. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 5000. Time Elapsed: 383.597 s Mean Reward: 3.251. Std of Reward: 2.715. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 6000. Time Elapsed: 396.874 s Mean Reward: 4.871. Std of Reward: 3.769. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 7000. Time Elapsed: 409.179 s Mean Reward: 8.823. Std of Reward: 7.994. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 8000. Time Elapsed: 421.222 s Mean Reward: 17.800. Std of Reward: 14.920. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 9000. Time Elapsed: 432.751 s Mean Reward: 42.621. Std of Reward: 36.739. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 10000. Time Elapsed: 444.206 s Mean Reward: 72.556. Std of Reward: 35.098. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 11000. Time Elapsed: 455.780 s Mean Reward: 65.165. Std of Reward: 40.413. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 12000. Time Elapsed: 467.139 s Mean Reward: 92.431. Std of Reward: 26.221. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 13000. Time Elapsed: 478.892 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 14000. Time Elapsed: 490.056 s Mean Reward: 92.469. Std of Reward: 26.087. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 15000. Time Elapsed: 503.001 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 16000. Time Elapsed: 513.519 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
中间可以通过Ctrl+C来终止训练
9. 查看训练结果
终止训练后,训练结果会保存到:results/<behavior_name>/<behavior_name>.nn
运行结果会提示你训练的.nn文件保存至哪里
然后,我们把此文件命名为3DBall_New.cnn,把此文件拖入Unity此路径下 :Project/Assets/ML-Agents/Examples/3DBall/TFModels/
按下图所示替换,然后再次运行游戏场景即可(注意要替换预制体中的而不是游戏场景中的)。
替换完成训练结果
不懂的地方留言提问吧
码字不易,求赞~
ML-Agents安装教程(Unity机器学习/2020.6.30最新更新)相关推荐
- dvwa安装教程linux,Kali 2020.3安装docker和vulhub
一.环境准备 系统镜像: kali-linux-2020.3-installer-amd64 安装docker官方文档: 清华镜像: curl -fsSL https://mirrors.tuna.t ...
- [acer] 地平线:mac记————lion懒人版安装教程全解(驱动贴已更新,亲测通过)
本人配置 处理器 英特尔 Core i5-2410M @ 2.30GHz 双核 主 板 宏碁 Aspire 4750 ( ...
- LaTeX的安装教程及问题记录
安装教程 我的安装过程参考的博客: LaTeX的安装教程(Texlive 2020 + TeX studio) 遇到的问题 TLUtils::install_packages: Failed to i ...
- 小葫芦直播管家找不到服务器,小葫芦直播管家-开播版,直播插件手动安装教程...
小葫芦直播管家-开播版,直播插件手动安装教程 小葫芦直播管家-开播版最新版本支持添加各种直播插件啦!先给大家分享简单快速的添加方法. 注意:准备好32位的OBS Studio插件!可前往 小葫芦插件市 ...
- 独立版企微魔盒企业微信系统V7.5开源版 带安装教程
下载:D立版企微魔盒企业微信系统V7.5开源版带安装教程-小程序文档类资源-CSDN下载 更新日志: 1.部分功能适配新版企业微信第三方应用API: 2.解决企业微信第三方API调整后扫码显示企业未入 ...
- quartus安装教程
好的,以下是 Quartus 的安装教程: 从 Intel 网站下载最新版本的 Quartus Prime 软件:https://www.intel.com/content/www/us/en/sof ...
- 会声会影V2021新补丁及安装教程中出现的错误解决方法
拿会声会影2018安装教程分享,详见文章末尾最新会声会影版. ps:部分国内杀毒软件未收录会声会影2018新补丁,建议在安装软件前,先检查是否有杀毒软件运行,如有运行,请关闭杀毒软件. 1.下载完成后 ...
- 独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)
原文标题:How to Create a Linux Virtual Machine For Machine Learning Development With Python 3 作者:Jason B ...
- 独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)...
Linux是使用Python进行机器学习开发的极佳环境.这些工具能够被简便快捷地安装,并且您可以直接开发和运行大型模型. 在本教程中,您将了解如何使用Python创建和安装用于机器学习的Linux虚拟 ...
最新文章
- python写炒股软件_利用 Python 构建自己的股票投资系统
- 如何卸载干净32位的Office
- Java EE API整合:为什么Spring要与“笨重”的Java EE共舞?
- Note for Consulting Handbook5
- (转)模拟鼠标/键盘
- 今天研究了一下关于Asp.net文件上传时的内存消耗问题
- 冠军奖10万日元+10公斤柠檬!一个简单的柠檬图像分级竞赛
- es6 Mixin 模式的实现
- 从编写到上线带你搞定springboot博客01
- vim显示行号_使用 vim 不得不看的 2 个 tips
- bzoj3173: [Tjoi2013]最长上升子序列(fhqtreap)
- mysql优化教程_Mysql优化一
- 【网启树莓派】无SD卡 从网络驱动树莓派| raspberry boot via pxe
- 计算机专业实训指导老师评语,计算机教师指导评语
- 积分墙、广告等违规应用如何在安卓市场上线
- 2017华东师范大学网络赛—A
- [RK3399][Android7.1] 移植笔记 --- 9.7寸eDP显示屏添加
- AppleWWDRCA.cer证书
- 计算机硬件网络设备,[计算机硬件及网络]网络设备的选型.ppt
- Android stdio之 'adb' 不是内部或外部命令,也不是可运行的程序 或批处理文件。