目录

1.安装Anaconda

2.在Anaconda中创建ML-agent环境,并更换Python版本

3.激活项目环境

4.安装Tensorflow

5.安装ML-Agent扩展工具

6.安装环境依赖

7.启动项目

8.开始训练

9. 查看训练结果


1.安装Anaconda

先贴一个官方安装教程。

关于安装Anaconda,之前写过相关教程:链接地址

注意,最新版的Anaconda默认配置Python版本为3.7,而目前ML-agent支持3.6版本,后面需要我们在项目环境中更换Python版本。

添加系统环境变量:在PATH中添加

%UserProfile%\Anaconda3\Scripts
%UserProfile%\Anaconda3\Scripts\conda.exe
%UserProfile%\Anaconda3
%UserProfile%\Anaconda3\python.exe

2.在Anaconda中创建ML-agent环境,并更换Python版本

打开Prompt

conda create -n ml-agents python=3.6

出现以上结果代表安装成功。

3.激活项目环境

activate ml-agents

4.安装Tensorflow

pip install tensorflow==1.7.1

关于tensorflow版本,官方安装文档这样解释:TensorFlow的其他版本可能不起作用,因此您需要确保安装版本为1.7.1。

由于我当时安装网络不太稳定,并且电脑上有多个pip版本,自己用的下面这条指令安装的:

python -m pip --default-timeout=100 install tensorflow==1.7.1

也可以更换镜像源下载,举个清华镜像的栗子:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow==1.7.1

安装结果:

5.安装ML-Agent扩展工具

(1)使用git下载ml-agents工程文件:

git clone --branch latest_release https://github.com/Unity-Technologies/ml-agents.git

或者通过此链接直接下载最新的ml-agents工程文件

注意自己的下载路径,后续训练要用到

(2)上一步完成后,再通过pip安装mlagent的Python扩展包

pip install mlagents

官方文档中提到windows有时候会出现缓存不足(就是出现读取时间超时的提示)的情况,如果遇到可以通过以下命令安装

pip install mlagents --no-cache-dir

当然,还是因为网络问题和环境问题,自己是这样安装的(镜像下载):

python -m pip --default-timeout=100 install mlagents

安装结果:

6.安装环境依赖

首先在cmd中找到之前的下载安装路径并激活ml-agents环境

(1)配置相关环境一

cd ml-agents
pip install -e ./

安装完成提示

(2)配置相关环境二(别忘了返回路径)

cd ..
cd ml-agents-envs
pip install -e ./

安装完成提示

7.启动项目

(1)打开Unity

(2)打开新工程——打开下载的文件中的Unity SDK文件夹

2021.5.18更新:最新文件名改成了Project,其实找这个Unity SDK不难,翻一翻,有Assets目录肯定是

(3)选择菜单Edit > Project Settings > Player

(4)选择对应平台:PC、IOS或者Android均可,并且运行环境选择(.NET 4.6 Equivalent 或者 .NET 4.x Equivalent)

8.开始训练

(1)检测1-6步是否安装成功

mlagents-learn

如果任意路径此命令都不会出现错误提示,代表安装成功。

你应该会看到如下画面

(2)键入安装路径,激活环境,

然后输入


(此为前几个版本的训练指令):

mlagents-learn <trainer-config-path> --run-id=<run-identifier> --train

<trainer-config-path> 是训练的路径,一般默认config/trainer_config.yaml

<run-identifier> 是对应Prefabs中3DBall的Behavior Name属性


注意,官方最新的release doc给的训练指令为

mlagents-learn <trainer-config-file> --env=<env_name> --run-id=<run-identifier>

此命令并非训练指令,如需训练请在结尾加上--train

mlagents-learn <trainer-config-file> --env=<env_name> --run-id=<run-identifier> --train

同样

<trainer-config-path> 是训练的路径,一般默认config/ppo/xxx.yaml

<env_name>(可选填)关于Unity中环境搭配(类似Anaconda中环境搭配)访问这里

<run-identifier> 是对应Prefabs中3DBall的Behavior Name属性

就我自己的情况就是:

mlagents-learn config/ppo/3DBall.yaml --run-id=3DBall --train

第一次运行还碰到了Window的防火墙提示,允许后再次运行此命令就行了。

OK,如果出现让你启动Unity Play按钮的提示,就代表配置大功告成了:

Unity中点击Play运行,应该会看到如下提示:

Unity中训练画面:

可以看到后面的都是训练结果:

2020-06-30 14:06:06 INFO [stats.py:111] 3DBall: Step: 12000. Time Elapsed: 17.647 s Mean Reward: 1.193. Std of Reward: 0.776. Training.
2020-06-30 14:06:15 INFO [stats.py:111] 3DBall: Step: 24000. Time Elapsed: 26.153 s Mean Reward: 1.256. Std of Reward: 0.764. Training.
2020-06-30 14:06:23 INFO [stats.py:111] 3DBall: Step: 36000. Time Elapsed: 34.166 s Mean Reward: 1.548. Std of Reward: 1.008. Training.
2020-06-30 14:06:32 INFO [stats.py:111] 3DBall: Step: 48000. Time Elapsed: 43.122 s Mean Reward: 2.247. Std of Reward: 1.422. Training.
2020-06-30 14:06:40 INFO [stats.py:111] 3DBall: Step: 60000. Time Elapsed: 51.094 s Mean Reward: 3.385. Std of Reward: 2.459. Training.
2020-06-30 14:06:47 INFO [stats.py:111] 3DBall: Step: 72000. Time Elapsed: 58.951 s Mean Reward: 6.397. Std of Reward: 5.280. Training.
2020-06-30 14:06:55 INFO [stats.py:111] 3DBall: Step: 84000. Time Elapsed: 66.782 s Mean Reward: 14.555. Std of Reward: 17.268. Training.
2020-06-30 14:07:04 INFO [stats.py:111] 3DBall: Step: 96000. Time Elapsed: 75.288 s Mean Reward: 27.898. Std of Reward: 17.444. Training.
2020-06-30 14:07:13 INFO [stats.py:111] 3DBall: Step: 108000. Time Elapsed: 84.793 s Mean Reward: 75.456. Std of Reward: 33.044. Training.
2020-06-30 14:07:21 INFO [stats.py:111] 3DBall: Step: 120000. Time Elapsed: 92.778 s Mean Reward: 92.992. Std of Reward: 16.129. Training.
2020-06-30 14:07:33 INFO [stats.py:111] 3DBall: Step: 132000. Time Elapsed: 105.000 s Mean Reward: 96.162. Std of Reward: 10.186. Training.
2020-06-30 14:07:42 INFO [stats.py:111] 3DBall: Step: 144000. Time Elapsed: 113.634 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:07:49 INFO [stats.py:111] 3DBall: Step: 156000. Time Elapsed: 120.907 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:07:57 INFO [stats.py:111] 3DBall: Step: 168000. Time Elapsed: 128.464 s Mean Reward: 97.133. Std of Reward: 9.508. Training.
2020-06-30 14:08:04 INFO [stats.py:111] 3DBall: Step: 180000. Time Elapsed: 135.820 s Mean Reward: 95.838. Std of Reward: 13.877. Training.
2020-06-30 14:08:12 INFO [stats.py:111] 3DBall: Step: 192000. Time Elapsed: 143.559 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
2020-06-30 14:08:20 INFO [stats.py:111] 3DBall: Step: 204000. Time Elapsed: 151.464 s Mean Reward: 100.000. Std of Reward: 0.000. Training.

旧:

INFO:mlagents.trainers: 3DBall: 3DBall: Step: 1000. Time Elapsed: 71.770 s Mean Reward: 1.134. Std of Reward: 0.696. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 2000. Time Elapsed: 86.892 s Mean Reward: 1.239. Std of Reward: 0.806. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 3000. Time Elapsed: 100.753 s Mean Reward: 1.564. Std of Reward: 0.967. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 4000. Time Elapsed: 371.056 s Mean Reward: 2.150. Std of Reward: 1.344. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 5000. Time Elapsed: 383.597 s Mean Reward: 3.251. Std of Reward: 2.715. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 6000. Time Elapsed: 396.874 s Mean Reward: 4.871. Std of Reward: 3.769. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 7000. Time Elapsed: 409.179 s Mean Reward: 8.823. Std of Reward: 7.994. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 8000. Time Elapsed: 421.222 s Mean Reward: 17.800. Std of Reward: 14.920. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 9000. Time Elapsed: 432.751 s Mean Reward: 42.621. Std of Reward: 36.739. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 10000. Time Elapsed: 444.206 s Mean Reward: 72.556. Std of Reward: 35.098. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 11000. Time Elapsed: 455.780 s Mean Reward: 65.165. Std of Reward: 40.413. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 12000. Time Elapsed: 467.139 s Mean Reward: 92.431. Std of Reward: 26.221. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 13000. Time Elapsed: 478.892 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 14000. Time Elapsed: 490.056 s Mean Reward: 92.469. Std of Reward: 26.087. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 15000. Time Elapsed: 503.001 s Mean Reward: 100.000. Std of Reward: 0.000. Training.
INFO:mlagents.trainers: 3DBall: 3DBall: Step: 16000. Time Elapsed: 513.519 s Mean Reward: 100.000. Std of Reward: 0.000. Training.

中间可以通过Ctrl+C来终止训练

9. 查看训练结果

终止训练后,训练结果会保存到:results/<behavior_name>/<behavior_name>.nn

运行结果会提示你训练的.nn文件保存至哪里

然后,我们把此文件命名为3DBall_New.cnn,把此文件拖入Unity此路径下 :Project/Assets/ML-Agents/Examples/3DBall/TFModels/

按下图所示替换,然后再次运行游戏场景即可(注意要替换预制体中的而不是游戏场景中的)。

替换完成训练结果

不懂的地方留言提问吧

码字不易,求赞~   

ML-Agents安装教程(Unity机器学习/2020.6.30最新更新)相关推荐

  1. dvwa安装教程linux,Kali 2020.3安装docker和vulhub

    一.环境准备 系统镜像: kali-linux-2020.3-installer-amd64 安装docker官方文档: 清华镜像: curl -fsSL https://mirrors.tuna.t ...

  2. [acer] 地平线:mac记————lion懒人版安装教程全解(驱动贴已更新,亲测通过)

      本人配置 处理器                   英特尔 Core i5-2410M @ 2.30GHz 双核 主   板                   宏碁 Aspire 4750 ( ...

  3. LaTeX的安装教程及问题记录

    安装教程 我的安装过程参考的博客: LaTeX的安装教程(Texlive 2020 + TeX studio) 遇到的问题 TLUtils::install_packages: Failed to i ...

  4. 小葫芦直播管家找不到服务器,小葫芦直播管家-开播版,直播插件手动安装教程...

    小葫芦直播管家-开播版,直播插件手动安装教程 小葫芦直播管家-开播版最新版本支持添加各种直播插件啦!先给大家分享简单快速的添加方法. 注意:准备好32位的OBS Studio插件!可前往 小葫芦插件市 ...

  5. 独立版企微魔盒企业微信系统V7.5开源版 带安装教程

    下载:D立版企微魔盒企业微信系统V7.5开源版带安装教程-小程序文档类资源-CSDN下载 更新日志: 1.部分功能适配新版企业微信第三方应用API: 2.解决企业微信第三方API调整后扫码显示企业未入 ...

  6. quartus安装教程

    好的,以下是 Quartus 的安装教程: 从 Intel 网站下载最新版本的 Quartus Prime 软件:https://www.intel.com/content/www/us/en/sof ...

  7. 会声会影V2021新补丁及安装教程中出现的错误解决方法

    拿会声会影2018安装教程分享,详见文章末尾最新会声会影版. ps:部分国内杀毒软件未收录会声会影2018新补丁,建议在安装软件前,先检查是否有杀毒软件运行,如有运行,请关闭杀毒软件. 1.下载完成后 ...

  8. 独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)

    原文标题:How to Create a Linux Virtual Machine For Machine Learning Development With Python 3 作者:Jason B ...

  9. 独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)...

    Linux是使用Python进行机器学习开发的极佳环境.这些工具能够被简便快捷地安装,并且您可以直接开发和运行大型模型. 在本教程中,您将了解如何使用Python创建和安装用于机器学习的Linux虚拟 ...

最新文章

  1. python写炒股软件_利用 Python 构建自己的股票投资系统
  2. 如何卸载干净32位的Office
  3. Java EE API整合:为什么Spring要与“笨重”的Java EE共舞?
  4. Note for Consulting Handbook5
  5. (转)模拟鼠标/键盘
  6. 今天研究了一下关于Asp.net文件上传时的内存消耗问题
  7. 冠军奖10万日元+10公斤柠檬!一个简单的柠檬图像分级竞赛
  8. es6 Mixin 模式的实现
  9. 从编写到上线带你搞定springboot博客01
  10. vim显示行号_使用 vim 不得不看的 2 个 tips
  11. bzoj3173: [Tjoi2013]最长上升子序列(fhqtreap)
  12. mysql优化教程_Mysql优化一
  13. 【网启树莓派】无SD卡 从网络驱动树莓派| raspberry boot via pxe
  14. 计算机专业实训指导老师评语,计算机教师指导评语
  15. 积分墙、广告等违规应用如何在安卓市场上线
  16. 2017华东师范大学网络赛—A
  17. [RK3399][Android7.1] 移植笔记 --- 9.7寸eDP显示屏添加
  18. AppleWWDRCA.cer证书
  19. 计算机硬件网络设备,[计算机硬件及网络]网络设备的选型.ppt
  20. Android stdio之 'adb' 不是内部或外部命令,也不是可运行的程序 或批处理文件。

热门文章

  1. 利用手机破解91点金积分应用
  2. 【Laravel3.0.0源码阅读分析】文件缓存类file.php
  3. Spring 源码分析 (一)——迈向 Spring 之路
  4. 巧解异或操作的逆运算——位运算结合律
  5. Debugbar工具条安装
  6. 关于泡泡龙游戏的一点儿总结,以及分享一个好方法
  7. 场外交易是什么?你对它的了解有多少?
  8. layui 表格加载动画_仅需四步!BIM模型变身为漫游动画!
  9. 大数据在营销中的应用
  10. unity3d package 管理