Unity 机器学习 ML-Agents 基础

Unity 官方示例下载
- ML-Agents 部分
- Python 下载
Anaconda
- Anaconda 环境变量
- Anaconda 基础环境
- Anaconda 虚拟环境构建 ML-Agents
- - 安装 ML-Agents Python 包
  - 安装 ML-Agents 包
ML-Agents 入门指南
- Unity Hub 部分
- 虚拟环境训练
- - 虚拟环境训练运行：
  - 虚拟环境开始训练：
  - 虚拟环境观察训练进度：
  - 虚拟环境停止训练
  - 虚拟环境恢复训练
  - 虚拟环境训练模型
ML-Agents 打造新的学习环境
- ML-Agents 资产导入
- Unity 场景创建
- Unity 代码部分
Anaconda 执行
- rollerball_config.yaml 机器学习逻辑处理代码
- Anaconda 虚拟环境
地址合集
虚拟环境命令小结
- 虚拟环境安装
- 虚拟环境训练命令

Unity 官方示例下载

Unity 中国地址 : Unity 中国 ML-Agents 示例下载

进入官方网站

点击机器学习代理

ML-Agents 部分

ML_Agents: 下载GitHub 项目.

下载 机器学习项目 选择想要下载的版本

当然你也可以在主页自主点击文档。

Unity ML-Agents 工具包文档地址

Python 下载

Python 下载地址

使用 ML-Agents Toolkit 的条件：
重要的是：1. Unity 2. Python（根据版本不同下载不同的，我这里使用的是 3.7）3. Anaconda (Python 可视化窗口软件)

这里点击安装就会跳转 Python 下载界面

选择你想要安装的版本下载。下载完毕之后默认安装就行。

Anaconda

Anaconda 官方网站

打开 Anaconda 官方网站

下载 Anaconda  下载完毕之后看自己的喜好安装，尽量不要有中文路径！！！！

Anaconda 环境变量

下载安装完毕之后 按菜单键 找到Anaconda Prompt 打开

键入 conda --version 查看是否有返回值 如果没有 就是需要添加环境变量

搜索栏 搜索环境变量

点击环境变量按钮

找到 系统变量的 Path 点击编辑 当然双击也是可以的

点击新建将这四条添加进去：%UserProfile%\Anaconda3\Scripts%UserProfile%\Anaconda3\Scripts\conda.exe%UserProfile%\Anaconda3%UserProfile%\Anaconda3\python.exe

添加完毕之后一路确认

点击应用 确定 Anaconda环境变量就添加好了

Anaconda 基础环境

新建自己的环境

等待加载

加载完毕之后左键点击，再点击 Open Treminal 打开 虚拟环境

Anaconda 虚拟环境构建 ML-Agents

安装 ML-Agents Python 包

您必须在安装 ML-Agents 之前单独安装 PyTorch 包
PyTorch 包安装命令：
pip3 install torch~=1.7.1 -f https://download.pytorch.org/whl/torch_stable.html

安装 ML-Agents 包

安装 ML-Agents包 命令：
python -m pip install mlagents==0.28.0

如果到目前为止都没有什么报错，基本上就算可以正常联通了。

ML-Agents 入门指南

Unity Hub 部分

解压 GitHub  ML-Agents 压缩包

虚拟环境训练

导航到克隆 ML-Agents 存储库的文件夹（看你解压在那个位置）复制路径
我的路径是：D:\Unity\Plug-in\ML\ml-agents-release_19\ml-agents-release_19

导航到 ML-Agents 根目录

虚拟环境训练运行：

训练环境运行：
mlagents-learn config/ppo/3DBall.yaml --run-id=first3DBallRun05

config/ppo/3DBall.yaml是我们提供的默认训练配置文件的路径。该config/ppo文件夹包含我们所有示例环境的训练配置文件，包括 3Dball
run-id 是此培训课程的唯一名称

当屏幕上显示“按 Unity 编辑器中的播放按钮开始训练”消息时，您可以在 Unity 中按“播放”按钮开始在编辑器中进行训练。
Unity 运行效果：

虚拟环境开始训练：

如果mlagents-learn运行正确并开始训练，您应该会看到如下内容：

虚拟环境观察训练进度：

观察训练进度命令：
tensorboard --logdir results

虚拟环境停止训练

退出训练： Ctrl+C
停止训练后 在浏览器 键入 http://localhost:6006/ 可以查看训练进度。
最重要的统计数据是Environment/Cumulative Reward 应该在整个训练过程中增加，最终收敛到100代理可以积累的最大奖励附近。

虚拟环境恢复训练

恢复训练，请再次运行相同的命令，并附加--resume标志
恢复训练命令：
mlagents-learn config/ppo/3DBall.yaml --run-id=first3DBallRun05 --resume

虚拟环境训练模型

索引到 存储库的文件夹 results 文件下

打开你的训练文件夹 就是 run-id 文件名称

选中最新的训练文件。

也可以 直接选中外部的  .onnx 文件

导入 Unity

搭载：
训练模型 赋值

运行效果：

ML-Agents 打造新的学习环境

ML-Agents 打造新的学习环境官方地址

ML-Agents 资产导入

打开 Unity Package Manager

点击磁盘添加包

在 ML-Agents 根目录下 找到 com.unity.ml-agents 文件夹  打开

选中 package.json 导入

导入成功后 可以Packahes 文件夹 下 找到 MLAgents 文件夹

Unity 场景创建

Target  目标物体创建：参数自己感觉合适就行

地面创建：参数自己感觉合适就行

代理器 创建

创建之后的层级

Unity 代码部分

using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using Unity.MLAgents;
using Unity.MLAgents.Sensors;
using Unity.MLAgents.Actuators;public class RollerAgent_ZH : Agent
{[Header("目标")]public Transform Target;[Header("增强力系数")]public float _ForceMultiplier = 10;[Header("移动组件")]Rigidbody _RigiBody;void Start(){_RigiBody = GetComponent<Rigidbody>();}/// <summary>/// 设置新集的环境/// 场景以随机方式初始化，以使代理能够学习在各种条件下解决任务/// </summary>public override void OnEpisodeBegin(){// 如果特工掉下去，动量为零if (this.transform.localPosition.y < 0){this._RigiBody.angularVelocity = Vector3.zero;this._RigiBody.velocity = Vector3.zero;this.transform.localPosition = new Vector3(0, 0.5f, 0);}// 将目标移动到新点Target.localPosition = new Vector3(Random.value * 8 - 4,0.5f,Random.value * 8 - 4);}/// <summary>/// 观察环境/// 代理收集的信息包括目标的位置、代理本身的位置以及代理的速度/// </summary>/// <param 传感器="sensor"></param>public override void CollectObservations(VectorSensor sensor){// 目标和代理位置sensor.AddObservation(Target.localPosition);sensor.AddObservation(this.transform.localPosition);// 代理速度sensor.AddObservation(_RigiBody.velocity.x);sensor.AddObservation(_RigiBody.velocity.z);}/// <summary>/// 动作和奖励逻辑/// </summary>/// <param 行动缓冲区="actionBuffers"></param>public override void OnActionReceived(ActionBuffers actionBuffers){// 动作, size = 2Vector3 controlSignal = Vector3.zero;controlSignal.x = actionBuffers.ContinuousActions[0];controlSignal.z = actionBuffers.ContinuousActions[1];_RigiBody.AddForce(controlSignal * _ForceMultiplier);// 奖励float distanceToTarget = Vector3.Distance(this.transform.localPosition, Target.localPosition);// 达到目标if (distanceToTarget < 1.42f){SetReward(1.0f);EndEpisode();}// 掉下来的平台else if (this.transform.localPosition.y < 0){EndEpisode();}}/// <summary>/// 键盘控制代理/// </summary>/// <param 行动数组="actionsOut"></param>public override void Heuristic(in ActionBuffers actionsOut){var continuousActionsOut = actionsOut.ContinuousActions;continuousActionsOut[0] = Input.GetAxis("Horizontal");continuousActionsOut[1] = Input.GetAxis("Vertical");}
}

搭载详情：
需要新添加组件： DecisionRequester
注意：参数更改！参数更改！参数更改！ 重要的事情说三遍。

Anaconda 执行

打开 Anaconda 切换环境 左键打开 虚拟环境

导航到 ML-Agents 根目录

rollerball_config.yaml 机器学习逻辑处理代码

behaviors:RollerBall:trainer_type: ppohyperparameters:batch_size: 10buffer_size: 100learning_rate: 3.0e-4beta: 5.0e-4epsilon: 0.2lambd: 0.99num_epoch: 3learning_rate_schedule: linearbeta_schedule: constantepsilon_schedule: linearnetwork_settings:normalize: falsehidden_units: 128num_layers: 2reward_signals:extrinsic:gamma: 0.99strength: 1.0max_steps: 500000time_horizon: 64summary_freq: 10000

在 config 文件夹下 创建 .tex 文件

添加文件内容 就是 上面的代码

更改名称

Anaconda 虚拟环境

如果你也是出现这样的错误，就说明：在此运行ID中找到以前的数据。要么指定一个新的运行ID，使用 --resume 恢复运行要么使用 --force 参数覆盖现有的数据。
我这里选择的是覆盖执行 --force执行命令：
首次执行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall
恢复运行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall --resume
覆盖执行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall --force

命令执行之后点击 播放按钮 就能看到效果了

训练结果：
第一个框选的是：训练模型输出路径。
第二个框选的是：模型训练详情。Ctrl + C 浏览器地址栏查看

模型训练结果：

导入Unity

最终效果：

地址合集

清华大学开源软件镜像站

Anaconda 官方网站

ML-Agents GitHub 项目地址.

Unity 中国 ML-Agents 示例下载

Python 下载地址

安装 PyTorch 包地址

Unity ML-Agents 工具包文档地址

Unity ML-Agents 安装文档地址

Unity ML-Agents入门指南文档地址

Unity ML-Agents 打造新的学习环境文档地址

Unity ML-Agents 使用-Tensorboard.md文档地址

虚拟环境命令小结

虚拟环境安装

克隆 ML-Agents Toolkit 存储库（可选）
git clone --branch release_19 https://github.com/Unity-Technologies/ml-agents.git(Windows) 安装 PyTorch（必选）
pip3 install torch~=1.7.1 -f https://download.pytorch.org/whl/torch_stable.html安装 mlagentsPython 包（必选）
python -m pip install mlagents==0.28.0高级：用于开发的本地安装（注意安装顺序）（可选）
pip3 install torch -f https://download.pytorch.org/whl/torch_stable.html
pip3 install -e ./ml-agents-envs
pip3 install -e ./ml-agents

虚拟环境训练命令

首次执行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall
恢复运行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall --resume
覆盖执行：
mlagents-learn config/rollerball_config.yaml --run-id=RollerBall --force停止训练：
Ctrl + C
观察训练进度：
tensorboard --logdir results

暂时先这样吧，如果有时间的话就会更新，实在看不明白就留言，看到我会回复的。
路漫漫其修远兮，与君共勉。

Unity 机器学习(ML-Agents) 基础相关推荐

unity机器学习入门栗子之3D平衡球
需要的插件:ML-agent:https://store.unity.com/download?ref=update 或者csdn下载地址:http://download.csdn.net/downl ...
年终总结：2021年五大人工智能(AI)和机器学习(ML)发展趋势
明年,人工智能技术将在企业运营中更加根深蒂固. 人工智能(AI)和机器学习(ML)一直在改变着我们的世界,但是2020年给这两个改变游戏规则的人带来了新的机遇和紧迫性-预计2021年会有更大的发展. ...
[机器学习] ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）
本文转自:https://blog.csdn.net/walilk/article/details/50978864 引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记, ...
快速入门Unity机器学习:一:
目录 1.目的 1.1 记录一下 2.参考 1.SIKI学院 3.注意 4. 课时 3 : 100 - Unity机器学习案例下载 5. 课时 4 : 101 - 狗子的学习 6. 课时 5 : 10 ...
人工智能AI和机器学习ML对量化交易领域的影响
BigQuant 人工智能量化投资平台是一站式的Python+机器学习+量化投资平台,对人工智能量化投资感兴趣的朋友可以直接打开浏览器进一步学习研究. 1. 人工智能与机器学习对于交易领域的影响交 ...
AI：人工智能概念之机器学习ML、深度学习DL、数据挖掘、知识发现、模式识别等重要领域之间比较关系结构图之详细攻略
AI:人工智能概念之机器学习ML.深度学习DL.数据挖掘.知识发现.模式识别等重要领域之间比较关系结构图之详细攻略目录 AI与ML.DL的概念 AI与ML.DL的结构关系图参考文章:<201 ...
ML：人工智能之机器学习ML解决实际应用问题的思路总过程(最全)
ML:人工智能之机器学习ML解决实际应用问题的思路总过程(最全) 目录详细思路结构详细思路结构
机器学习算法的基础知识
机器学习算法的基础知识 1.评估指标 2.偏差与方差(过拟合与欠拟合) 3.正则化(解决过拟合) 4.梯度下降算法(算法优化方式) 5.数据不平衡 1.评估指标预测值 0 1 实际 0 TN FP ...
Unity TileMap 2D 工具基础教程
Unity TileMap 2D 工具基础教程 Unity TileMap 2D 工具基础教程 TileMap 工程创建 Sprite Editor 工具使用 TileMap 功能说明 TilePal ...
机器学习(Machine Learning)基础
机器学习(Machine Learning)基础概念及用途专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能.它是人工智能的核心,是使计 ...

Unity 机器学习(ML-Agents) 基础

Unity 机器学习 ML-Agents 基础

Unity 官方示例下载

ML-Agents 部分

Python 下载

Anaconda

Anaconda 环境变量

Anaconda 基础环境

Anaconda 虚拟环境构建 ML-Agents

安装 ML-Agents Python 包

安装 ML-Agents 包

ML-Agents 入门指南

Unity Hub 部分

虚拟环境训练

虚拟环境训练运行：

虚拟环境开始训练：

虚拟环境观察训练进度：

虚拟环境停止训练

虚拟环境恢复训练

虚拟环境训练模型

ML-Agents 打造新的学习环境

ML-Agents 资产导入

Unity 场景创建

Unity 代码部分

Anaconda 执行

rollerball_config.yaml 机器学习逻辑处理代码

Anaconda 虚拟环境

地址合集

虚拟环境命令小结

虚拟环境安装

虚拟环境训练命令

Unity 机器学习(ML-Agents) 基础相关推荐

最新文章

热门文章

Unity 机器学习(ML-Agents) 基础

Unity 机器学习 ML-Agents 基础

Unity 官方示例下载

ML-Agents 部分

Python 下载

Anaconda

Anaconda 环境变量

Anaconda 基础环境

Anaconda 虚拟环境构建 ML-Agents

安装 ML-Agents Python 包

安装 ML-Agents 包

ML-Agents 入门指南

Unity Hub 部分

虚拟环境 训练

虚拟环境 训练运行：

虚拟环境 开始训练：

虚拟环境 观察训练进度：

虚拟环境 停止训练

虚拟环境 恢复训练

虚拟环境 训练模型

ML-Agents 打造新的学习环境

ML-Agents 资产导入

Unity 场景创建

Unity 代码部分

Anaconda 执行

rollerball_config.yaml 机器学习逻辑处理代码

Anaconda 虚拟环境

地址合集

虚拟环境命令小结

虚拟环境安装

虚拟环境 训练命令

Unity 机器学习(ML-Agents) 基础相关推荐

最新文章

热门文章

虚拟环境训练

虚拟环境训练运行：

虚拟环境开始训练：

虚拟环境观察训练进度：

虚拟环境停止训练

虚拟环境恢复训练

虚拟环境训练模型

虚拟环境训练命令