Unity3D ML-Agent-0.8.1 学习三(多代理学习)
Unity3D ML-Agent-0.8.1 学习三(多代理学习)
- 写的目的
- 多代理设置
- 创建目录
- 总结
写的目的
本篇主要接着上一篇,介绍多代理训练,思路就是将训练的环境变成预制,然后在场景中多加几个预制,一起训练,效果确实比单个训练快多了,毕竟样本多了,加速了训练。注意多代理训练,代码里的一些位置,速度信息就需要设置成相对父类的坐标,不能设置成世界坐标,否则都挤一堆去了,这样各自在各自的训练区域里训练即可。
多代理设置
复制之前的单代理的场景,改个名字,我的叫MultipleRollerBall,然后创建一个新的空物体叫TrainingArea,然后把相应的物体拖进去,当子物体,做成一个预制,即训练平台,这样每个训练平台都是相互隔离的,不会有影响。
记得创建一个新的训练大脑,属性跟单代理一样,也可以直接将要复制属性的单代理拖到红框里,Model训练时可以为空,测试时拖进去就即可。
然后你就把预制往场景拖,隔开放就行,不要挨着太近,小球可能会卡中间不掉下去。
创建目录
然后还是老样子训练,具体可见上几篇,没什么变化,可以看到输出的信息,千次训练时间长了,但是获得奖励提高了,达到最优的情况的时间缩短了,主要参数
结果还是很不错的,可以对比单代理,快了好几倍了:
也可以看总结图,到达最好奖励的速度很快:
总结
可以看到,用多代理确实比单代理要快好多,接下去可能会研究下模仿学习,例子还是这个例子,慢慢扩展,尽情期待吧。
例子主要文件unity3D-ml-agent-0.8.1
好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,部分图片来自网络,侵删。
Unity3D ML-Agent-0.8.1 学习三(多代理学习)相关推荐
- JPA基础学习三-----JPQL语句学习
jpql是JPA操作数据库的语言,它的底层还是sql语句,就是我们的jpql语言最终还是会转化为sql语句到数据库去做相应的操作.所以JPAQL与sql语句很相识,它们的关键字是一样的,最大的一个区别 ...
- j2me学习三_LCDui类学习(2)
TextBox TextBox是一个全屏的文字编辑对象,里面的文字会自动换行. 示例: import javax.microedition.midlet.*; import javax.microed ...
- HTML+CSS项目总结(建议学习三周后)
在学习三个星期学习中,基本掌握了HTML+CSS的用法和特性. 拿到了一个静态的实战项目,并且要求在3-4天内完成,我和我小组成员不惜废寝忘食,在紧迫的时间内大致地完成了,但是有些效果不能像想象中的那 ...
- 蓝桥杯嵌入式CT117E-M4学习笔记02-STM32G431RBT6芯片学习
文章目录 前言 一.芯片简介 二.时钟学习 三.SRAM学习 四.总线矩阵学习 五.GPIO学习 总结 前言 首先学习了解一下蓝桥杯嵌入式CT117E-M4开发板的主控芯片STM32G431RBT6, ...
- 大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题(以ubuntu-18.04.3、Mware Workstation 15.1.0 Pro为例)
大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题 (以ubuntu-18.04.3.Mware Workstation 15.1.0 Pro for Window ...
- 二元学习法3.0:三把学习大剑,打通学习的底层密码_学习方法
单纯靠机会赚钱的时代已经过去,未来是认知赚钱的时代. 前两天还跟朋友聊到这个话题,未来的机会将会不断涌现,人工智能.5G.万物互联.虚拟现实-- 而这些东西,都跟知识挂钩.以前那种胆大就能挣钱,站在风 ...
- Python学习三: 爬虫高级技巧 与 模拟实战练习
三大爬虫技巧 许多网站针对爬虫的访问都设置了一定的障碍,通过这三步技巧,轻松绕过部分的反爬虫限制. (1)设置程序休止时间 import time import random# 休止睡眠 1 秒 这里 ...
- Unity3D 2018 3.0新手入门
Unity3D新手入门 转自擅码网并修改 学习目的: 掌握Unity3D 常用的软件操作和一些基础脚本的使用 文章目录 Unity3D新手入门 1. Unity3D软件 1.1 Unity3D 介绍 ...
- Tensorflow实战学习(三十八)【实现估值网络】
Q-Learning,学习Action对应期望值(Expected Utility).1989年,Watkins提出.收敛性,1992年,Watkins和Dayan共同证明.学习期望价值,从当前一步到 ...
最新文章
- 由Node.js事件驱动模型引发的思考
- MySQL数据库中as和distinct关键字
- 第一天开通博客,记录自己在编程道路上的点点滴滴
- 04.ARP:地址解析协议
- IOS开发基础知识--碎片39
- boost::sort模块实现提供多种分布的灵活随机数生成器的测试程序
- 每天一道LeetCode-----括号匹配
- NPOI导出excel
- webapi+Quartz.NET解决若干定时程序同时运行的问题
- php npm,php – Laravel中NPM,Composer和Bower的区别?
- Docker学习总结(22)——Docke run命令详解
- 用JavaScript实现按钮点击全选和下拉列表根据省份复选框显示对应城市功能
- snap7读写西门子plc1200步骤(python) PLC通讯
- 联想计算机拆机,Lenovo(联想)Y470笔记本电脑拆机清灰图文教程
- ⅰsee是什么意思_see是什么意思?
- 交换机上的指示灯狂闪
- 想想搭建个域控文件打印机服务器
- BI技巧丨近两年及当年月份数据汇总
- 免费开源JAVA报表工具对比 BIRT报表VS润乾报表之初体验
- 2022高处安装、维护、拆除考试题库模拟考试平台操作