Unity3D ML-Agent-0.8.1 学习三(多代理学习)

  • 写的目的
  • 多代理设置
  • 创建目录
  • 总结

写的目的

本篇主要接着上一篇,介绍多代理训练,思路就是将训练的环境变成预制,然后在场景中多加几个预制,一起训练,效果确实比单个训练快多了,毕竟样本多了,加速了训练。注意多代理训练,代码里的一些位置,速度信息就需要设置成相对父类的坐标,不能设置成世界坐标,否则都挤一堆去了,这样各自在各自的训练区域里训练即可。

多代理设置

复制之前的单代理的场景,改个名字,我的叫MultipleRollerBall,然后创建一个新的空物体叫TrainingArea,然后把相应的物体拖进去,当子物体,做成一个预制,即训练平台,这样每个训练平台都是相互隔离的,不会有影响。

记得创建一个新的训练大脑,属性跟单代理一样,也可以直接将要复制属性的单代理拖到红框里,Model训练时可以为空,测试时拖进去就即可。

然后你就把预制往场景拖,隔开放就行,不要挨着太近,小球可能会卡中间不掉下去。

创建目录

然后还是老样子训练,具体可见上几篇,没什么变化,可以看到输出的信息,千次训练时间长了,但是获得奖励提高了,达到最优的情况的时间缩短了,主要参数
结果还是很不错的,可以对比单代理,快了好几倍了:

也可以看总结图,到达最好奖励的速度很快:

总结

可以看到,用多代理确实比单代理要快好多,接下去可能会研究下模仿学习,例子还是这个例子,慢慢扩展,尽情期待吧。

例子主要文件unity3D-ml-agent-0.8.1

好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,部分图片来自网络,侵删。

Unity3D ML-Agent-0.8.1 学习三(多代理学习)相关推荐

  1. JPA基础学习三-----JPQL语句学习

    jpql是JPA操作数据库的语言,它的底层还是sql语句,就是我们的jpql语言最终还是会转化为sql语句到数据库去做相应的操作.所以JPAQL与sql语句很相识,它们的关键字是一样的,最大的一个区别 ...

  2. j2me学习三_LCDui类学习(2)

    TextBox TextBox是一个全屏的文字编辑对象,里面的文字会自动换行. 示例: import javax.microedition.midlet.*; import javax.microed ...

  3. HTML+CSS项目总结(建议学习三周后)

    在学习三个星期学习中,基本掌握了HTML+CSS的用法和特性. 拿到了一个静态的实战项目,并且要求在3-4天内完成,我和我小组成员不惜废寝忘食,在紧迫的时间内大致地完成了,但是有些效果不能像想象中的那 ...

  4. 蓝桥杯嵌入式CT117E-M4学习笔记02-STM32G431RBT6芯片学习

    文章目录 前言 一.芯片简介 二.时钟学习 三.SRAM学习 四.总线矩阵学习 五.GPIO学习 总结 前言 首先学习了解一下蓝桥杯嵌入式CT117E-M4开发板的主控芯片STM32G431RBT6, ...

  5. 大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题(以ubuntu-18.04.3、Mware Workstation 15.1.0 Pro为例)

    大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题 (以ubuntu-18.04.3.Mware Workstation 15.1.0 Pro for Window ...

  6. 二元学习法3.0:三把学习大剑,打通学习的底层密码_学习方法

    单纯靠机会赚钱的时代已经过去,未来是认知赚钱的时代. 前两天还跟朋友聊到这个话题,未来的机会将会不断涌现,人工智能.5G.万物互联.虚拟现实-- 而这些东西,都跟知识挂钩.以前那种胆大就能挣钱,站在风 ...

  7. Python学习三: 爬虫高级技巧 与 模拟实战练习

    三大爬虫技巧 许多网站针对爬虫的访问都设置了一定的障碍,通过这三步技巧,轻松绕过部分的反爬虫限制. (1)设置程序休止时间 import time import random# 休止睡眠 1 秒 这里 ...

  8. Unity3D 2018 3.0新手入门

    Unity3D新手入门 转自擅码网并修改 学习目的: 掌握Unity3D 常用的软件操作和一些基础脚本的使用 文章目录 Unity3D新手入门 1. Unity3D软件 1.1 Unity3D 介绍 ...

  9. Tensorflow实战学习(三十八)【实现估值网络】

    Q-Learning,学习Action对应期望值(Expected Utility).1989年,Watkins提出.收敛性,1992年,Watkins和Dayan共同证明.学习期望价值,从当前一步到 ...

最新文章

  1. 由Node.js事件驱动模型引发的思考
  2. MySQL数据库中as和distinct关键字
  3. 第一天开通博客,记录自己在编程道路上的点点滴滴
  4. 04.ARP:地址解析协议
  5. IOS开发基础知识--碎片39
  6. boost::sort模块实现提供多种分布的灵活随机数生成器的测试程序
  7. 每天一道LeetCode-----括号匹配
  8. NPOI导出excel
  9. webapi+Quartz.NET解决若干定时程序同时运行的问题
  10. php npm,php – Laravel中NPM,Composer和Bower的区别?
  11. Docker学习总结(22)——Docke run命令详解
  12. 用JavaScript实现按钮点击全选和下拉列表根据省份复选框显示对应城市功能
  13. snap7读写西门子plc1200步骤(python) PLC通讯
  14. 联想计算机拆机,Lenovo(联想)Y470笔记本电脑拆机清灰图文教程
  15. ⅰsee是什么意思_see是什么意思?
  16. 交换机上的指示灯狂闪
  17. 想想搭建个域控文件打印机服务器
  18. BI技巧丨近两年及当年月份数据汇总
  19. 免费开源JAVA报表工具对比 BIRT报表VS润乾报表之初体验
  20. 2022高处安装、维护、拆除考试题库模拟考试平台操作

热门文章

  1. 程序员面试题精选100题
  2. 二价--无穷价阴阳鱼函式
  3. 改后缀名不能导致图片格式的转换,以.png后缀名的图片不一定是png图片
  4. 一本建立程序员(其它从业者)世界观、价值观和人生观的书——《黑客与画家》读书笔记
  5. 驴商人和胡萝卜的算法逻辑思维问题
  6. Witt向量简介 §4.1:关于组合数是整数的一种严格证明
  7. maven assembly打包zip报错 You must set at least one file.
  8. 数据库中decimal
  9. console.log()用法
  10. php常见sql语句,sql语句是什么