Unity红球吃绿球强化学习小任务——Ubuntu20.04系统于2022年2月26日实现

  • Unity红球吃绿球强化学习小任务
    • 一、主机环境参数说明
    • 二、具体教程以之前提供的视频介绍为主,需要修改的章节会标注
      • P1 000-项目演示
      • P2 100-Unity机器学习案例下载
      • P3 101-狗子的学习
      • P4 102-安装Anaconda并创建环境
      • P5 103-完成所有的环境准备
      • P6 104-创建场景
      • P7 105-Agent里面的四个函数
      • P8 106-手动操作智能体
      • P9 107-重置游戏的函数
      • P10 108-设置智能体奖励
      • P11 109-随机Target的位置并收集观察结果
      • P12 110-收集观察结果完成前期训练准备
      • P13 111-让红球可以一直吃到绿球
      • P14 112-开始训练模型
      • P15 113-完成模型的训练
      • P16 114-课程结束

Unity红球吃绿球强化学习小任务

主要参考的教程:https://www.bilibili.com/video/BV1354y1D71r?from=search&seid=17872177648893791745&spm_id_from=333.337.0.0

!!!由于版本的变化有很多需要调整的地方,直接说明视频对应的章节中哪些需要修改 !!!

由于Ubuntu等Linux用户使用的群体较少,这方面教程的更新频率和数量较少,版本的变化和官网界面的改动经常导致出现各种版本问题,因此我在前人的基础上给出新的教程

笔者研究方向为深度强化学习,最近涉及到需要用Unity搭建环境交互,因此开始新的研究,其中遇到并解决了很多问题,这此与大家分享


一、主机环境参数说明

  • Ubuntu 20.04(Windows和Ubuntu在一些Unity内置库中的选择有区别)
  • 30系列显卡
  • NVIDIA-SMI 470.103.01(Driver Version: 470.103.01)
  • CUDA Version: 11.4 (可以GPU训练)
  • mlagents 0.18.0 mlagents-envs 0.18.0(影响最大的版本问题,需要严格控制在0.16.0 - 0.20.0)
  • Unity Hub 3.0.0-beta7
  • Unity Editor 2020.3.29f1c1(这个版本也会有影响)

二、具体教程以之前提供的视频介绍为主,需要修改的章节会标注

P1 000-项目演示

P2 100-Unity机器学习案例下载

这个下载下来后主要是可以看看官方实现的一些例子,对我们红球吃绿球的任务没有影响(和原视频中说的不一样)

P3 101-狗子的学习

P4 102-安装Anaconda并创建环境

P5 103-完成所有的环境准备

!!!需要修改 !!!

(1)安装mlagents:

必须安装0.16.0 – 0.20.0的tensorflow版本(虽然现在最新版本是0.28.0并且使用的pytorch,但是在Ubuntu环境下无法连接到Unity Editor环境,无法实现训练交互)

在激活的conda虚拟环境中使用:

pip install mlagents==0.18.0

(2)Unity制作界面导入Barracuda:

在笔者的主机各项参数条件下,已经不能采用视频作者的导入方式,Unity制作界面的Package Manager中已经不存在这个库了,导入方法见下面(3)

(3)Unity制作界面导入ML Agents:

在笔者的主机各项参数条件下,已经不能采用视频作者的导入方式,必须在Unity制作界面的Package Manager中搜索ML Agents并通过install导入,另外导入ML Agents的过程中会自动把Barracuda导入进去

(4)不要(也不需要)将Editor、Plugins、Runtime三个文件夹复制到Assets中,会无法运行

P6 104-创建场景

P7 105-Agent里面的四个函数

该RollerAgent.cs文件笔者也提供一份完成的(需要请私聊,可能不能及时回复),也可以自己跟着视频中敲,敲错会无法运行

P8 106-手动操作智能体

P9 107-重置游戏的函数

P10 108-设置智能体奖励

P11 109-随机Target的位置并收集观察结果

P12 110-收集观察结果完成前期训练准备

P13 111-让红球可以一直吃到绿球

P14 112-开始训练模型

config.yaml文件笔者也提供一份完成的(需要请私聊,可能不能及时回复)

注意conda虚拟环境中mlagents的版本必须0.16.0 – 0.20.0

在笔者的环境参数下可以选择GPU训练(猜测只要平常深度学习代码可以GPU跑就基本没问题)

P15 113-完成模型的训练

P16 114-课程结束

Unity红球吃绿球强化学习小任务——Ubuntu20.04系统于2022年2月26日实现相关推荐

  1. Html学习 2022年3月26日

    Html学习: html第三课:动画效果 3.1 css动画 div{width: 100px;height: 100px;line-height: 100px;text-align: center; ...

  2. 2022年11月20日-2022年11月26日学习周报

    本周主要再次复习了链表的头插法,尾插法,任意位置删除等操作,以及初步了解了双向链表; 以下是我用头指针的方法写的关于头插法,尾插法,任意位置插入和删除的操作 //使用头指针; #define _CRT ...

  3. 【贪玩巴斯】Unity初学圣经Part2-C#基础——Day 01:C#基础之——命名空间、类、方法、变量的声明赋值和相关知识以及.NETC#关系讲解 2022年3月28日

    C#基础之--命名空间.类.方法.变量的声明赋值和相关知识以及.NETC#关系讲解 对应视频4-1至4-7 1.引入命名空间: 2.引入类.方法 3.变量的声明赋值 4.综合小练习 5. .NET的介 ...

  4. AI 大战 AI,一个深度强化学习多智能体竞赛系统

    小伙伴们快看过来!这是一款全新打造的 ⚔️ AI vs. AI ⚔️--深度强化学习多智能体竞赛系统. 这个工具托管在 Space 上,允许我们创建多智能体竞赛.它包含三个元素: 一个带匹配算法的 S ...

  5. 球半足球预测,经典对局分析欧国联:德国 vs 意大利 6月15日

    经典对局欧国联:德国 vs 意大利2022年6月15日 02:45周二006 德国队前三场全部以平局收场,进3球失3球方式和进攻无任何亮点.球队上一场1:1与匈牙利踢平,已经累计4场平局,12场不败, ...

  6. 飞控学习常见典型问题集QA——无名创新(2022年4月15日)

    飞控学习常见典型问题集Q&A--无名创新(2022年4月15日) 1.第一次启动FS I6遥控器,进入不了界面一直嘟嘟,请问这是什么情况呢? 先把上面的英文翻译一下,警告:请把所有的开关切换到 ...

  7. Java学习笔记:2022年1月11日

    Java学习笔记:2022年1月11日 ​ 摘要:这篇笔记主要讲解了一些数据在计算机中的存在方式相关的知识点,并由此延伸出了数据在计算机中的操作以及一些数据结构的知识. 文章目录 Java学习笔记:2 ...

  8. Java学习笔记:2022年1月10日

    Java学习笔记:2022年1月10日 ​ 摘要:这篇笔记主要记录了学习<Java核心技术 卷一>的第四章时的一些心得,主要阐述了对象与类这一部分的内容.需要注意的是,这一章的内容需要精心 ...

  9. 【贪玩巴斯】Unity3D初学圣经(二)—— unity界面布局介绍 unity常用面板介绍 「1-5 到 1-7」—— 2022年1月20日

    [贪玩巴斯]Unity3D初学圣经 二-- unity界面布局介绍 & unity常用面板介绍 「1-5 到 1-7」-- 2022年1月20日 本文对应视频P5 1-5 到P7 1-7 un ...

最新文章

  1. Xcache安装与使用
  2. 成功解决YOLOv3测试——could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZE作记录
  3. matlab 画图比例缩小图片大小,Matlab 画图字体,字号的设定,图片大小和比例
  4. 7z001怎么解压在安卓手机上面_安卓手机能打开eif文件吗 手机怎么打开eip文件方法...
  5. 浅谈Docker:DockerLinux安装,镜像管理命令,镜像制作命令,容器管理命令,数据卷,DockerFile,Docker-compose
  6. ISA2006系列之三 详解防火墙的三种客户端(上)
  7. abrels.inc.php_fckk.php
  8. logo下方显示技术支持信息_LOGO墙形象设计的几种方案
  9. 腾讯云推出首款自研H265硬件编码器瑶池,助力云游戏降低15%带宽
  10. 2012年10月国庆长假天津-内蒙古自驾游之我们在路上
  11. spring揭秘 读书笔记 六 bean的一生
  12. tidyverse —— forcats包
  13. Importing the numpy c-extensions failed 解决方案
  14. 【羊了个羊】什么!第二关难如上青天,能不能简单版??
  15. 微软xcloud服务器,微软公布云游戏服务Project xCloud详情 2019年公测
  16. html后代元素选择器,怎么使用html5中的后代选择器?后代选择器的用法详解!
  17. 开启Windows远程桌面
  18. 微信公众平台开发(100) 2048游戏
  19. 【Restful接口】restful接口的两种使用方式
  20. 佛学研究:人生本相的体察

热门文章

  1. matlab抓取网页信息,批量抓取网页信息
  2. 导入地址excel,抓取相应地区的经纬度
  3. J2EE进阶之javascript 四
  4. Numpy入门(九):np.corrcoef()用法
  5. 千里眼摄像头支持对象存储吗_“无处安放”的海量数据,万能的对象存储
  6. 通往WinDbg的捷径
  7. D3D渲染技术之纹理
  8. 使用server版的哈工大LTP进行NLP任务(Java实现)
  9. 动态磁盘导致无法进入Mac系统的解决办法
  10. outlook 发送 html,在Outlook中发送给Internet收件人时,如何将RTF格式更改为HTML?