ML-Agents是Unity开发智能AI的利器,但是学习曲线相对陡峭,需要一些机器学习算法的理解,经过使用训练模式、好奇心模式的经历,总结一些使用技巧,供爱好者参考。
1.训练模式是老师带学生的模式,玩家通过操作AI,与Agents AI具有相同的参数,只不过用人工替代了电脑大脑的控制和判断,也就是Actions的决策选择。人工的操作不但能让AI学习移动和一些操作,AI还能继续使用加强学习的算法进行大脑的双向训练。配置过程相对麻烦,可以参考官方示例。
2.对于一些复杂环境和多操作,比如要在躲避的过程中还选择攻击,在捡拾道具和攻击、逃跑中做优化寻泽,这种复杂的情况下,尽量开启好奇心模式,在trainer.ymal配置中修改好奇心参数为true。这样会尽量杜绝AI原地打转,浪费训练时间,也完全达不到使用目标和要求。
3.一些简单的训练场景一般都容易实现目标,但是像我们的正常游戏中,AI的操作动作都比较多,场景也比较复杂,比如各种石头、墙壁等具有碰撞体的检测,因此在基础训练满足后,就要将复杂的真实场景进行训练场景的搭建,个人觉得这个步骤很关键,不要单纯的降低训练环境实现大脑文件生成,若此,AI到真实场景中就容易钻入一些复杂环境无法进行智能判断。
4.一劳永逸的摄像机模式不能使用,开始就卡死,不清楚是什么问题,个人感觉跟显卡没有关系,因为我配置的模式是CPU模式。
5.AI的技能训练尽量不用真实技能,可以用射线碰撞代替射线类技能,训练完毕后,将真实技能参数调整到射线碰撞的参数,比如距离、有效半径等。
6.在重写动作控制的方法时,尽量添加一些基本的限制条件,比如22m内如果没有检测到攻击目标的存在就不要释放20m范围攻击的技能,明显攻击不到敌人。
7.代码部分
查找范围敌人并排序
public Transform ClosestEnemy(float viewRange) {
var cols = new List(Physics.OverlapSphere(transform.position, viewRange, enemyMask));
cols.Remove(m_collider);
var firstOrDefault = cols.OrderBy(x => Vector3.Distance(transform.position, x.transform.position)).FirstOrDefault();
return firstOrDefault != null ? firstOrDefault.transform : null;
}

ML-Agents训练智能AI使用技巧相关推荐

  1. [附下载]史上最简单的深度学习工具“一键式智能AI标注训练平台软件”终于免费公测了,没显卡也可以训练,会点鼠标就可以

    你将收获 掌握如何一键标注缺陷或目标图片 掌握如何一键生成配置文件 掌握如何一键训练 适用人群 对人工智能机器视觉感兴趣的朋友们和从业者 软件环境: Windows10 x64; cuda 10.2( ...

  2. 基于深度强化学习训练《街头霸王·二:冠军特别版》通关关底 BOSS -智能 AI 代理项目上手

    文章目录 SFighterAI项目简介 实现软件环境 项目文件结构 运行指南 环境配置 验证及调整gym环境: gym-retro 游戏文件夹 错误提示及解决 Could not initialize ...

  3. AI键盘侠来了:DeepMind开始训练智能体像人一样「玩」电脑

    来源:机器之心 本文约3100字,建议阅读6分钟 本文探究了训练智能体像人一样进行键盘和鼠标的基本计算机控制. 人类每天使用数字设备的时间长达数十亿小时.如果我们能够开发出协助完成一部分这些任务的智能 ...

  4. python做智能ai的狼吃羊

    在 Python 中,你可以使用各种工具和库来做智能 AI 应用.其中有许多专门用于机器学习和人工智能的库,如 TensorFlow.scikit-learn 和 PyTorch.你可以使用这些库来训 ...

  5. 智能ai深度学习技术_人工智能深度学习与医学

    智能ai深度学习技术 As physicians, nurses, dentists, or any healthcare expert, we all have experienced the ea ...

  6. IRC/ML:金融智能风控领域相关术语解释(黑灰产群控、风控指标/字段、口径逻辑)、金融智能风控领域九大场景之详细攻略

    IRC/ML:金融智能风控领域相关术语解释(黑灰产群控.风控指标/字段.口径逻辑).金融智能风控领域九大场景之详细攻略 目录 金融智能风控领域的相关术语 1.如何判断黑灰产群控 风控指标/字段相关概念 ...

  7. RL之Q Learning:利用强化学习之Q Learning实现走迷宫—训练智能体走到迷宫(简单迷宫)的宝藏位置

    RL之Q Learning:利用强化学习之Q Learning实现走迷宫-训练智能体走到迷宫(简单迷宫)的宝藏位置 目录 输出结果 设计思路 实现代码 测试记录全过程 输出结果 设计思路 实现代码 f ...

  8. 【四】多智能体强化学习(MARL)近年研究概览 {Learning cooperation(协作学习)、Agents modeling agents(智能体建模)}

    相关文章: [一]最新多智能体强化学习方法[总结] [二]最新多智能体强化学习文章如何查阅{顶会:AAAI. ICML } [三]多智能体强化学习(MARL)近年研究概览 {Analysis of e ...

  9. Stable Diffusion 2.0来了,皮卡智能AI早已“抢先”优化升级

    就在昨日,Stability AI发布了Stable Diffusion 2.0 版本上线,玩家惊呼V1还没整明白,V2版本就来了.其实在Stable Diffusion 1.0开源后,皮卡智能AI许 ...

  10. 国产智能AI对话:技术狂潮之下,要有梦元宇宙正在改变世界

    最近,人工智能组织OpenAI推出的大模型智能AI对话系统在中国爆火,让大家开始关注人工智能行业. 而要有梦团队深耕数字科技产业多年,基于平台深厚的元宇宙综合技术沉淀,创新推出国产人工智能:要有梦智能 ...

最新文章

  1. Select 标签可输入
  2. 区块链,一个糟糕的数据库
  3. php关键词分词搜索 最多匹配的排在最前面_图解 | 通用搜索引擎背后的技术点...
  4. ElasticSearch重启之后shard未分配问题的解决
  5. XML内部DTD约束 Day24
  6. leetcode542. 01 矩阵(bfs/dp)
  7. 解决在vue init webpack my-project卡住的问题(已解决)
  8. Centos YUM国内163源
  9. Python之网络编程(socket基础)
  10. [问题2014S07] 复旦高等代数II(13级)每周一题(第七教学周)
  11. 面试被问项目上线没_从面试官角度谈观察到的程序员技能瓶颈
  12. 袁玉玮:简介人工智能在基金界的应用现状 (二)卖方交易员被冲击
  13. Ubuntu 18.04 安装 NVIDIA 显卡驱动超详细步骤
  14. DirectX11参考资料之美
  15. On the Sense of Humor [附译文]
  16. H5拍照、选择图片上传组件核心
  17. 【一些有关GraN-DAG的知识点总结】
  18. li相关整理:如何改变li前面点的颜色和如何去掉li的点
  19. revit建模中复合墙与叠层墙区别?Revit中怎么创建叠层墙?
  20. 写作分析——缓和说教内容

热门文章

  1. MapReduce----电信数据清洗
  2. 于的繁体字有几种写法_仙字繁体(仙的繁体字几种写法)
  3. 网课笔记 ☀ 经济学原理课后习题及答案
  4. 信息 按顺序打印commit_Git 工作流,看这一篇就够了
  5. 数据库系统概论 (王珊.第五版)第七章数据库设计习题答案
  6. 毕业设计 STM32单片机的智能公路收费站系统 - 物联网
  7. (三)基于PHP——复杂的WSDL的创建(WSDL篇)
  8. C++语法学习笔记十四:派生类-调用顺序-访问等级-函数遮蔽
  9. 安卓键 adb shell input keyevent code
  10. E - The Journey of Geor Autumn(线性DP,前缀和)