ML-Agents训练智能AI使用技巧

ML-Agents是Unity开发智能AI的利器，但是学习曲线相对陡峭，需要一些机器学习算法的理解，经过使用训练模式、好奇心模式的经历，总结一些使用技巧，供爱好者参考。
1.训练模式是老师带学生的模式，玩家通过操作AI，与Agents AI具有相同的参数，只不过用人工替代了电脑大脑的控制和判断，也就是Actions的决策选择。人工的操作不但能让AI学习移动和一些操作，AI还能继续使用加强学习的算法进行大脑的双向训练。配置过程相对麻烦，可以参考官方示例。
2.对于一些复杂环境和多操作，比如要在躲避的过程中还选择攻击，在捡拾道具和攻击、逃跑中做优化寻泽，这种复杂的情况下，尽量开启好奇心模式，在trainer.ymal配置中修改好奇心参数为true。这样会尽量杜绝AI原地打转，浪费训练时间，也完全达不到使用目标和要求。
3.一些简单的训练场景一般都容易实现目标，但是像我们的正常游戏中，AI的操作动作都比较多，场景也比较复杂，比如各种石头、墙壁等具有碰撞体的检测，因此在基础训练满足后，就要将复杂的真实场景进行训练场景的搭建，个人觉得这个步骤很关键，不要单纯的降低训练环境实现大脑文件生成，若此，AI到真实场景中就容易钻入一些复杂环境无法进行智能判断。
4.一劳永逸的摄像机模式不能使用，开始就卡死，不清楚是什么问题，个人感觉跟显卡没有关系，因为我配置的模式是CPU模式。
5.AI的技能训练尽量不用真实技能，可以用射线碰撞代替射线类技能，训练完毕后，将真实技能参数调整到射线碰撞的参数，比如距离、有效半径等。
6.在重写动作控制的方法时，尽量添加一些基本的限制条件，比如22m内如果没有检测到攻击目标的存在就不要释放20m范围攻击的技能，明显攻击不到敌人。
7.代码部分
查找范围敌人并排序
public Transform ClosestEnemy(float viewRange) {
var cols = new List(Physics.OverlapSphere(transform.position, viewRange, enemyMask));
cols.Remove(m_collider);
var firstOrDefault = cols.OrderBy(x => Vector3.Distance(transform.position, x.transform.position)).FirstOrDefault();
return firstOrDefault != null ? firstOrDefault.transform : null;
}

ML-Agents训练智能AI使用技巧相关推荐

[附下载]史上最简单的深度学习工具“一键式智能AI标注训练平台软件”终于免费公测了，没显卡也可以训练，会点鼠标就可以
你将收获掌握如何一键标注缺陷或目标图片掌握如何一键生成配置文件掌握如何一键训练适用人群对人工智能机器视觉感兴趣的朋友们和从业者软件环境: Windows10 x64; cuda 10.2( ...
基于深度强化学习训练《街头霸王·二：冠军特别版》通关关底 BOSS -智能 AI 代理项目上手
文章目录 SFighterAI项目简介实现软件环境项目文件结构运行指南环境配置验证及调整gym环境: gym-retro 游戏文件夹错误提示及解决 Could not initialize ...
AI键盘侠来了：DeepMind开始训练智能体像人一样「玩」电脑
来源:机器之心本文约3100字,建议阅读6分钟本文探究了训练智能体像人一样进行键盘和鼠标的基本计算机控制. 人类每天使用数字设备的时间长达数十亿小时.如果我们能够开发出协助完成一部分这些任务的智能 ...
python做智能ai的狼吃羊
在 Python 中,你可以使用各种工具和库来做智能 AI 应用.其中有许多专门用于机器学习和人工智能的库,如 TensorFlow.scikit-learn 和 PyTorch.你可以使用这些库来训 ...
智能ai深度学习技术_人工智能深度学习与医学
智能ai深度学习技术 As physicians, nurses, dentists, or any healthcare expert, we all have experienced the ea ...
IRC/ML：金融智能风控领域相关术语解释(黑灰产群控、风控指标/字段、口径逻辑)、金融智能风控领域九大场景之详细攻略
IRC/ML:金融智能风控领域相关术语解释(黑灰产群控.风控指标/字段.口径逻辑).金融智能风控领域九大场景之详细攻略目录金融智能风控领域的相关术语 1.如何判断黑灰产群控风控指标/字段相关概念 ...
RL之Q Learning：利用强化学习之Q Learning实现走迷宫—训练智能体走到迷宫(简单迷宫)的宝藏位置
RL之Q Learning:利用强化学习之Q Learning实现走迷宫-训练智能体走到迷宫(简单迷宫)的宝藏位置目录输出结果设计思路实现代码测试记录全过程输出结果设计思路实现代码 f ...
【四】多智能体强化学习（MARL）近年研究概览｛Learning cooperation（协作学习）、Agents modeling agents（智能体建模）｝
相关文章: [一]最新多智能体强化学习方法[总结] [二]最新多智能体强化学习文章如何查阅{顶会:AAAI. ICML } [三]多智能体强化学习(MARL)近年研究概览 {Analysis of e ...
Stable Diffusion 2.0来了，皮卡智能AI早已“抢先”优化升级
就在昨日,Stability AI发布了Stable Diffusion 2.0 版本上线,玩家惊呼V1还没整明白,V2版本就来了.其实在Stable Diffusion 1.0开源后,皮卡智能AI许 ...
国产智能AI对话：技术狂潮之下，要有梦元宇宙正在改变世界
最近,人工智能组织OpenAI推出的大模型智能AI对话系统在中国爆火,让大家开始关注人工智能行业. 而要有梦团队深耕数字科技产业多年,基于平台深厚的元宇宙综合技术沉淀,创新推出国产人工智能:要有梦智能 ...

ML-Agents训练智能AI使用技巧

ML-Agents训练智能AI使用技巧相关推荐

最新文章

热门文章