背景：

官方给的simple_tag环境，障碍物位置是随机的，对于需要修改障碍物的初始位置，让其保持固定，对于障碍物的位置坐标进行设置。

修改内容：

找到simple_tag.py文件，在reset_world()函数中找到改语句

for i, landmark in enumerate(world.landmarks):landmark.state.p_pos = np.random.uniform(-0.9, +0.9, world.dim_p)landmark.state.p_vel = np.zeros(world.dim_p)`

这里是生成一个随机的初始坐标。将循环内的语句注释，改成下列（我设置的障碍物数量是3，所以设置3次）

for i, landmark in enumerate(world.landmarks):if not landmark.boundary:if i == 0:landmark.state.p_pos = np.array([-0.6,0.65])landmark.state.p_vel = np.zeros(world.dim_p)if i == 1:landmark.state.p_pos = np.array([0.5,0.45])landmark.state.p_vel = np.zeros(world.dim_p)if i == 2:landmark.state.p_pos = np.array([0.2,-0.6])landmark.state.p_vel = np.zeros(world.dim_p)

np.array([-0.6,0.65])中的值为障碍物的 x, y 的坐标值，在-1~1之间，坐标的设定规则见下图：

多智能体环境MPE simple_tag障碍物位置修改相关推荐

【MADDPG（MPE）——环境配置与用法详细介绍（多智能体强化学习）)】
MADDPG(MPE)--环境配置与用法详细介绍(多智能体强化学习) MADDPG(MPE) 介绍 MPE环境安装教程前期准备 MPE 安装包介绍 MPE 安装环境要求开始安装环境测试 MPE环 ...
PettingZoo：多智能体游戏环境库入门
文章目录概述游戏环境安装 PettingZoo 导入包初始化环境与环境交互概述 PettingZoo1 类似于 Gym 的多智能体版本.Gym2是 OpenAI 开发的一个著名的强化学习库 ...
Yoshua Bengio团队最新强化学习研究：智能体通过与环境交互，「分离」变化的独立可控因素
原文来源:arXiv 作者:Valentin Thomas.Emmanuel Bengio∗.William Fedus.Jules Pondard.Philippe Beaudoin.Hugo La ...
多智能体强化学习(MARL)训练环境总结
目前开源的多智能体强化学习项目都是需要在特定多智能体环境下交互运行,为了更好的学习MARL code,需要先大致了解一些常见的MARL环境以及库文章目录 1.Farama Foundation 2. ...
基于通用学习环境和多智能体深度强化学习的列车运行图
‍ 1. 文章信息 <Train timetabling with the general learning environment and multi-agent deep reinforce ...
Retro-用于强化学习智能体训练的各种有趣的游戏环境集合
目录步骤安装测试查看游戏列表 issue 一.单智能体环境 90后大概都玩过的游戏环境冒险岛系列忍者神龟二.多智能体环境 https://openai.com/blog/gym-retr ...
多智能体强化学习-MADDPG
论文地址:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments. 代码地址:Multi-Agent Deep ...
多智能体强化学习——相关论文
多智能体深度强化学习研究综述作者:孙彧,曹雷,陈希亮,徐志雄,赖俊摘要:多智能体深度强化学习是机器学习领域的一个新兴的研究热点和应用方向,涵盖众多算法.规则.框架,并广泛应用于自动驾驶.能 ...
多智能体强化学习：基本概念，通信方式，IPPO，MADDPG
1,基本概念 1.1,简介单个RL智能体通过与外界的交互来学习知识,具体过程是根据当前环境的状态,智能体通过策略给出的动作来对环境进行响应,相应地,智能体会得到一个奖励值以反馈动作的好坏程度.RL最 ...

多智能体环境MPE simple_tag障碍物位置修改

背景：

修改内容：

多智能体环境MPE simple_tag障碍物位置修改相关推荐

最新文章

热门文章