多智能体强化学习这个领域中，很多Paper都使用的一个环境是——星际争多智能体挑战(StarCraft Multi-Agent Challenge, SMAC)。最近也配置了这个环境，把中间一些步骤记录下来。2022.12.26

文章目录

1 环境介绍
- 1.1 相关论文
- 1.2 项目代码地址
2 安装过程
3 相关文献下载地址
4 算法复现部分结果
- 4.1 2s3z地图
- 4.2 3m地图
- 4.3 8m地图

1 环境介绍

1.1 相关论文

《The StarCraft Multi-Agent Challenge》。

1.2 项目代码地址

SMAC github地址：https://github.com/oxwhirl/smac
gitee地址：https://gitee.com/icze1i0n/smac

2 安装过程

按照官方的说明安装，还算顺利，我是在Win系统安装的。

去大陆官网下载《星际争霸II》游戏

安装用pip命令安装smac库，中间pysc2也自动安装好了。

如果星际争霸安装路径不是默认的，需要在系统中添加一个叫做SC2PATH的环境变量，指向安装路径。

设置好后就能跑起来了

3 相关文献下载地址

IQL: Independent Q-Learning
QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
Value-Decomposition Networks For Cooperative Multi-Agent Learning
Counterfactual Multi-Agent Policy Gradients
QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning
Learning Multiagent Communication with Backpropagation
From Few to More: Large-scale Dynamic Multiagent Curriculum Learning
Multi-Agent Game Abstraction via Graph Attention Neural Network
MAVEN: Multi-Agent Variational Exploration

4 算法复现部分结果

下面这些结果印象中是国内一个公司的实验室复现的，github地址在这里。

4.1 2s3z地图

4.2 3m地图

4.3 8m地图

多智能体强化学习环境【星际争霸II】SMAC环境配置相关推荐

多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏
大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...
上海交大开源训练框架，支持大规模基于种群多智能体强化学习训练
机器之心专栏作者:上海交大和UCL多智能体强化学习研究团队基于种群的多智能体深度强化学习(PB-MARL)方法在星际争霸.王者荣耀等游戏AI上已经得到成功验证,MALib 则是首个专门面向 PB- ...
多智能体强化学习及其在游戏AI上的应用与展望
近年来,人工智能技术在很多领域都取得了亮眼成就,并逐步从感知智能向决策智能迈进.强化学习是实现决策智能的重要路径,而现实世界中往往存在着多智能体的交互,也催生了多智能体强化学习的发展.这篇文章主要对多 ...
面向星际争霸：DeepMind 提出多智能体强化学习新方法
不久前 DeepMind 强化学习团队负责人.AlphaGo 项目负责人现身 Reddit 问答,其中一个问题是「围棋和星际争霸 2 哪个更难?潜在技术障碍是什么?」近日,DeepMind 发表论文, ...
多智能体强化学习(MARL)训练环境总结
目前开源的多智能体强化学习项目都是需要在特定多智能体环境下交互运行,为了更好的学习MARL code,需要先大致了解一些常见的MARL环境以及库文章目录 1.Farama Foundation 2. ...
【MADDPG（MPE）——环境配置与用法详细介绍（多智能体强化学习）)】
MADDPG(MPE)--环境配置与用法详细介绍(多智能体强化学习) MADDPG(MPE) 介绍 MPE环境安装教程前期准备 MPE 安装包介绍 MPE 安装环境要求开始安装环境测试 MPE环 ...
Multi-agent Particle Environment - MPE多智能体强化学习运行环境的任务简介
MPE环境是一个时间离散.空间连续的二维环境,UI的界面风格如图所示,它通过控制在二维空间中代表不同含义的粒子,实现对于各类MARL算法的验证.MPE被人们广泛所知是借助于那篇NiPS2017的著名多 ...
《强化学习周刊》第40期：PMIC多智能体强化学习、Lazy-MDPs、CTDS
No.40 智源社区强化学习组强化学习研究观点资源活动周刊订阅告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...
《强化学习周刊》第16期：多智能体强化学习的最新研究与应用
No.16 智源社区强化学习组强化学习研究观点资源活动关于周刊强化学习作为人工智能领域研究热点之一,多智能强化学习的研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领 ...

多智能体强化学习环境【星际争霸II】SMAC环境配置