多智能体强化学习环境【星际争霸II】SMAC环境配置
多智能体强化学习这个领域中,很多Paper都使用的一个环境是——星际争多智能体挑战(StarCraft Multi-Agent Challenge, SMAC)。最近也配置了这个环境,把中间一些步骤记录下来。2022.12.26
文章目录
- 1 环境介绍
- 1.1 相关论文
- 1.2 项目代码地址
- 2 安装过程
- 3 相关文献下载地址
- 4 算法复现部分结果
- 4.1 2s3z地图
- 4.2 3m地图
- 4.3 8m地图
1 环境介绍
1.1 相关论文
《The StarCraft Multi-Agent Challenge》。
1.2 项目代码地址
SMAC github地址:https://github.com/oxwhirl/smac
gitee地址:https://gitee.com/icze1i0n/smac
2 安装过程
按照官方的说明安装,还算顺利,我是在Win系统安装的。
去大陆官网下载《星际争霸II》游戏
安装用pip命令安装smac库,中间pysc2也自动安装好了。
如果星际争霸安装路径不是默认的,需要在系统中添加一个叫做SC2PATH
的环境变量,指向安装路径。
设置好后就能跑起来了
3 相关文献下载地址
- IQL: Independent Q-Learning
- QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
- Value-Decomposition Networks For Cooperative Multi-Agent Learning
- Counterfactual Multi-Agent Policy Gradients
- QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning
- Learning Multiagent Communication with Backpropagation
- From Few to More: Large-scale Dynamic Multiagent Curriculum Learning
- Multi-Agent Game Abstraction via Graph Attention Neural Network
- MAVEN: Multi-Agent Variational Exploration
4 算法复现部分结果
下面这些结果印象中是国内一个公司的实验室复现的,github地址在这里。
4.1 2s3z地图
4.2 3m地图
4.3 8m地图
多智能体强化学习环境【星际争霸II】SMAC环境配置相关推荐
- 多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏
大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...
- 上海交大开源训练框架,支持大规模基于种群多智能体强化学习训练
机器之心专栏 作者:上海交大和UCL多智能体强化学习研究团队 基于种群的多智能体深度强化学习(PB-MARL)方法在星际争霸.王者荣耀等游戏AI上已经得到成功验证,MALib 则是首个专门面向 PB- ...
- 多智能体强化学习及其在游戏AI上的应用与展望
近年来,人工智能技术在很多领域都取得了亮眼成就,并逐步从感知智能向决策智能迈进.强化学习是实现决策智能的重要路径,而现实世界中往往存在着多智能体的交互,也催生了多智能体强化学习的发展.这篇文章主要对多 ...
- 面向星际争霸:DeepMind 提出多智能体强化学习新方法
不久前 DeepMind 强化学习团队负责人.AlphaGo 项目负责人现身 Reddit 问答,其中一个问题是「围棋和星际争霸 2 哪个更难?潜在技术障碍是什么?」近日,DeepMind 发表论文, ...
- 多智能体强化学习(MARL)训练环境总结
目前开源的多智能体强化学习项目都是需要在特定多智能体环境下交互运行,为了更好的学习MARL code,需要先大致了解一些常见的MARL环境以及库 文章目录 1.Farama Foundation 2. ...
- 【MADDPG(MPE)——环境配置与用法详细介绍(多智能体强化学习))】
MADDPG(MPE)--环境配置与用法详细介绍(多智能体强化学习) MADDPG(MPE) 介绍 MPE环境安装教程 前期准备 MPE 安装包介绍 MPE 安装环境要求 开始安装 环境测试 MPE环 ...
- Multi-agent Particle Environment - MPE多智能体强化学习运行环境的任务简介
MPE环境是一个时间离散.空间连续的二维环境,UI的界面风格如图所示,它通过控制在二维空间中代表不同含义的粒子,实现对于各类MARL算法的验证.MPE被人们广泛所知是借助于那篇NiPS2017的著名多 ...
- 《强化学习周刊》第40期:PMIC多智能体强化学习、Lazy-MDPs、CTDS
No.40 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...
- 《强化学习周刊》第16期:多智能体强化学习的最新研究与应用
No.16 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,多智能强化学习的研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领 ...
最新文章
- PHP 自定义session储存 数据库 方式类 高洛峰 细说PHP
- android自定义属性dimen,android代码里的dimen
- 雷电3接口能干嘛_acasis阿卡西斯推出首款雷电3接口WIFI6网卡:内置Intel AX200
- mysql怎么设置密码都不正确的一个解决方法
- Docker (一、dockerfile-node.js)
- 学习Python语言的优势
- erlang的dict和maps模块
- iOS获取camera的yuv数据
- 类的加载过程详解之过程一:Loading(加载)阶段
- 防(普通)病毒U盘的制作
- 青青子美人之QQ美女找茬辅助工具c#源码
- dwcs6 mysql站点_在Dreamweaver CS6中如何新建站点的方法
- matlab横纵坐标程序,matlab横纵坐标标注
- tdr 定位公式_时域反射计TDR原理详细解析
- c++编写断点续传和多线程下载模块【转】
- 2N个数排成一行(每个数有2个), 2个1之间有1个数,2个2 之间有2个数,...2个N之间有N个数... 例312132
- 详解三道一维的动态规划算法题
- 数梦工场:我们帮你实现你驾驭数据的梦想
- 迅雷链基于智能硬件的DPoA共识机制介绍
- 祝爸爸妈妈中秋节快乐
热门文章
- php hsl,PHP ImagickPixel setHSL()用法及代码示例
- yii2 提供接口给java_yii2-fast-api 快速配置并开发基于 yii2 的 api 服务
- android模拟全局按键,Android 模拟按键汇总
- 看完之后你还不了解SpringCloud,就取关吧
- 网页安全狗安装:服务器名
- yacc语法分析minipascal_高分急求类pascal编译器的源代码(用lex和yacc做的,能够运行成功的 )...
- JavaScript之本地存储
- 什么是bootstrap和randomization?如何进行bootstrap和randomization统计推断?
- 关于DWDM,你想知道的都在这!
- Mac - git 安装 gitk(详细流程)