1，多智能体系统 (mutli-agent system)MAS

1.1 单智能体

单智能体：任何独立的能够思考并可以同环境交互的实体都可以抽象为智能体。

单智能体特性：自治性，反应性，主动性，社会性，进化性

图1 生物圈的agent

1.2 多智能体

多智能体系统：MAS是指具有大量分布式配置的半自治或自治的智能体（或子系统）通过网络互联所构成的复杂的大规模系统，它是系统的系统

MAS优点：可以执行分布式的任务

MAS特性：自主性，分布式，协调性和一定的自主学习能力，对外界影响具有较强的鲁棒性，对内部单智能体的失误有较高忍耐性。

MAS的协同控制：个体之间彼此相互协同来完成复杂的任务

1.3 同构和异构多智能体

同构MAS:简单来说就是相同的单智能体

异构MAS:不同的单智能体

2，多智能体寻径 Multi-Agent Path Finding-MAPF

2.1 定义

实际上就是通过给每个agent规划一条路径，保证这些路径不相撞，并最小化总的运行时间。

图2 仓储地图中20个agent的MAPF

每个agent有它对应的起点和终点，要求每个智能体能够正确从起点到达终点并且没有冲突。

2.2 问题描述

假设时间是离散的,在每一个时间步长，每一个 agent 都分别位于图 G 上一个节点上，并且可以做一个动作。

k个agent

input：tuple<G ,s ,t>

G:无向图，G=(V, E)

映射s:[1,....,k]→V 表示每个 agent 都对应一个源节点；

映射t:[1,..,k]←V 表示每个 agent 对应的目标节点；

Output ：k 条 single-agent plan 集合。

2.3 研究方向

其实MAPF的研究主要有两大方向：

一个是针对MAPF本身的问题，如何提高现有的算法效率和解的质量。

另一个是把MAPF应用到实际问题当中的时候，如何处理不同问题所带来的不同约束。

3，常见的MAPF算法

3.1 分类

耦合：耦合方法统一计算智能体路径，能找到最优路径，但不适合agent数量过多

解耦：解耦方法独立规划agent，但它不完整且提供次优解

混合：混合方法利用耦合方法的最优性和解耦方法的快速计算找到最优解，基于冲突的搜索CBS是一种较先进的混合MAPF算法，使用两级搜索，高级搜索探索约束树来解决智能体之间的冲突，低级搜索为每一个agent单独找到最优路径。高级CT随着冲突数量呈现指数级增长，因此对于高度耦合的智能体问题，cbs表现不佳。

3.2 最优型

3.3 次优型

参考文献：

Parallel Hierarchical Composition Conflict-Based Search for Optimal Multi-Agent Pathfinding

多智能体寻径MAPF相关推荐

大规模多智能体路径规划
点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入! 李娇阳:南加州大学计算机系博士四年级学生,导师Sven Koenig, 本科毕业于清华大学自动化系.目前主要的研究方向为人工智能,多智能 ...
三篇强化学习用于多智能体路径规划的论文
Multi-Robot Path Planning Method Using Reinforcement Learning 期刊:applied science MDPI 总结:使用VGG进行特征提取 ...
定制语音代理（智能体）的背后是什么？
定制语音代理(智能体)的背后是什么? What's behind the move to custom voice agents? 自动化是未来的发展方向.生活在一个现在的时代,希望所有的事情都能迅速 ...
如何通过结构化智能体完成物理构造任务？| 技术头条
作者 | Victor Bapst, Alvaro Sanchez-Gonzalez,Carl Doersch, Kimberly L. Stachenfel 译者 | Linstancy 编辑 | ...
15万奖金强化学习赛事！Go-Bigger多智能体决策智能挑战赛来了！
<球球大作战>是一款风靡全球的休闲电子竞技游戏,以大球吃小球为目标,简单有趣却又斗智斗勇. 你不知道的是,AI世界也拥有了自己的<球球大作战>. 前不久,OpenDILab开源 ...
一块V100运行上千个智能体、数千个环境，这个「曲率引擎」框架实现RL百倍提速...
视学算法报道编辑:张倩在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架,它可以在一个 ...
CVPR 2020 | 基于多智能体RL实现多轮连续交互，IteR-MRL使图像分割算法达到医用标准...
机器之心专栏作者:Xuan Liao.Wenhao Li等如何提高交互式图像分割算法的效率?上海交大和华师大的研究者提出了一种基于多智能体深度强化学习的新型算法. 现有的交互式图像分割算法虽然能迭 ...
怎么调用获取被创建的预制体_Uber 开源 Plato：扩展性极强的开发测试会话 AI 平台，可实现多智能体并行训练...
雷锋网 AI 科技评论按:在过去的几十年中,智能会话系统已经发生了显著的变化,从关键字识别交互式语音应答(IVR)系统到跨平台智能个人助理,都在慢慢成为日常生活中不可或缺的一部分.在这样的背景环境下, ...
《强化学习周刊》第40期：PMIC多智能体强化学习、Lazy-MDPs、CTDS
No.40 智源社区强化学习组强化学习研究观点资源活动周刊订阅告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...

多智能体寻径MAPF