1,多智能体系统 (mutli-agent system)MAS

1.1 单智能体

单智能体:任何独立的能够思考并可以同环境交互的实体都可以抽象为智能体。

单智能体特性:自治性,反应性,主动性,社会性,进化性

图1 生物圈的agent

1.2 多智能体

多智能体系统:MAS是指具有大量分布式配置的半自治或自治的智能体(或子系统)通过网络互联所构成的复杂的大规模系统,它是系统的系统

MAS优点:可以执行分布式的任务

MAS特性:自主性,分布式,协调性和一定的自主学习能力,对外界影响具有较强的鲁棒性,对内部单智能体的失误有较高忍耐性。

MAS的协同控制:个体之间彼此相互协同来完成复杂的任务

1.3 同构和异构多智能体

同构MAS:简单来说就是相同的单智能体

异构MAS:不同的单智能体

2,多智能体寻径 Multi-Agent Path Finding-MAPF

2.1 定义

实际上就是通过给每个agent规划一条路径,保证这些路径不相撞,并最小化总的运行时间。

图2 仓储地图中20个agent的MAPF

每个agent有它对应的起点和终点,要求每个智能体能够正确从起点到达终点并且没有冲突。

2.2 问题描述


假设时间是离散的,在每一个时间步长,每一个 agent 都分别位于图 G 上一个节点上,并且可以做一个动作。

k个agent

input:tuple<G ,s ,t>

G:无向图,G=(V, E)

映射s:[1,....,k]→V​ 表示每个 agent 都对应一个源节点;

映射t:[1,..,k]←V​​ 表示每个 agent 对应的目标节点;

Output :k 条 single-agent plan 集合。


2.3 研究方向

其实MAPF的研究主要有两大方向:

一个是针对MAPF本身的问题,如何提高现有的算法效率和解的质量。

另一个是把MAPF应用到实际问题当中的时候,如何处理不同问题所带来的不同约束。

3,常见的MAPF算法

3.1 分类

耦合:耦合方法统一计算智能体路径,能找到最优路径,但不适合agent数量过多

解耦:解耦方法独立规划agent,但它不完整且提供次优解

混合:混合方法利用耦合方法的最优性和解耦方法的快速计算找到最优解,基于冲突的搜索CBS是一种较先进的混合MAPF算法,使用两级搜索,高级搜索探索约束树来解决智能体之间的冲突,低级搜索为每一个agent单独找到最优路径。高级CT随着冲突数量呈现指数级增长,因此对于高度耦合的智能体问题,cbs表现不佳。

3.2 最优型

3.3 次优型


参考文献:

Parallel Hierarchical Composition Conflict-Based Search for Optimal Multi-Agent Pathfinding

多智能体寻径MAPF相关推荐

  1. 大规模多智能体路径规划

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 李娇阳:南加州大学计算机系博士四年级学生,导师Sven Koenig, 本科毕业于清华大学自动化系.目前主要的研究方向为人工智能,多智能 ...

  2. 三篇强化学习用于多智能体路径规划的论文

    Multi-Robot Path Planning Method Using Reinforcement Learning 期刊:applied science MDPI 总结:使用VGG进行特征提取 ...

  3. 定制语音代理(智能体)的背后是什么?

    定制语音代理(智能体)的背后是什么? What's behind the move to custom voice agents? 自动化是未来的发展方向.生活在一个现在的时代,希望所有的事情都能迅速 ...

  4. 如何通过结构化智能体完成物理构造任务?| 技术头条

    作者 | Victor Bapst, Alvaro Sanchez-Gonzalez,Carl Doersch, Kimberly L. Stachenfel 译者 | Linstancy 编辑 | ...

  5. 15万奖金强化学习赛事!Go-Bigger多智能体决策智能挑战赛来了!

    <球球大作战>是一款风靡全球的休闲电子竞技游戏,以大球吃小球为目标,简单有趣却又斗智斗勇. 你不知道的是,AI世界也拥有了自己的<球球大作战>. 前不久,OpenDILab开源 ...

  6. 一块V100运行上千个智能体、数千个环境,这个「曲率引擎」框架实现RL百倍提速...

    视学算法报道 编辑:张倩 在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架,它可以在一个 ...

  7. CVPR 2020 | 基于多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准...

    机器之心专栏 作者:Xuan Liao.Wenhao Li等 如何提高交互式图像分割算法的效率?上海交大和华师大的研究者提出了一种基于多智能体深度强化学习的新型算法. 现有的交互式图像分割算法虽然能迭 ...

  8. 怎么调用获取被创建的预制体_Uber 开源 Plato:扩展性极强的开发测试会话 AI 平台,可实现多智能体并行训练...

    雷锋网 AI 科技评论按:在过去的几十年中,智能会话系统已经发生了显著的变化,从关键字识别交互式语音应答(IVR)系统到跨平台智能个人助理,都在慢慢成为日常生活中不可或缺的一部分.在这样的背景环境下, ...

  9. 《强化学习周刊》第40期:PMIC多智能体强化学习、Lazy-MDPs、CTDS

    No.40 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...

最新文章

  1. Cisco 3640策略路由配置
  2. oracle 错误2 启动服务提示找不到指定文件_Weblogic中间件创建文件权限问题解决...
  3. C语言经典例82-八进制转换为十进制
  4. Linux用户权限acl配置
  5. CVPR 2022|从原理和代码详解FAIR的惊艳之作:全新的纯卷积模型ConvNeXt
  6. python开发测试岗_作为测试开发岗的面试官,我都是怎么选人的?
  7. php生成16位不重复随机码,PHP n个不重复的随机数生成代码
  8. C++异常处理机制详解
  9. NetCore 依赖注入之服务之间的依赖关系
  10. java怎么递归_Java的递归、如何与流相结合
  11. CentOS 7 Linux实时内核下的epoll性能分析
  12. UVA 11235 - Frequent values
  13. 使用CURL出现certificate verify failed错误的解决方法
  14. MySQL免安装版配置部署
  15. js拼接json对象_JS实现合并json对象的方法
  16. 动态规划(一)——矩阵连乘
  17. 电脑桌面便签怎么编辑修改便签内容?
  18. @Deprecated 的功能
  19. 砍价永远差一刀?拼多多法庭上回复:小数点后有6位···
  20. Router入门0x205: react-route + redux + react 集成

热门文章

  1. 奶牛大学 Acwing
  2. 按位与、按位或、按位异或、按位取反、按位左移、按位右移
  3. 教你在ubuntu1804设置固定静态ip,重启也回不会失效
  4. 图像分割(七) —— Transformer and CNN Hybrid Deep Neural Network
  5. h1z1怎么修改服务器,H1Z1新手完全攻略 账号注册及服务器使用方法
  6. PAT 第三周(1011-1014)
  7. 老鹰主机怎么样_HawkHost老鹰主机购买独立ip的最新流程
  8. python地图标点_如何用python画地图上的标注线?
  9. 使用树莓派摄像头识别二维码,并通过http返回结果
  10. UEFI启动是什么意思 UEFI启动对比Bios启动优势在哪里