原文来源:frontiers

作者:Nicolas Bredeche、Evert Haasdijk、Abraham Prieto

「雷克世界」编译:嗯~阿童木呀、KABUDA

本文概述了适用于机器人群体(robot collectives)在线分布式进化的进化机器人技术,即实体进化(embodied evolution)。对具体进化的定义进行了阐述,并对基本概念和机制进行了全面描述。此外,本文还全面总结了自2000年以来在该领域所发表的研究成果,提供了多方位的视角从而确定主要的发展趋势。特别是,我们有了一个新的发现,即,将原先的把具体进化看作是小型机器人群体内(小于10台机器人)的一种并行搜索方法,转变为将具体进化看作是类群体性集体中用于设计集体行为的在线分布式学习方法。总而言之,本文所阐述的该技术的相关应用和开放性问题,为过去提供了一个里程碑,也为未来的研究提供了灵感。

本文概述了进化机器人的相关研究,在这项研究中,进化以一种连续的方式发生在机器人群体中。Ficici等人(于1999年)创造了embodied evolution这一用于描述进化过程的短语,它分布在群体机器人上,从而使它们能够自主和持续地进行适应。同时,随着机器人技术的发展具备越来越高的可能性,以及经济上的可行性,在最小的人为监督环境下,专家团队以高昂代价操作的单个机器人,正通过机器人群体的协作使用,迅速地得以辅助(Bellingham和Rajan于2007年提出),并且,在这种机器人群体中实现自主的在线自适应过程中,具体进化可以发挥至关重要的作用。

实际上,实体进化背后的愿景是一组真正的自主机器人,它们可以调整自己的行为以适应不同的任务和环境。自主发生在两个层面上:机器人不仅能够在没有外部控制的情况下执行任务,而且它们能够通过进化,在不需要外部监督的情况下对其自身行为进行评估和调整,因此可以自主学习。这种自适应能力使得机器人在无法事先准确建模的情况下能够得以部署。这可能是因为环境或用户需求尚未完全了解,或者可能是由于机器人之间交互的复杂性以及它们环境的有效性导致场景不可预测。此外,车载自适应性(onboard adaptivity)本质上避免了在部署之前开发控制器时由于机器人或其环境的建模不准确将造成的现实差距(Jakobi 等人于1995年提出),因为控制器在部署之后还将得以继续开发。最终的好处是,实体进化可以看作是并行化进化过程,因为它将评估分布在多个机器人上。Alba(于2002年)已经表明,这种并行性可以提供很大的好处,包括超线性加速(superlinear speedups)。在机器人的示例情况下,这具有减少每个机器人执行不良控制器所耗费的时间的附加好处,减少了磨损。

在实体进化中,以机器人为中心和以基因组为中心的循环

实体进化的在线本质与“传统”进化机器人研究形成鲜明对比。传统的进化机器人采用经典顺序集中的优化范式进行进化:父辈和幸存者的选择是集中并考虑整个群体。“机器人”部分需要进行一系列机器人试验(模拟与否),以一种基于进化的方式进行搜索从而找到最优机器人控制器。就任务性能表现而言,实体进化在某些情况下,如飞行无人机的监控和自我定位,其性能表现要远远优于其他进化机器人技术,特别是在收敛速度方面。

考虑到能够提供一个清晰明了的讨论的初衷,我们将实体进化定义为这样一个范例,其中,进化是在多机器人(两个或多个机器人)系统中实施的。两个机器人已经被认为是一个多机器人系统,因为仍然可以在其上分配一个算法。这些系统具有以下特征:

权力下放(Decentralized)

没有中央权力机构选择生育后代的父母或将被取代的个体。相反,机器人根据局部信息评估它们的表现,交换和选择遗传物质。

在线

机器人控制器会随着机器人正常行动而发生动态变化:进化发生在机器人的操作寿命期间和任务环境中。在机器人得以部署完毕后,这一过程仍将继续。

并行

无论它们是否在任务中进行协作,群体都由多个机器人组成,这些机器人在同一环境中同时进行动作和进化,频繁地进行交互以交换遗传物质。

通信遗传物质的分散性意味着选择是在局部执行的,通常只涉及整个群体的一部分(Eiben等人于2007年提出),并且它必须由机器人自己执行。除了父母和幸存者选择之外,这次还增加了第三个选择的机会,这是为经典进化计算定义的。因此,实体进化扩展了定义进化算法(即评估、选择、变体和替换(Eiben和Smith于2008年提出))的运算符集合,并将交配作为关键的进化算子。

交配(Mating)

两个(或更多)机器人决定发送/接收遗传物质的行为,不管这种物质是否会用于生成新的后代。这种情况何时发生以及如何发生,不仅取决于预定的启发式算法,还取决于进化的行为,后者在很大程度上决定了机器人是否会遇到交换遗传物质的机会。

在过去的20年里,通用的在线进化机器人以及特定的实体进化,作为一个研究领域已经成熟起来。在受人尊敬的进化计算聚焦点所不断涌现的相关出版物可以证明这一点,诸如会议(例如:ACM GECCO、ALIFE、ECAL和EvoApplications)、期刊(例如:进化机器人领域进化智能的特殊问题(Haasdijk等人于2014年提出)、研讨会(PPSN 2014 ER研讨会、GECCO 2015和2017机器人研讨会上进化群体性行为)以及教程(ALIFE 2014、GECCO 2015和2017、ECAL 2015、PPSN 2016和ICDL-EPIROB 2016)等。谷歌的一位学者所搜索的出版物引用Watson等人在2002年撰写的开创性进化论文说明了这种增长趋势。自2009年以来,该论文引起了极大的关注,自2008年以来引用次数每年增加一倍以上(自那时起每年约引用20次)。

然而,到目前为止,还没有关于什么是实体进化(以及什么不是)的明确定义,也没有关于这一领域技术现状的概述。本文提供了实体进化范式的定义,并将其与其他进化和群体机器人学研究联系起来。我们确认并回顾了相关研究,强调了许多特定于具体进化范例设计选择和问题。这些共同提供了有关最新技术的全面综述,并为对群体自主适应的进化方法感兴趣的研究人员提供了一个起点。文章指出了可能提供解决方案的其他领域的未解决问题与研究,指出了今后工作的方向,并讨论了潜在的应用。

本文概述了机器人群体的实体进化, 这一研究领域自2000年以来得到了不断发展。本文最主要的贡献体现在三个方面。第一,阐明了实体进化的定义和总体进程。第二,概述了迄今为止已有的进化研究成果。第三,为今后的研究提供了方向。

这一概述揭示了该领域的成熟性:虽然在实体进化诞生的最初十年里,其主要被用作为设计个人行为的并行搜索方法,但在群体方面出现了一种趋势(即合作、分工以及专业化)。这一趋势与大型群体式机器人集体趋势携手并进。

我们希望这一概述可以为该领域提供一个垫脚石,以此体现出它的成熟,并为有抱负的研究人员提供灵感。为此,我们强调了可能的应用和可能推动该领域研究议程的公开问题。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

一文详解「群体机器人」中的「实体进化」到底是什么?相关推荐

  1. 视频化全链路智能上云?一文详解什么是阿里云视频云「智能媒体生产」

    视频化链路在革新 人工向智能.小众向大众 标准向定制.慢钝向实时 视频创作与传播的全流程在革新. 对于视频的生产与消费,其全链路包含采集.制作.管理.分发.消费五个阶段,而云计算和网络的发展,为每个环 ...

  2. 「软件项目管理」一文详解软件配置管理计划

    一文详解软件配置管理计划 前言 一.配置管理概述 1. 配置管理(SCM)定义 2. 软件配置项目(SCI) 3. 基线 4. 软件配置控制委员会(SCCB) 二.软件配置管理过程 1. 管理过程 2 ...

  3. 「软件项目管理」一文详解软件项目质量计划

    一文详解软件项目质量计划

  4. 「软件项目管理」一文详解软件项目管理概述

    一文详解软件项目管理概述

  5. 一文详解 ChatGPT:背后的技术,数据,未来发展

    文章目录 一文详解 ChatGPT ChatGPT背后的技术 基于 Transformer 的预训练语言模型 提示学习与指令精调 思维链(Chain of Thought,COT) 基于人类反馈的强化 ...

  6. 一文详解自动驾驶的动态驾驶任务(DDT) | 自动驾驶系列

    文章版权所有,未经授权请勿转载或使用 本系列上篇文章<一文详解自动驾驶的运行设计域(ODD)>解读了什么是自动驾驶ODD,本篇文章依据SAE J3016详细解读自动驾驶DDT.DDT fa ...

  7. 一文详解JavaBean 看这篇就够了

    一文详解JavaBean 看这篇就够了 JavaBean的历史渊源 JavaBean的定义(通俗版) JavaBean应用 < jsp:useBean > < jsp:getProp ...

  8. 【卷积神经网络结构专题】一文详解AlexNet(附代码实现)

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]本文是卷积神经网络结构系列专题第二篇文章,前面我们已经介绍了第一个真正意义 ...

  9. 一文详解 YOLO 2 与 YOLO 9000 目标检测系统

    一文详解 YOLO 2 与 YOLO 9000 目标检测系统 from 雷锋网 雷锋网 AI 科技评论按:YOLO 是 Joseph Redmon 和 Ali Farhadi 等人于 2015 年提出 ...

  10. 一文详解决策树算法模型

    AI有道 一个有情怀的公众号 上文我们主要介绍了Adaptive Boosting.AdaBoost演算法通过调整每笔资料的权重,得到不同的hypotheses,然后将不同的hypothesis乘以不 ...

最新文章

  1. C语言易错题集 第三部
  2. 基于用例点来度量软件规模并管理进度 之三
  3. 共享经济模式下的边缘计算——PPIO边缘云 laaS技术实践分享
  4. Unbuntu 自动重启MySQL
  5. java对象类型转换分为_java-如何将类对象转换为通用对象类型?
  6. Java 8星期五:Java 8的阴暗面
  7. html5怎么产生手风琴效果,Html5 js如何实现手风琴效果
  8. php swoole process,PHP swoole的process模块创建和使用子进程操作示例
  9. swing的jlist的值怎么获取_彻底解决安卓/IOS获取蓝牙ID不一致的问题
  10. 使用WMI和性能计数器监控远程服务器权限设置
  11. redis的基本命令
  12. mysql 生成假数据_一个好玩的假数据生成器mimesis
  13. SMOTE算法原理及程序python(新手版)
  14. 基于html的火柴人羽毛球网页游戏设计
  15. vue pc端调用摄像头进行拍照并实现裁剪上传
  16. VOIP/LTE/VOLTE/VOWIFI
  17. 豆瓣top250图书爬取
  18. python处理问题汇总二(重复值索引,顺序读取文件,drop函数,数组元素排名)
  19. Python小鸟管道游戏源代码及素材
  20. 在linux中安装gdb遇到的问题

热门文章

  1. 用GAN还原语义标注图!还能手动改细节(附论文、代码)
  2. 谷歌CEO为「Jeff Dean开除研究员」事件道歉,却引发持续争议
  3. 被小扎誉为整个科技界的愿景,元宇宙到底是什么?
  4. 无需向量监督的矢量图生成算法,入选CVPR 2021 | 代码开源
  5. 【资源干货】超全!我常用的70个数据分析网址
  6. 对接kafka_flume对接kafka多路径同时收集日志,配置怎么写?
  7. 逃离 AI 赛道的投资人:做局失利、破局无力
  8. 北大教授吴玺宏:从发声到语言,具身物理模型让NLP回到小数据时代
  9. 深度聚类的可视化解释
  10. 完胜 BERT,谷歌最佳 NLP 预训练模型开源