来源:集智俱乐部

作者:郭瑞东

我们都知道大脑是控制身体的中枢,或者夸张点说,身体只是大脑的傀儡。然而事实果真如此吗?认知科学指出,人类并不总是“先知后行”,很多时候也会“先行后知”,身体在塑造精神方面也有着强大的能力。但是人工智能的研究常过于关注“软件”上的智能,通过各种算法模拟神经网络,却忽略了生命的具身智能。斯坦福人工智能研究所联席主任李飞飞近日在Nature Communications 上以“进化和学习产生的具身智能”一文,在模拟环境中证明了人工生命的具身智能,为复杂环境下机器人的设计提供了启发。

研究领域:人工生命、进化算法、具身认知

论文题目:

Embodied intelligence via learning and evolution

论文链接:

https://www.nature.com/articles/s41467-021-25874-z

01

智能和身体形态有关

动物能够完成适合其物理形态的特定任务,这被称为具身智能(embodied smarts)。每个动物的智力在与环境相互作用的过程中,都是与其物理形态协同进化的。因此,蜘蛛用它们细长的腿编织网,海狸拍打它们宽阔的尾巴发出警报,猎豹飞快地跑去抓斑马,而人类有手指去抓握工具。

虽然人工智能也很聪明,但它的智慧与动物不同。人工智能通常是无实体的,如自然语言处理等机器学习,通常是在计算机内部的硅基芯片上完成的,在真实世界中没有物理实体。虽然计算机视觉需要摄像机或传感器,但它通常独立于任何物理形态。

斯坦福大学李飞飞等研究人员想知道:物理形态对智力的进化有影响吗?如果是这样的话,计算机科学家应该如何利用物理形态来创造更聪明的人工智能呢?

为了回答这些问题,它们创建了一个计算机模拟的游乐场。在那里,被称为“ unimals”的节肢动物主体可以在突变和自然选择的约束下学习。随后,研究人员开始观察unimals的虚拟身体是如何影响其智力进化的。

研究发现,虚拟生命的身体形态影响了它们学习新任务的能力。在更具挑战性的环境中或在执行更复杂的任务时进化出的生命形态,比那些在简单环境中进化出的生命形态,能够更快更好地学习。在这项研究中,具有最成功形态特征的人工生命,相比其前几代祖先能更快地完成任务ーー尽管它们在学习开始时的智力水平与其前几代祖先相同。

图1.研究中创建的 Unimal,即通用动物(universal animal),能通过进化产生胳膊,以在模拟环境中生存下来。

02

人工生命的角斗场

在模拟中,研究者不仅改变了人工生命的身体形态,还改变了它们的训练环境和执行的任务,使得实验的复杂度远高于之前的同类研究。通过锦标赛式的达尔文进化方案,该模拟能够确保每一种人工生命的形态都不会被一票否决,就算在不利的环境下依然有机会将形态传递给下一代。该方法既保持了种群的多样性,又降低了仿真的计算量。

图2. 深度进化强化学习框架(Deep Evolutionary Reinforcement Learning),绿框标出的强化学习发生在个体层面,而红框的突变改变身体形态,是该框架中进化算法的体现。

每次模拟开始于576个独特的人工生命,包括一个“球体”(头部)和一个由不同数量的圆柱形节肢以不同方式排列而成的“身体”。每个人工生命都以相同的方式感知世界,并以相同的神经结构和学习算法开始模拟。换句话说,所有的人工生命在开始它们的虚拟生活时,都拥有相同程度的智慧,只是身体形状不同。

图3. 人工生命所需要经历的各类环境

然后,每一个人工生命都要经过一个学习阶段。在这个阶段中,它要么穿越平坦的地形,要么穿越包括块状山脊、阶梯和平滑山丘等更具挑战性的地形。还有一些人工生命必须移动箱子到目标位置,才可以跨越复杂的地形。

图4. 人工生命分别通过平坦、需要绕障和需要将箱子推至指定位置的环境。

训练结束后,每个人工生命与其它三个在相同的环境/任务组合下训练的人工生命参加锦标赛,获胜者能够产生后代。后代在面临与其父母相同的任务之前,经历了四肢或关节的微小突变。所有的人工生命(包括获胜者)都参加了多项锦标赛,只有当新的后代出现时才会开始衰老。

03

身体进化,使得习得有利的行为更快

在每个环境完成三次进化迭代(每次迭代产生4000种形态)后,幸存下来的人工生命平均经历了10代的进化,其形态十分多样,包括两足动物、三足动物以及有或没有手臂的四足动物(见图5)。

图5. 在平坦(a)、需要绕障(b)和需要将箱子推至指定位置(c)的三种环境下,进化得出的最佳形态十分多样。

研究人员从每个环境中挑选出了10种表现最好的人工生命,并从头开始训练它们完成绕过障碍物、推球或者把箱子推上斜坡等全新的八个任务(见图6)。

图6. 人工生命需要完成的8种新任务,包括巡逻、越障、探索和逃离等。

结果是:在需要绕障的环境中进化的人工生命,比在平坦环境中进化的人工生命表现更好,而当在需要将箱子推至指定位置的环境下进化出的人工生命表现最好。表现好的人工生命,无论是单独学习(通过较少的训练获得更好的表现)还是跨代学习都更快。事实上,经过10代进化后,表现好的人工生命已经十分适应环境,以至于它们学习相同任务的时间只需要它们最早祖先的一半。

图7.(a)在三种环境下,使种群中表现前100名的主体适应度达到种群初始值的75%所需的平均迭代次数(纵轴);(b)三种环境中稳定形态的比例,该值在平坦、需绕障和需要推箱子至指定位置的环境中依次增加,说明复杂的环境对稳定性的选择压较高;(c)平均工作成本(纵轴)随进化代数(横轴)的变化;(d)在平坦环境下,不同代人工生命的学习曲线,表明后代不仅表现好,而且学习的更快。

这与19世纪美国心理学家鲍德温(Baldwin)提出的一个假说是一致的,他推测在进化的早期,祖先习得的行为将逐渐成为本能,甚至可能在后代中遗传。鲍德温效应指出:学习适应性优势的能力,可以通过达尔文的自然选择遗传给后代,即“大自然选择的身体形态变化,使得后代能更快学习有利的行为。例如,如果一种动物在生命早期不能学会走路,可能更容易死亡,从而对基因型产生直接的选择压力,选出能更快学会走路的动物。该效应描述的从表型到基因型的能力转移,可能为习得更复杂的行为(如语言能力及模仿能力)腾出学习资源。

04

总结:制造更聪明的人工智能

该研究在人工生命的演化中结合进化算法和强化学习,论证了以下三点:首先,环境的复杂性能够促进具身智能的进化,从而使后代形态有助于学习新的任务。其次,人工生命的模拟重现了鲍德温效应,进化能够将早期祖先学会的有利行为表达在后代的基因中。第三,学习效率和物理形态有关,某些形态更加稳定,工作效率更高,因此可以促进学习和控制。

一直以来,设计在复杂环境下完成任务的机器人都是一个难题。然而,真实世界需要机器人的场景往往又都是复杂的,比如爬过核反应堆提取核废物,在人体血管中穿行输送药物,在地震后的废墟中搜寻生命等。也许解决这一问题的唯一道路是通过进化来设计机器人。通过让人工生命在日益复杂的模拟环境中进化,帮助开发现实世界执行复杂任务的机器人,增强其泛化能力和稳定性。(完)

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

郭瑞东 | 如何制造更聪明的人工智能?让人工生命在复杂环境中进化相关推荐

  1. 人工智能将改变教育的未来:让我们变得更聪明

    你是否意识到,人工智能已经走进了我们的日常生活.最显著的例子是智能手机的虚拟助手和Netflix的推荐系统.不仅如此,人工智能也悄悄进入了教育领域.学生使用人工智能提高他们的成绩,而教师利用它进行在线 ...

  2. 爱立信高级副总裁柯瑞东:爱立信的“中国任务”

    1969年,国际电信联盟设立"世界电信日",旨在强调电信在国民经济发展和人民生活中的作用.今年电信日的主题是"在充满挑战的时代加速数字化转型",而新冠疫情更让人 ...

  3. 图灵奖得主杨立昆:人工智能比你更聪明吗?

    来源:混沌巡洋舰 人工智能常常被认为是一项将要颠覆世界的技术,从这一概念诞生至今的65年中,无数电影与小说塑造了各种经典的人工智能角色,AI (Artificial Intelligence)也很快成 ...

  4. 地理信息技术加持 用数字孪生让城市更“聪明”

    文章转载自微信公众号中地数码MapGIS,版权归原作者及刊载媒体所有. 相关资料表明,过去二十年,中国智慧城市建设投资巨大,建设的传感网络已经领先全球,但硬件重复建设,多注重单方面的智慧化建设,信息孤 ...

  5. 怀里橘猫柴犬,掌上代码江湖——对话阿里云MVP郭旭东

    云栖号资讯:[点击查看更多行业资讯] 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 简介: 跟郭旭东聊过之后,我对程序员的敬佩又多一分.这个92年的开发者,难能可贵地兼备朝气蓬勃的技 ...

  6. 又有微软AI科学家流向产业,小鹏汽车迎来视觉感知负责人郭彦东

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI 太阳底下无新事,趋势变化不是无迹可寻. 一次次科技转关大同小异,无非钱动人动,最终潮水汹涌成势能. 2017年何小鹏由投资人亲任董事长,小 ...

  7. 46招健脑秘笈,让你变得更聪明

    出处:科技新时代 作者:科技新时代 别不好意思承认"你想变得比别人更聪明".和你一样,每个地球人都希望自己能具有渊博的知识.活跃的思维,以及非凡的理解力和记忆力.于是人们开始热衷于 ...

  8. 听见丨苹果申请自主导航系统专利,自动驾驶汽车梦再近一步 现代打造更聪明、实用汽车AI语音系统

    浙江合众新能源宣布获知合出行12.5亿元注资,首款新车将于明年年中上市 昨天下午,浙江合众新能源宣布获知合出行12.5亿元注资并完成控股股东变更.合众新能源成立于2014年,由北京亿华通科技股份有限公 ...

  9. 施努卡:机器视觉技术让机器拥有更聪明的“大脑”和更明亮的“眼睛”

    在自动化行业中,机器视觉技术是一门涉及人工智能.神经生物学.心理物理学.计算机科学.图像处理.模式识别等诸多领域的交叉学科.机器视觉主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理 ...

最新文章

  1. 拥抱并行流,提高程序执行速度
  2. App上架应用市场,如何攻破安全过检难题
  3. 李飞飞的斯坦福 HAI 招人了,薪资丰厚科研经费管够
  4. 每天一道LeetCode-----生命游戏
  5. mysql 日期和时间函数_介绍一下mysql的日期和时间函数
  6. html5 原生 弹窗,HTML5 Popmotion.js实现的弹窗控件
  7. delphi10.1调用BarTender2016R5文件打印标签
  8. Uniapp实现加入购物车抛物线效果
  9. 2022外卖霸王餐程序、外系统霸王餐H5/APP程序源码|美团/饿了么霸王餐系统 粉丝裂变 自带账单 在线支付提现等
  10. 小乐乐与进制转换-c++(六进制转换函数)
  11. openfalcon 组件监控_使用滴滴云快速搭建 Open-Falcon 监控平台
  12. 数字金额转中文大写(到亿)
  13. 外国人眼里的李子柒难道不一样? | Alfred数据室
  14. 配置多SessionFactory
  15. 使用Python将MQTT传感器数据记录到SQL数据库
  16. 深度学习升级打怪之self attention笔记
  17. html中鱼眼效果,鱼眼镜头使用入门指南:鱼眼镜头应该怎么用(附后期鱼眼效果)...
  18. IP地址的三种表示方式是什么
  19. Eclipse的UML建模插件Papyrus概述
  20. 庞博 上海交大计算机系,上海交大电子信息与电气工程学院卢策吾团队在人工智能《自然》子刊提出时空概念提取算法...

热门文章

  1. 欢迎给图灵教育微信平台投食
  2. DWR之父作序推荐,国内第一部DWR著作
  3. 《Web 标准实战》——Web开发人员必读的一本书
  4. TensorFlow练习24: GANs-生成对抗网络 (生成明星脸)
  5. Github上的10个数据科学和机器学习知识库
  6. 达摩院2022十大科技趋势发布:人工智能将催生科研新范
  7. 2021软科世界大学学术排名发布!哈佛蝉联全球第一,清华位居国内榜首
  8. 用耳朵“打字”!这个设备能监测耳部肌肉运动,让瘫痪患者正常打字交流
  9. 报道 | 1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?
  10. 检索、问答、情感分析产业范例分享,代码模型全开源太香了!