伯克利和Deepmind前赴后继，只为教出一个会做家务的机器人？

硅谷Live / 实地探访 / 热点探秘 / 深度探讨

本文转载自：脑极体（微信ID：unity007）

新年伊始，伯克利就传出新进展，他们教机器人做家务的能力更上一层楼了。

在最新的论文中，伯克利介绍了他们是如何让机器学会读懂人类的潜台词或未尽之意，而不是傻乎乎地按照字面意思或者奖励系统来机械地运动。

举个例子，当餐桌机器人上菜时，它会知道躲避酒柜，或者在停电等紧急情况下停止端盘子，而不是为了尽可能多地得到奖赏（端一个盘子系统会提供一个奖励），而马不停蹄地送盘子。甚至还可能直接把盘子打碎，这样就可以获得更多的“盘子”（奖励）了……

反正我看到这个新闻时，第一反应是机器人可真笨啊，这么简单的任务我两岁的小侄子都会做。第二反应是伯克利教机器人做家务的执念也未免太深了吧！

之前还开发过引擎教机器人铺床单、叠衣服、收拾桌面，总之，非要让机器人掺和家务这件事不可。

想要挑战家务技能的除了伯克利，还有Deepmind。去年2月，Deepmind就提出了一种新的学习范式“计划辅助控制SAC-X”，来帮助机器人学会整理桌子和堆叠衣物。

前不久佐治亚理工学院的研究人员，也发表了新的强化学习算法，可以教会机器人穿衣服。

为什么这么多AI巨头不约而同地走上了家务培训的道路？未来我们能拥有《底特律》中卡拉小姐姐那样温柔能干的家政机器人吗？本文就来尝试解释一下这些疑惑。

家务三十六计：

家政机器人都掌握了哪些技能？

首先我们来看看，在这么多人类学霸、AI巨头的助攻下，机器人都学会了哪些家务小技能。

先来说说“家政狂魔”伯克利。

早在去年，我们就解读过伯克利的通用预测模型，它可以帮助机器人自主学习和掌握很多通用基础技能，在此基础上学习和预测主人的意图和任务的共性，从而可以举一反三执行广泛的任务类别，成长为一个优秀的“家务多面手”。比如折叠短裤毛巾、挪移苹果、整理桌面等等。

伯克利还推出了一个深度学习模型Dex-NET，基于角点检测和抓取策略，让机器人完成铺床单这一艰巨任务。

最值得一提的是新的研究成果“偏好优化模型”。机器人不仅能完成通用任务，而且还能够推断出更优解，适应带有隐藏条件的复杂现实环境。

比如在常规的“actor-critic”增强学习反馈机制中，主人要求机器人导航前往紫色的门，那么机器人就会选择最短路径（传统意义上的最优解），而忽略这么做会打碎路上的花瓶。

因为机器人无法获知，主人是否关心花瓶会不会被打碎。但如果机器人能自己模拟和演练过去发生过的行为轨迹，比如主人一直都绕着花瓶走，说明她是重视花瓶的完整状态的，由此推断出绕过花瓶是最有可能获得奖励、应该积极追求的目标。

机器人拥有洞察隐藏条件的能力，意味着它们可以从一种状态中学习人类的偏好，系统无需事无巨细地列出所有现实环境中的因果联系和条件，奖励函数也不再是线性机械的，机器人可以自主模拟和学习过去的经验，判断和应对未知的动态环境。

对于做家务这个任务来说，判断主人的喜好来进行作业，可以说是必杀技了。

与伯克利相比，Deepmind其实对医疗这种高精尖任务更感兴趣。但这并不妨碍它在家政领域发光发热。

Deepmind的“计划辅助控制SAC-X”模型，就旨在帮助机器人学会探索和掌握家务方面的基本技能。就像婴儿在爬行和走路之前必须发展出协调和平衡能力一样，SAC-X也有助于帮助机器掌握几种核心的视觉-运动技能。

比如运用模拟手臂，按照正确的顺序，即使没有见过这各任务，也能从零开始学习，并按要求顺利地把物体举起来。这样就能在无需额外编程的前提下，完成整理桌面这样的复杂任务。

此外，乔治亚理工学院将布料引入学习框架，教机器人学会穿衣服的论文也非常别出心裁。

因为衣服的布料材质各不相同，穿衣服的动作也无法遵循特定的运动轨迹，会和布料产生复杂的交互变化，机器人必须不断练习，对各个子任务（拽起边缘、扯平衣角等）进行模拟和优化，在不断变化的环境条件中学习到稳定的创意控制策略，最终完成穿不同衣服的任务目标。无论衬衫、套头毛衣，还是外套，都是妥妥滴！

听起来，好像大部分家务活儿机器人都可以驾驭嘛，但杯具的是，现实中能够见到的家务机器人，干起活来依然是一副又慢又笨的蠢样子。

比如由伯克利设计、Rethink Robotics公司开发的家庭助手，叠一个毛巾就要15分钟；而加州 FoldiMate推出的智能洗叠机器，可以按照程序把衣服叠成需要的方块，但需要人手动放置在展台上，并没有节省多少人力，售价还高达980美金（约7000块人民币）……emmmm还是自己动手丰衣足食吧。

不是比人慢，就是比人贵，靠机器人做家务性价比实在是太低了。那么，既然不能真的帮人类做家务，教机器人学习这些技能，究竟有何意义？

为什么是做家务，

去工厂搬砖不行吗？

这么多研究人才齐上阵，要是去教小学生，怕是都能考上清华了。实在不行，去工厂搬砖也能缓解下劳动力紧张啊，干嘛非要跟家务活儿较劲呢？

原因恐怕在于，家政任务提供了一个从零开始学习复杂控制任务的训练环境，这对通用机器智能来说至关重要。

首先，家政任务的真实性和多样性，有助于智能体学会如何用最少的先验知识来解决复杂问题。

先验知识指的是一种不依赖于经验总结（类似编写好的程序，从结果推导过程）的一种元能力，通过观察学会推理和判断。而机器人就没有这种“天生的”知识，但显然我们也不可能将机器人服务的每个家庭、每个可能任务都进行预先编程，这时，训练机器人的通用能力就显得尤为关键了。

尽管机器永远不可能拥有像人一样的先验能力和通用性，在各个学科、各个工作岗位都能表现差不多。但在很多垂直领域，比如工业、家务、语言等，先验能力强的机器智能体就可以低成本、高适应性、灵活地完成工作任务，解决那些现在只有人才能解决的问题。

另外，家政任务是一个集视觉、触觉、运动、关节控制等为一体的任务，综合性很强，这是其他碎片应用不具备的环境，对训练多元功能协作的智能体很有帮助。

比如伯克利教机器人从垃圾桶中拾取原本看不见的物体，就需要通过摄像头采集深度图像，形成模拟数据集，再利用该数据集训练质量卷积神经网络(GQ-CNN)，对物体进行图像分割，确定抓取尝试成功的可能性，最后形成抓取成功概率最高的策略，再对夹持器关节进行实时精密控制，才能最终完成这一操作。一次训练，多种收获。

更重要的是，家务的操作环境比起工业机器人、电子游戏等，都更加松散，充满变化，任务的主观预期和隐藏含义更难界定和预测，无形中加大了训练难度。与此同时，家政任务的训练成本也比较低，也更容易为大众所理解，社会效益和营销价值双丰收。

相比对机器狗拳打脚踢、在《Dota》中血虐真人玩家，让机器做做家务简直堪称是最政治正确、价廉物美的训练方式了。

醉翁之意：做完家务，

这些研究还有什么用？

在家政机器人背后，实际隐含的是一种智能体创生的本质逻辑：在复杂的环境中自己探索出解决随机和非结构化问题的合理方案，可以安全地与环境交互，同时高效地完成任务。

具体一点说，训练家政机器人，主要有一下三个方面的好处：

一是培养更具有通用智能的机器人，在不需要过多指导的前提下，执行一系列任务，提高机器自动化的安全性和工作效率。

二是有助于开发用于分层规划、感知和推理的算法，可以帮助自动驾驶、工业自动化、智能物联网等等领域解决应用问题；

三是推动零样本学习、少样本学习等技术的进步。在缺乏外部奖励信号的情况下，算法也能很好地推理出行为的意图，可以显著提升电商、内容产品推荐系统的使用体验。

这样，大家恐怕就不难理解，为什家务会成为通用智能体成长道路上无法绕过的“垫脚石”了。

最后可能还有人想问：不爱做家务星人，我只关心机器人啥时候能进我家给我叠被铺床？我只能说：亲亲这边建议直接睡觉呢梦里什么都有~

伯克利和Deepmind前赴后继，只为教出一个会做家务的机器人？相关推荐

如何从移动硬盘中分出一个区做启动盘
如何从移动硬盘中分出一个区来做系统安装启动盘前两天入手了一个1T的移动硬盘,琢磨着能不能用来做一个系统启动盘呢?于是上网搜各种大神的资料,终于搞定了.能够做成系统启动盘,能进入Win PE系统,但是 ...
【值得收藏】如此心机的老婆，不难教出一个优秀的女儿。谁娶了都是福。
2019独角兽企业重金招聘Python工程师标准>>> 特别感谢作者,分享这么好的教育经验,其中好多招都和小时候我妈妈用的基本一样,不过我妈妈不会上网,方法也更农村,但原理是一样的, ...
在quartusii如何设计出一个 3 位的十进制加法计数器的原理以及它的设计电_从算盘到计算机，从十进制到二进制，人类计算能力的提升...
从整个人类的发展史上看,我们的科技和生产力是以加速度的规律发展的.尤其是最近的一百多年时间里,我们的加速度得到了前所未有的提升.在70万年以前,周口店的"北京人"就已经会使用火了. ...
找出一个数组里面前K个最大数
前言:今天早上来实验室,同桌问了我一个问题:找出一个数组里面前K个最大数的高效算法.最近正好在看数据结构和算法相关内容,便以己之力帮她思考了思考. 问题:找出一个数组里面前K个最大数. 解法: 1.第 ...
典型的Top K算法_找出一个数组里面前K个最大数
原文典型的Top K算法_找出一个数组里面前K个最大数...或找出1亿个浮点数中最大的10000个...一个文本文件,找出前10个经常出现的词,但这次文件比较长,说是上亿行或十亿行,总之无法一次读入 ...
【越好奇，越强大】伯克利研究人员使用内在激励，教AI学会好奇
你可能不记得第一次玩"超级马里奥兄弟"是什么感觉,但试着想像一下:蓝色的天空,棋盘石的地面,还有一个蹲着的红色男人在静静等待.他面向右方,你把他推到那个方向.再多走几步,就会看到一 ...
给AI一个洗衣机，TA会做点啥？斯坦福+FB研究了972种形状，只为教机器人开门
来源:大数据文摘本文约1500字,建议阅读5分钟给AI一个洗衣机,它知道拉这个动作可以将这个洗衣机打开吗? 让你打开一个滚筒洗衣机的门,你会怎么做? 这是人类在日常生活中与周围物体互动的简单场景之一, ...
casio学生用计算机怎么显示数字,CASIO学生用计算机显示频右上角上出现FIX 只需教我按键就行了...
CASIO学生用计算机显示频右上角上出现FIX 只需教我按键就行了以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! CAS ...
国庆八天教你怎么写出一个钢琴
来源:听见下雨声 https://juejin.im/post/6879708939190009869 前言国庆节八天来娱乐一下,教你怎么用代码写出一个钢琴????,并用它弹奏歌曲.学生时代的我们如 ...

伯克利和Deepmind前赴后继，只为教出一个会做家务的机器人？

伯克利和Deepmind前赴后继，只为教出一个会做家务的机器人？相关推荐

最新文章

热门文章