郭一璞 发自 凹非寺
量子位 报道 | 公众号 QbitAI

从上海,到北京,每个城市都在搞垃圾分类。

干垃圾、湿垃圾、有害垃圾,猪不能吃、猪能吃、猪吃了会死……你是不是还在为这些垃圾分别是什么而苦恼呢?

要是能自动给垃圾分类就好了。

Alphabet X,就是之前孵化了无人车的Google X,终于造出了垃圾分类机器人

这些机器人可以把垃圾分类、把分错类的垃圾放到正确的地方,还能在办公室里游走捡垃圾。

比如,放错地方的矿泉水瓶,机器人可以捡起来放到正确的地方去:

放错地方的易拉罐,也要让它和别的罐罐在一起:‍

他们在Alphabet公司的办公室测试后,发现这台机器人可以显著降低垃圾造成的污染,将本能回收利用却被送去垃圾填埋场的垃圾占比从20%降到不到5%

怎么做到的

想让机器人学会垃圾分类,需要用到感知、移动和操作,借助计算机视觉技术进行感知以及帮助机器人前行的自动驾驶能力都是业界熟悉的,但如何学会在复杂环境中用“手”拉开柜子、打开抽屉、捡走垃圾则是必须要让机器自行学会的操作。

因此,Alphabet X用到了三个方法来让机器人学会灵活用“手”。

跟人类学习

第一种是跟人类学习,模仿人类的动作和做法。

这里就用到了Play-LMP算法,它在没有特定数据集训练的情况下,让机器人跟人类的演示学习,最终实现平均成功率85.5%。

学出来的成绩,大概是这样的,左边是任务要求,右边是执行过程:

跟其他机器人学习

和其他机器人学习是通过无模型的强化学习,让许多个机器人共享经验。

具体的实现方式是这样的:

让机器人学习借助门把手开门这个技巧,一起学习的每个机器人都装了一份神经网络,并且他们每台机器人都连到了一个中央服务器上。

每个机器人开始对着这个门和门把手琢磨,摸索着考虑怎么开。

这个过程中,每个机器人每一步的行动和结果都被传输到背后的中央服务器上,中央服务器里的神经网络就开始借助这些传输来的经验,迭代改进神经网络。

这样整个过程就好像司令部派了几个士兵出去侦查,再把每个士兵送回来的线索汇总,形成整体的作战思路,再告诉士兵们应该如何如何行动。

所以改进之后,机器人们就都学会了开门这项技能。

在云端学习

机器人要捡垃圾,必须学会灵活的使用自己的“手”来抓东西,要不断的练习,有大量数据来训练模型才可以。

现实世界里,机器人一天只能练习5000次抓取,数据量是远远不够的。

而借助随机到规范适应网络(Randomized-to-Canonical Adaptation Networks,简称RCANs),在云中模拟训练的数据就可以用在模型的实际训练中,这样机器人抓物体的成功率就提升到了70%。

之后,再结合5000次在现实世界抓取的数据,对模型进行微调,成功率就到了91%。

这个过程,相当于在真实世界抓了58万次的结果,一下子省了99%的练习次数。

这样,原来需要花3个月的时间来训练机器人学习抓取,现在只要不到一天就可以了。

另外,这篇论文也发了今年的CVPR。

结构化和非结构化环境里的机器人

现在的机器人领域内,虽然有不少成熟的机器人,但它们都是技能专精、价格昂贵的。

他们在工厂流水线上这种单一而结构化环境里,用非常高的效率处理某一项任务,但无法在每天情况都不一样、复杂而非结构化的生活环境中解决洗衣做饭这些麻烦的任务。

Alphabet X的最终目标是造出可以在日常生活中使用的机器人,比如它可以在家里叠叠被子洗洗碗,在办公室里端茶倒水取外卖……每天都会用到,所以这个项目也因此被叫做Everyday Robots

不过,其难度可想而知。

美国国家公路交通安全管理局给出了这张示意图。

横轴左侧是执行专精的任务,右边是日常的多种复杂任务;纵轴下半部分是在结构化的环境中,上半部分是在非结构化的环境中。

显然,右上角那种在各种复杂环境都能随机应变、十八般武艺样样都行的机器人,人类创造它的难度要远远高于左下角只会在流水线上固定位置完成固定任务的工业机器人。

而在右上方象限内,就有正在发展中的自动驾驶汽车,Everyday Robots,要比自动驾驶的难度更上一个量级。

传送门

最后,关于这个垃圾分类机器人的三种学习方式,相关的论文、技术博客链接如下。

跟人类学习
Learning Latent Plans from Play
作者:Corey Lynch, Mohi Khansari, Ted Xiao, Vikash Kumar, Jonathan Tompson, Sergey Levine, Pierre Sermanet
https://learning-from-play.github.io/

跟其他机器人学习
https://ai.googleblog.com/2016/10/how-robots-can-acquire-new-skills-from.html

在云端学习
Sim-to-Real via Sim-to-Sim: Data-efficient Robotic Grasping via Randomized-to-Canonical Adaptation Networks
作者:Stephen James, Paul Wohlhart, Mrinal Kalakrishnan, Dmitry Kalashnikov, Alex Irpan, Julian Ibarz, Sergey Levine, Raia Hadsell, Konstantinos Bousmalis
https://arxiv.org/abs/1812.07252

如果你也在做类似的研究,不放复制链接参考一下~

作者系网易新闻·网易号“各有态度”签约作者

大咖齐聚!参会嘉宾重磅揭晓

量子位 MEET 2020 智能未来大会启幕,李开复、倪光南、景鲲、周伯文、吴明辉、曹旭东、叶杰平、唐文斌、王砚峰、黄刚、马原等AI大咖与你一起读懂人工智能。观众票即将售罄,扫码报名预定席位 ~



量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

Google X垃圾分类机器人横空出世,再也不怕分不清干垃圾湿垃圾有害垃圾了相关推荐

  1. 甲板智慧-“AI语音垃圾分类机器人”拍了拍你

    未来的城市垃圾去向? F U T U R E   U R B A N   W A S T E   尝试一 垃圾无人车 法国的"海狮"垃圾桶 这种垃圾无人车很酷炫 对于行人很便捷 但 ...

  2. 垃圾分类机器人、无线电子皮肤、孟加拉转基因金稻...| 技术前沿洞察

    热点追踪 / 深度探讨 / 实地探访 / 商务合作 大家好,一周技术前沿洞察又和大家见面啦.本周的一大趋势是,越来越多的技术都开始走出实验室,投入到解决实际问题的应用当中,比如,Alphabet的子公 ...

  3. 四足爬行机器人运动_有自我意识机器人横空出世,还能自我复制,专家表示需警惕其失控...

    有自我意识是什么样的? 人类自身其实就是有自我意识的生命体,那作为有自我意识的生命体,你想过自我意识是指哪些特征吗?指尖科技说小编先跟你探讨一下: 1.主动做事情.就是说在没有其他人控制的情况下,它可 ...

  4. 基于Python+深度学习+神经网络实现高度可用的生活垃圾分类机器人程序

    设计一个基于深度学习的生活垃圾分类机器人软件系统,针对现实社会中产生的垃圾照片进行自动识别分类,对不同类别的垃圾,干垃圾,湿垃圾,可回收垃圾,有害垃圾等进行分类统计处理,减轻人工针对垃圾分类的工作量, ...

  5. 潜龙号开启水下机器人_蛟龙、海龙、潜龙傻傻分不清?全面解密国内最先进水下机器人...

    原标题:蛟龙.海龙.潜龙傻傻分不清?全面解密国内最先进水下机器人 正在执行中国大洋49航次业务化调查任务的"向阳红10号"带上了一件探海利器--潜龙二号.它是我国自主研发的4500 ...

  6. Session/Cookie/Token还傻傻分不清?

    Cookie.Session.Token 傻傻分不清 Session/Cookie/Token 还傻傻分不清? 相信项目中用JWT Token的应该不在少数,但是发现网上很多文章对 token 的介绍 ...

  7. 脸盲的东哥从分不清老婆到分不清兄弟,于是用AI进行无人办公!

    前言 2018年,作为人生赢家的东哥开始了美国的游学生活,因为脸盲,睡错了姑娘,于是染上了官司.当时闹的满城风雨,一度蝉联各大热搜第一,虽然说后来经过一番讨价还价和危机公关,终于打点上下,得以顺利过关 ...

  8. 简介三种垃圾回收机制:分代复制垃圾回收,标记垃圾回收,增量垃圾回收

    一.分代复制垃圾回收 不同的对象的生命周期是不一样的.因此,不同生命周期的对象可以采取不同的收集方式,以便提高回收效率. 在Java程序运行的过程中,会产生大量的对象,其中有些对象是与业务信息相关,比 ...

  9. 【Mysql 存储过程 Or 存储函数 傻傻分不清? 】

    MySQL的存储函数(自定义函数)和存储过程都是用于存储SQL语句的.但是什么时候用什么呢?是不是总是傻傻的分不清? 本文来详细的讲一下存储函数 和存储过程 ,以后再也不会迷糊. 存储函数 | 存储过 ...

最新文章

  1. MySQL count(*)空表为何会很慢
  2. tomcat accesslog日志扩展
  3. 1月4日链接篇:ASP.NET, ASP.NET AJAX, ASP.NET MVC, Visual Studio, IIS7
  4. cr材质库怎么安装_cr5.0安装没有材质库
  5. linux ../的含义
  6. 《数据库SQL实战》查找当前薪水详情以及部门编号dept_no
  7. Flume的Avro Sink和Avro Source研究之一: Avro Source
  8. 03.结构化机器学习项目 W1.机器学习策略(1)
  9. tomcat +apache 配置集群
  10. 【转载】Java线程池详解
  11. 令人厌恶的错误MSB3721,以及win10,VS2019,YOLO V4 环境搭建
  12. 如何关闭苹果Mac上的触控板功能防止误触?
  13. matlab 画的点连成线,matlab怎么把点连成线
  14. 2020年中国科技核心期刊目录(自然科学卷)
  15. 无刷直流电机计算转速
  16. linux 中etc全拼,英语etc_英语中“等等”缩写成为etc吗要加一点吗全拼是什么谢谢大家_淘题吧...
  17. TCP-Drinc:Smart Congestion Control Based on Deep Reinforcement Learning笔记
  18. 为每天节省两小时-华芸AS4004T万兆NAS搭建测试
  19. 从南极到你家,易开得,一支“中国芯”的奇幻漂流
  20. 传奇登录器修改服务器列表,传奇登录器TCP服务器远程列表「防劫持」设置教程...

热门文章

  1. zip 文件下载函数封装
  2. 【持续更新】C++中string类使用总结
  3. linux的crash之hardlock排查记录
  4. 用init-connect+binlog实现用户操作追踪【转】
  5. 微软安全管理解决方案 为企业安全保驾护航
  6. Sql Server 性能分析4 –数据库大小,数据库表大小综合性分析报表输出
  7. php 消息中间件,消息中间件NMQ
  8. jsonp 200 进去error_同样是专科,400分考上的和200分就能进的,差距其实挺明显
  9. iOS 进阶之底层原理一OC对象原理alloc做了什么
  10. Received status code 403 from server: ForbiddenDisable Gradle ‘offline mode‘ and sync project