郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

伯克利的研究人员最近利用视觉模型强化学习训练了一个不一样的机器人,能够通过自己的探索,完成各种任务:整理玩具、叠衣服、收拾餐具……

并且,这样一个多功能机器人的训练过程是无监督的,不需要投喂数据,完全是机器人自行摸索后学到的。

也就是说,这个机器人看了看你杂乱的房间,就自主的收拾了起来。

帮你把乱放的苹果放进盘子:

帮你叠起秋衣:

整理玩具:

咦,二胡卵子误入。

完成这一系列工作的,都是同一套算法。

这些神奇的技能,Yann LeCun看到都惊呼:Awesome!

像小朋友一样摸索世界

我们开头说过,这个机器人不需要人为投喂数据。

那么数据从哪儿来呢?从需要它工作的现实世界来。

在一个摆放了各种物体的“房间”内,可以让机器人自由摸索,感受房间里的一切,在无监督的情况下,机器人完全可以自己玩自己的。

除了玩杯子、玩具这些硬的东西,还可以玩“软体”的毛巾:

玩的过程中,机器人就通过各种传感器,学到了视觉能力,知道自己身边是什么东西;

学到了定位能力,知道自己在做什么;

学到了做不同的动作,知道自己发出不同命令后,手臂会做什么;

学会熟练使用自己的“手”,可以预测到手做什么动作会对环境中的物体产生怎样的影响。

整个探索过程没有分数、不设输赢,完全是机器人自己凭借“好奇心”,通过摸索这个房间里的物品,形成自己的一套“世界观”的过程。

派活就行,不用你教怎么干

当机器人已经对环境中的物体了如指掌之后,我们该怎么给它安排工作呢?

用像素点。

在整个环境中,通过像素点给机器人标注任务目标,红色为起始点,绿色为结束点,也就是告诉机器人把红点位置的东西搬到绿点位置。

机器人,你来把红点位置的苹果,挪到绿点位置的盘子上去。

机器人想了想,大概只要把苹果夹起来,把手臂挪过去,把苹果放下,就可以了把?

 机器人内心的“草稿”

那就这么办了,召唤机械臂,是骡子是马,我们挪一个看看。

Bingo!成功。

下一个任务,我们把牛仔热裤叠起来。

想一想,揪住一个角,挪过来就好了吧?

根据这个计划试一试:

完美成功~

这个过程具体是怎样的呢?伯克利官方给出了一个视频,可以打开学习一下:

传送门

最后,照例附上传送门。

论文:

Visual Foresight: Model-Based Deep Reinforcement Learning for Vision-Based Robotic Control
Frederik Ebert, Chelsea Finn, Sudeep Dasari, Annie Xie, Alex Lee, Sergey Levine
https://drive.google.com/file/d/1scfbONOHg8H2_pJ9naRkHfk4dGSNGNWO/view

博客:

Visual Model-Based Reinforcement Learning as a Path towards Generalist Robots
https://bair.berkeley.edu/blog/2018/11/30/visual-rl/

至于开源代码嘛,官方表示coming soon,或许过一段时间能在这个页面里找到:
https://sites.google.com/view/visualforesight

年度评选申请

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

这个机器人不学数据集,“纯玩”get各类家务技能,LeCun觉得很赞相关推荐

  1. CSDN开发者周刊第 22期:谷歌 DeepMind 第四代:不学规则就可以玩游戏;图灵奖得主 Edmund Clarke 因感染“新冠”逝世;

    CSDN开发者周刊:只为传递"有趣/有用"的开发者内容! 本周热门项目 1.红帽为杀死 CentOS 发行版辩护 红帽公司的高级社区架构师.CentOS 董事会成员卡斯滕-韦德(K ...

  2. 机器人出魔切还是三相_英雄联盟:辅助也要去上单,机器人布里茨玩法介绍

    英雄联盟:辅助也要去上单,机器人布里茨玩法介绍 出装方面我们都知道他的被动是可以将法力值化为机的护盾的,而这样的话装备就可以选择魔切,然后再出一个鞋子,为什么不先出三项呢?三项的性价比是比较高的,之后 ...

  3. 乐高凯德机器人_酷炫到底!乐高EV3机器人+冰淇淋的高级玩法,你GET到了吗?...

    原标题:酷炫到底!乐高EV3机器人+冰淇淋的高级玩法,你GET到了吗? 你喜欢吃冰淇淋吗? 甜甜凉凉的冰淇淋圣代, 最适合炎热的夏天啦~ 我们"多才多艺"的EV3机器人, 也会做冰 ...

  4. 充电口 米兔积木机器人_米兔积木机器人居然可以这么玩?!

    米兔积木机器人受到了广大网友的喜爱,今天上线了米兔积木机器人颜色传感器. 原来搭配上之后,机器人还可以这么玩! 无线连接 突破接口数量限制 米兔积木机器人颜色传感器采用了创新的无线连接模式,可以让颜色 ...

  5. 灭火机器人C语言程序,广茂达机器人灭火程序(纯C语言).doc

    广茂达机器人灭火程序(纯C语言) float tim_1=0.0; /*时间变量:不用*/ float gf_1=0.0; /*速度功率值 */ int mic_1=0; /*声音值,AI8或AI12 ...

  6. 灭火机器人C语言程序,广茂达机器人灭火程序(纯C语言版).doc

    广茂达机器人灭火程序(纯C语言版) 广茂达机器人灭火程序(纯C语言版).txt看一个人的的心术,要看他的眼神:看一个人的身价,要看他的对手:看一个人的底牌,要看他的朋友.明天是世上增值最快的一块土地, ...

  7. 云顶之弈机器人怎么拉人_LOL云顶之弈机器人刺客流怎么玩

    LOL云顶之弈机器人刺客流怎么玩?云顶之弈模式当中的机器人刺客流阵容搭配思路是怎么样的?该流派实力到底强不强? LOL云顶之弈机器人刺客流玩法 成型阵容: 螳螂,机器人,派克,狮子狗,卡特,寡妇,阿卡 ...

  8. 基于CNN和序列标注的对联机器人 | 附数据集 开源代码

    作者丨苏剑林 单位丨广州火焰信息科技有限公司 研究方向丨NLP,神经网络 个人主页丨kexue.fm 缘起 前几天看到了这个脑洞清奇的对联AI,大家都玩疯了一文,觉得挺有意思,难得的是作者还整理并公开 ...

  9. M2DGR:多源多场景 地面机器人SLAM数据集(ICRA 2022 )

    Paper:https://arxiv.org/pdf/2112.13659.pdf 出处:ICRA2022 & RAL2021 项目地址:https://github.com/SJTU-Vi ...

最新文章

  1. python查询缺失值所在位置使用scipy_python – 使用缺失值计算scipy中的成对距离
  2. db2v9/9.5高级应用开发_Spark v2.4.3应用程序开发入门-基于IDEA/Maven 构建简单应用
  3. SpringMVC中利用HandlerExceptionResolver完成异常处理
  4. java bitset用途_浅谈Java BitSet使用场景和代码示例
  5. tp剩余未验证内容-7
  6. lsattr/chattr
  7. 调试实战 | 通过转储文件分析程序无响应之使用 windbg + IDA 逆向篇
  8. laravel mysql 配置,laravel5数据库配置及其注意事项
  9. 史上最大内存!曝iPhone 14 Pro系列运行内存将增至8GB
  10. Linux操作Oracle(14)——Oracle数据库 使用VMware虚拟网卡 配置 TnsListener 解决 无法启动的问题
  11. linux初级命令行
  12. 多元统计分析最短距离法_多元统计分析习题及解答.doc
  13. 当电脑接双屏扩展显示器时,系统崩溃,QQ浏览器出现显示异常,通过如下方法使之正常
  14. 计算机ppt实训报告总结,计算机实训总结模板
  15. 虚拟现实技术虚拟校园解决方案
  16. TM16xx LED驱动和键盘扫描芯片使用
  17. Android锁屏Demo
  18. 1867最短路径问题(SPFA)
  19. quoted-printable解码程序
  20. “数智话”技术沙龙 第四期 | 弹性MapReduce(EMR)专场内容回顾!

热门文章

  1. 王者荣耀女性机器人面世;深圳中院受理金立破产案;Firefox 64 发布 | 极客头条...
  2. 50 行代码教你爬取猫眼电影 TOP100 榜所有信息
  3. 史上速度最快!DNS 公共服务 1.1.1.1 正式发布
  4. 程序员亲身体验的学历之痛
  5. 被全球 iPhone 用户讨伐 49 天后,苹果终于为 iOS 带来手动关闭降频功能!
  6. mysqlin索引失效的情况
  7. java语言的主要特点是什么,真的太香了!
  8. day11【过渡】SpringBoot
  9. h5 html被缓存,【Web前端问题】html5离线缓存,不能被缓存问题
  10. vc如何打开plt图像_opencv_python从zero到hero————之图像基本操作01