郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

用于工业生产中的普通机器人,往往只会“给鸡抓鸡,给狗抓狗”,像一个对生活失去了向往的流水线工人,重复着日复一日不用动脑的苦劳力。

但,谷歌大脑昨天发了一个新的算法,让这些穷苦的机械臂开始从事“脑力劳动”:

从一群物品中,抓起需要的东西

比如从拼好的积木组合里,抓单个积木:



所使用的方法是深度强化学习,将大规模分布式优化和新型拟合深度Q学习算法——QT-Opt相结合,来让机器人从过去的每一次训练中学习,获取经验。

7个葫芦娃的4个月修炼

这次训练的参与“队员”有7名,他们用10个GPU开始训练:

 一根藤上7个机器人

每个机器人由一个带双指夹具的机械臂和一个RGB摄像头组成:



为了让机器人尽快get新的探囊取物技能,谷歌大脑的工作人员准备了1000样不同的物品用来训练:



仔细看一眼,其中包括各种形状、大小、材质不一的物体:




训练的过程首先从工作人员手动设计的策略开始,逐步切换到深度强化学习模型。

从论文上发现,原理大概是这样的:



学有所成

经过4个月的训练后,7位机器人迎来了他们的“考试”:成绩不错,在700次试验中,机器人找东西抓起来的成功率高达96%,比此前监督学习方法78%的成功率提升了很多。

Jeff Dean觉得它们棒棒的:



 凌晨4点的北京,Jeff老师发推夸奖自家机器人

除了提升准确率之外,经过QT-Opt算法训练过的机器人还主动get了4个新技能:

会破除阻碍

如果目标物体和其他东西连在一起,机器人会主动把它分开然后抓取。

比如前面示范的抓积木,机器人可以把影响自己发力的其他积木推开,再抓自己需要的那块积木。

“筷功”强

如果碰到难抓的东西,比如外形奇特或是外表光滑的物品,机器人会分析角度,重新定位,然后牢牢抓住不松手。



随手抓也要分析挑选

如果机器人一下子抓住了一堆东西,它可以自己选出需要的物品,在举起手臂之前牢牢的抓住它。

抢我的一定抢回来

如果人为的把机器人已经抓起来的物体拿掉,它还会锲而不舍的再抓一遍:

重要的是,以上这些技能都不是人为设置的,均是在训练过程中,机器人自行get到的。

最后,谷歌还提供了一个视频,来讲述7位机器人盆友的心路历程:

 《谷歌大脑:机器人进化论》

最后,附论文传送门~

QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation

作者:Dmitry Kalashnikov, Alex Irpan, Peter Pastor, Julian Ibarz, Alexander Herzog, Eric Jang, Deirdre Quillen, Ethan Holly, Mrinal Kalakrishnan, Vincent Vanhoucke, Sergey Levine

谷歌博客地址:

https://ai.googleblog.com/2018/06/scalable-deep-reinforcement-learning.html

arXiv:

https://arxiv.org/abs/1806.10293

加入社群

量子位AI社群18群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot8入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot8,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

谷歌大脑QT-Opt算法,机器人探囊取物成功率96%,Jeff Dean大赞相关推荐

  1. 谷歌大脑与DeepMind合二为一!为对抗OpenAI打造全新大模型

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌突发大动作,旗下两大顶级AI团队谷歌大脑与DeepMind合二为一! 双方人才将并肩作战,以谷歌算力资源为后盾,只为一个目标: 加速AI研究. ...

  2. 再造一个「谷歌大脑」?Samy Bengio加入苹果:将领导全新AI研究部门

    转自:机器之心 越来越多的人工智能顶尖研究者,正在加入这家全球市值最高的科技公司. 本周一,美国科技巨头之间的一个重要高管变动被曝光:谷歌大脑联合创始人.Torch 框架的联合作者 Samy Beng ...

  3. 曾大战LeCun的谷歌女性科学家,刚刚被Jeff Dean开除了!

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 曾经把图灵奖获得者 Yann LeCun 逼到「永久退出社交网络」的 AI 平权著名研究者 T ...

  4. Jeff Dean亲自揭秘谷歌下一代AI架构:通用、稀疏且高效,网友不买帐:毫无新意...

    来源:机器之心本文约2500字,建议阅读5分钟 Jeff Dean 亲自撰文介绍他眼中的下一代 AI 架构 Pathways. 对谷歌的下一代 AI 架构,你怎么看? 在这波 AI 浪潮中,人工智能技 ...

  5. Jeff Dean亲自揭秘谷歌下一代AI架构:通用、稀疏且高效

    来源:机器之心 对谷歌的下一代 AI 架构,你怎么看? 在这波 AI 浪潮中,人工智能技术经过十几年的爆发式发展,已经在各个领域有着极为广泛的应用,如医疗.科学研究.汽车等. 但是随着技术发展的缓慢, ...

  6. 谷歌健康的「文化围墙」:空降的CEO,敌不过傲慢的Jeff Dean,和一群狂热的AI信徒

    在谷歌内部,不少人是Hinton.Jeff Dean及"技术为王"文化的忠实信徒.也正是在这样一股技术宗教般的狂热氛围下,谷歌健康注定走向一场不可挽回的败局. 作者 | 李雨晨 编 ...

  7. TF下载量已超4600万!首届TensorFlow World大会,谷歌大牛Jeff Dean激情演讲

    点击我爱计算机视觉标星,更快获取CVML新技术   新智元报道   编辑:新智元编辑部 [新智元导读]TensorFlow 2.0正式版发布不久,全球开发者和开源用户迎来了首届TensorFlow W ...

  8. 【IEEE 2021大奖出炉】谷歌AI掌门人Jeff Dean获冯诺依曼奖

    作者 | 陈大鑫 近日,2021年度IEEE 冯诺伊曼奖项结果正式公布! Google 高级研究员(Senior Fellow).AI掌门 Jeff Dean摘得本年度奖项,获奖理由为「表彰其对大规模 ...

  9. IEEE 2021多项大奖出炉!谷歌AI掌门人Jeff Dean获冯诺依曼奖

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:AI科技评论 作者 | 陈大鑫 近日,2021年度IEEE 冯诺伊曼奖项结果正式公 ...

最新文章

  1. 运用PFA的路灯指示牌GUI程序
  2. 郊游 ID:PICNIC
  3. PHP常用工具函数之手机号相关
  4. 手动创建数据库实例全攻略7:UNDO
  5. keil4怎么移植其他人的程序_简单和你聊聊造血干细胞移植!
  6. 训练日志 2018.10.24
  7. 泛型技巧系列:类型字典和Type Traits
  8. 英语总结系列(四):寻觅激励自我之道
  9. windows form参数传递过程
  10. Sql优化之Mysql表分区
  11. julia: 如何序列化和反序列化?
  12. java file 其他电脑上_将MultipartFile转换为java.io.File而不复制到本地计算机
  13. matlab机器人画圆
  14. 微信小程序使用font awsome图标库(最新fontawsome5)
  15. php base64解码,php base64 编码与解码实例详解
  16. 极狐GitLab 连接 minikube集群
  17. 2013年第四届蓝桥杯省赛C/C++ B试题解析
  18. ipencil 无法与iPad配对
  19. SpringBoot入门到精通 idea教学 (余胜军通俗易懂版本)
  20. dw css定位,css关于position属性的用法详解(绝对定位和相对定位的混淆)

热门文章

  1. 程序员总被坑?这是GitHub上的一篇防骗指南
  2. Java程序员必备!Dagger2源码分析(二(1)
  3. 快点来学吧!mysql批量插入数据
  4. day06【后台】两套分配
  5. python求曲线拐点_如何发现拐点?
  6. mysql读写分离实现事务_Mysql读写分离后的事务ce
  7. 避免将 props 的值复制给 state!
  8. 使用vuex和axios获取api数据
  9. 为什么不用php做系统吗,IT行业:为什么大部分人都不认可php语言呢?
  10. 怎么通过controller层退出登录_控制层访问拦截