晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

谷歌大脑让AI更像儿童了,至少在对象识别和感知方面是这样。最近,他们和加州大学伯克利分校的学生研究了一种算法Grasp2Vec,通过观察和操纵来“学习”物体的特征。

在硬件方面,谷歌团队与X Robotics合作,调教出一个能够无目的、像婴儿抓阄一样抓住物体的机器人手臂,并在训练过程中让它学习各种物体的表征,最终实现“有目的”地抓取某个确定的物体。

在这项工作公布几个月之前,OpenAI展示过一种类似算法Dense Object Nets(DON),它能让机器人发现、理解和操纵它们从未见过的物体。

谷歌这套机器人对于已经见过的物体,有80%识别并成功抓取的概率,对从未见过的物体也有59%的正确率。

从婴儿获得启发

谷歌研究人员表示,这套算法是基于对自我监督的认知发展研究。

人类从婴儿时代开始,就能够识别喜欢的物品并将它们捡起来,在与周围世界的互动中自我监督学习。因为我们知道自己做了什么,并且会从实践的结果中获得认知。

在机器人技术中,人们正在积极研究这种类型的自我监督学习方法。因为有了它,在不需要大量训练数据或人工监督的情况下,机器人系统也能够进行学习。

机器人的奖励函数

想让机器人找到并抓取我们给定的物体,需要解决2个问题

1、对任意角度和位置摆放的物体,能够与给定的照片进行对比,判断二者是否为同一个物体。

2、在一堆杂乱摆放的物体中,找到与“目标”最相似的物体,排除其他错误选项。

实现这两点,首先要对这套强化学习系统构建奖励函数。

在强化学习(RL)的框架中,任务是否成功通过奖励函数来衡量。 通过最大化奖励,机器人可以从头开始自学各种各样的技能。

然而,针对机器人对物体的感知理解,设计奖励函数要困难得多。向机器人提供期望被抓起物体的图片,在机器人试图抓住该物体后,它会检查抓取的内容。

因此任务的奖励函数归结为回答对象识别问题:这些对象是否与抓取的目标匹配?

接着,为了解决识别问题,需要设计一种感知系统。该系统能从没有人为标注的非结构化图像数据中提取有意义的对象概念,以无监督的方式习得对物体的视觉感知力。

无监督学习算法的核心是,对数据做出结构性假设。然而,如果没有对数据内容的进一步假设,则不足以让AI学会分离出对象的表征。

而可以活动的机器人,恰好为表征学习提供了一个非常合适的条件。因为机器人可以操纵对象移动,为数据提供了变化因素。

寻找目标

对于从场景中识别被抓取对象,有以下3幅图像:

1)抓取前的场景图像,2)抓取后的场景图像,3)抓取物体本身的视图。

如果定义一个从图像中提取“对象”的嵌入函数,它应该存在以下减法关系:

谷歌使用完全卷积架构和简单的度量学习算法,来实现这种等式关系。 在训练时,将抓取前图像和抓取后图像放入密度空间特征图中,用“抓取前”和“抓取后”向量之间的差异表示一组对象。

这个差值向量和被抓取对象的相应向量表征,通过N配对目标(N-pairs object)归于等价。

经过训练,模型中会自然出现两个有用的属性:

1、对象的相似性

第一个属性是向量嵌入之间的余弦距离(即两个向量之间夹角的余弦)。它用来比较对象,并确定它们是否相同,可以用于实现强化学习的奖励功能,并允许机器人在没有人类提供的标签情况下学习抓取。

2、本地化目标对象

第二个属性是本地化图像空间中的查询对象,可以通过组合场景空间映射和对象嵌入来实现。
通过获取空间要素图的元素乘积和对应于查询对象的向量,我们可以找到空间映射中与查询对象匹配的所有图像中的物体。

最终得到的“热图”,可用于规划机器人寻找目标对象的方法。

谷歌将有目的的Grasp2Vec物体识别算法,与之前无目的的“机器人抓阄”策略相结合,实现了对已认识物体80%的找到成功率。

最后,附上论文地址:
https://arxiv.org/pdf/1811.06964.pdf

活动报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

受婴儿抓阄启发,谷歌让机器臂自学抓取物体,不用标注数据相关推荐

  1. python登录新浪微博抓取微博内容_python机器登陆新浪微博抓取数据

    使用python机器登陆新浪微博抓取数据 1.[代码][Python]代码 # import 这边需要注意的是只有一个rsa这个模块是需要install的,其他的都是内置 import re , ur ...

  2. 预、自训练之争:谷歌说预训练虽火,但在标注数据上自训练更有效

    公众号关注 "视学算法" 设为 "星标",重磅干货,第一时间送达! 来源 | 机器之心 预训练是当前计算机视觉领域的主要范式,但何恺明等人先前的研究发现,预训练 ...

  3. 基于RGB-D相机的机械臂无序抓取系统

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 引导语:本文为"3D视觉创新应用(三维重建)竞赛"作品集系列之一,该作品由来自深圳 ...

  4. 第六天:通过python代码控制越疆机械臂完成抓取投递整个过程

    文章目录 一.前言 二.机械臂的运动逻辑(直接上代码讲解,具体请看注释) 三.总结 一.前言 有很多小伙伴问我怎么样控制机械臂完成整个过程,其实经过上一篇博文的探究,这个问题其实很容易就可以解决.把他 ...

  5. 理论联系实践:机械臂视觉抓取之eye to hand

    eye to hand,也就是相机固定在一个位置保持不变,我们想要通过视觉抓取一个目标,最先得到的就是目标在相机所拍摄的图像中的位置.而怎么把图像中的位置转化为机械臂所知道的位置呢. 需要进行如下操作 ...

  6. Gluon_2L6_4L3机械臂视觉抓取操作手册

    机械臂操作手册 安全须知 如遇任何紧急情况,请立即按下紧急停止开关断电,以防操作人员受伤或机械臂损坏. 当机械臂断电时,执行器会立即进入松闸状态,可能无法保持当前姿态.需要人为提供外力保证机械臂不会因 ...

  7. 从零开始的机械臂yolov5抓取gazebo仿真(一)

    从SOLIDWORKS中导出机械臂URDF 一.下载sw_urdf_export插件 插件的安装和下载可详见我写的差速小车第一章的内容 对机械臂模型进行开源(博主用的是SW2019版本).当时拿到这个 ...

  8. 从零开始的机械臂yolov5抓取gazebo仿真(环境搭建篇下)

    sunday功能包使用介绍以及开源 sunday我给自己机械臂的命名,原型是innfos的gluon机械臂.通过sw模型文件转urdf.Sunday项目主要由六个功能包sunday_descripti ...

  9. python爬取新浪微博内容_python机器登陆新浪微博抓取数据

    1.[代码][Python]代码 # import 这边需要注意的是只有一个rsa这个模块是需要install的,其他的都是内置 import re , urllib.parse , urllib.r ...

最新文章

  1. Left,Right,Outer和Inner Joins有什么区别?
  2. PetaPoco 使用总结(二)
  3. .NET Core微服务之基于Exceptionless实现分布式日志记录
  4. JavaScript Swiper插件
  5. Spring MVC 无XML配置入门示例
  6. ElasticSearch 全文检索实战
  7. 牛客网——程序员代码面试指南(更新ing)
  8. 数据库,万能密码与密码解析
  9. 组合导航(五):惯性导航参数建模
  10. windows计算机查看里设置,windows10电脑配置怎么查看
  11. 有没有免费又好用的云桌面系统?
  12. 压缩视频 HandBrake软件
  13. 2018年315晚会黑名单之夜,谁能逃过此劫?
  14. kali 触摸板手势之fusuma
  15. 关于debug时的断点无效问题 [已解决,不知原因]
  16. 热销超极本iFunk翼S到底怎么样?
  17. 编程王 kingofcoders.com
  18. 蓝牙耳机啥牌子音质好?听音乐最好的蓝牙耳机分享
  19. 台达PLC无线通讯方案
  20. Codeforces Round #606 (Div. 2) A ~ C

热门文章

  1. 李彦宏再立 Flag:人工智能将让人类不再需要手机!
  2. 不拥抱算法的张小龙,还能带着微信继续避免失败?
  3. 如何在硅谷一夜暴富?
  4. 你与产品经理之间差的才不只是一段代码!
  5. 精心收集的 48 个 JavaScript 代码片段,仅需 30 秒就可理解!
  6. 金九银十正确打开方式!那些年我们一起踩过算法与数据结构的坑
  7. 有监督学习和无监督学习_机器学习算法之监督学习和无监督学习比较
  8. 需求分析文档模板_我们应该如何进行需求管理「下篇」?
  9. dataloader 源码_[莫烦 PyTorch 系列教程] 3.5 – 数据读取 (Data Loader)
  10. 计算机一级插入页眉,2017年计算机一级WPS辅导:WPS中页眉页脚的设计技巧