来源:大数据文摘本文约1500字,建议阅读5分钟给AI一个洗衣机,它知道拉这个动作可以将这个洗衣机打开吗?

让你打开一个滚筒洗衣机的门,你会怎么做?

这是人类在日常生活中与周围物体互动的简单场景之一,对人类来说,拉开一个洗衣机门是自然而然的行为。

人类能毫不费力地理解对每个物体可以采取什么举动,能够理解力的相互作用可能发生在哪里,以及我们需要做一个什么动作才能达到我们的目的。

给AI一个洗衣机呢?它会知道拉这个动作可以将这个洗衣机打开吗?

斯坦福和Facebook就专门成立了一个团队研究这个问题,在他们最近的一篇论文中,他们提取了对物体中可活动的部件进行推拉等行为的相关信息,并使用这些信息来训练一个人工智能模型。

他们开发的这个叫Where2Act的模型,通过对6种原始交互方法,涵盖972种形状,超过15种常见的室内物体类别进行了学习后,成功地学会了预测对新对象的可能有效的动作,甚至对没有学习过的物体也能准确判断。

论文链接:

https://arxiv.org/pdf/2101.02692.pdf

每个像素都要学习

要让AI学会和现实交互,首先要让AI理解什么是交互。

研究人员认为,与物体的长期交互就是短期“原子(点)”交互的序列,比如推和拉,就是在一个点上进行作用的序列。

这就简化了AI的工作范围,给定一个物体,AI可以先假设进行一个可能合理短期互动,这种交互可以被进一步分解为“在哪里”交互和“如何”交互。

例如,AI要判断拉动柜子上的哪个把手,以及应该平行于把手拉动还是垂直于把手拉动等。

确定“在哪里”交互就是要找到那个短期交互的“原子(点)”。

为此,研究人员开发了一个模型,当给定一个物体的深度或彩色图像时,对于每个像素,模型都通过无数次的尝试来学习,将达到效果的标记为成功。

"我们的方法允许AI通过与各种对象进行交互,并记录其操作的结果来学习这些结果——将那些导致理想状态变化的动作标记为成功,"研究人员表示。

通过学习,最后模型就可以对每个像素给出一个效果评分,以及动作建议和成功的可能性。

数据集也是模拟生成

尽管AI要学习的都是人类常见的动作,但正是因为太常见、太普通,类似的视频数据集很少。

为此,研究人员使用SAPIEN创建了一个模拟交互式环境,一个随机3D关节对象被选择并放置在场景的中心,而机器人手爪可以通过在指定位置和物体进行交互。

通过不断的交互,从而让机器人学习到什么如何交互才能产生成功的效果。

研究人员还采用混合数据采样策略,首先对大量离线随机交互轨迹进行采样以引导学习,然后基于网络预测自适应地对在线交互数据点进行采样以提高学习效率。

最后,训练好的AI终于学会了与现实世界交互,比如一个简单的开门和关门,在AI的理解中,就是:

  • 开门=在高曲率区域(如门得边沿或者手柄)施加一个拉力大概率可以打开门

  • 关门=在可推动的门的所有平面像素点施加一个拉力都可以关上门

费尽力气,只是开了个门?

就像让AI识别猫和狗一样,往往人类觉得轻而易举的事,AI反而觉得很难。

也正如图像识别一样,AI也是依靠日益提升的计算力通过对每个像素进行分析开始慢慢学会了和现实交互。

包括此前加州大学伯克利分校的研究人员开发的高效机器人操作框架(FERM),也是通过"基于像素"的强化学习来让机械手臂学会如何和现实世界交互。

研究人员表示,只通过10次演示,相当于15到50分钟的实际训练时间,一只机械臂就可以学会接触、挑选、移动和拉大型物体,或者翻转开关。

尽管现在AI在和现实交互的理解方面还只能做到移动物体、开关门等简单操作,但是这至少是AI向现实世界迈进的第一步。

未来是否能出现AGI,正是要看这些基础的研究能慢慢做到什么程度。

相关报道:

https://venturebeat.com/2020/12/16/new-framework-can-train-a-robotic-arm-on-6-grasping-tasks-in-less-than-an-hour/

https://venturebeat.com/2021/01/08/stanford-researchers-propose-ai-that-figures-out-how-to-use-real-world-objects/

编辑:王菁

校对:林亦霖

给AI一个洗衣机,TA会做点啥?斯坦福+FB研究了972种形状,只为教机器人开门相关推荐

  1. “不务正业”斗地主?AI青年查道琛想做“被人看到”的研究

    原来他们是这样走过来的! [AI红人荟]--这里是TechBeat人工智能社区为优秀的AI工作者开设的人物专访栏目.从膜拜"红人"到成为"红人",TechBea ...

  2. AI 工程师:他们是做什么的,以及他们值多少钱?

    人工智能不仅是对认知工作的自动化,也是一个不断发展的过程.毫不夸张地说,开发基于AI的解决方案似乎很有前景,但事实真的如此吗? 作者 | Oleksii Kharkovyna 译者 | 王艳妮,责编 ...

  3. 伯克利和Deepmind前赴后继,只为教出一个会做家务的机器人?

    硅谷Live / 实地探访 / 热点探秘 / 深度探讨 本文转载自:脑极体(微信ID:unity007) 新年伊始,伯克利就传出新进展,他们教机器人做家务的能力更上一层楼了. 在最新的论文中,伯克利介 ...

  4. 想要教AI一个常识真的好难,幸运的是保罗·艾伦拿钱闯进来了

    作者|Chelsea Gohd     来源:Futurism     出品|遇见人工智能      公众号 GOwithAI >>>>昨日全平台阅读量:6万1000余次> ...

  5. 接手一个网站后应做什么

    摘自:http://lusongsong.com/reed/441.html 北京有个卖家具公司,有位经理对网络营销很感兴趣,于是开始招聘网络推广专员.一哥们,搞技术的,因爱好推广,面试了这家实体公司 ...

  6. 用一个二维码做下载地址,自动区分是 ios 还是 android

    用一个二维码做下载地址,自动区分是 ios 还是 android, 甚至区分 iphone  和 ipad. <html><head><meta http-equiv=& ...

  7. CEO 赠书 | 讲述创新背后不为人知的故事,改变世界的 Ta 们做对了什么?

    弱者群居,于是有了芸芸众生 强者求变,方才见证出类拔萃 相比勤奋,更重要的是深度思考的能力 它藏着你走过的路,读过的书 本期荐书 <创新者> 豆瓣评分:8.5 作者简介 沃尔特·艾萨克森毕 ...

  8. 有一个OEM制造商代理做HP笔记本电脑(Laptop),后来该制造商得到了更多的品牌笔记本电脑的订单Acer,Lenovo,Dell,该OEM商发现,如果一次同时做很多个牌子的本本,有些不利于管理。利

      有一个OEM制造商代理做HP笔记本电脑(Laptop),后来该制造商得到了更多的品牌笔记本电脑的订单Acer,Lenovo,Dell,该OEM商发现,如果一次同时做很多个牌子的本本,有些不利于管理 ...

  9. 一首歌一个故事 -- 忘记你我做不到

    一首歌一个故事 -- 忘记你我做不到 初中毕业之后,好朋友常亮去开远市读技工学校,那里娱乐资讯比较发达,在他的介绍下,认识并喜欢上了学友.从此一发不可收拾(省略对学友的赞美之辞5000)        ...

最新文章

  1. winform 外部组件发生异常
  2. Zynq的AMP开发注意事项之禁用L2 cache
  3. angularjs $watch
  4. Mahout kmeans聚类
  5. [原创]关于设置linux中vim 显示行号
  6. Android用按钮确定单选框,Android RadioButton单选框的使用方法
  7. Python3爬虫入门之beautifulsoup库的使用
  8. Nginx总复习---1
  9. ajax提交form返回数据格式,ajaxSubmit 返回值
  10. html 自动增加分页,HTML静态页面如何实现自动分页?
  11. 离线语音识别与语音转写初探
  12. 一个中高级PHP工程师所应该具备的能力
  13. ThreadAbortException问题
  14. iOS在UIButton中换行
  15. 乐视x820android最新版本,乐视MAX2|MIUI10|安卓8.1|最终完美版|极速_最新最全的乐Max2ROM刷机包下载、刷机教程_...
  16. 【47.40%】【BZOJ 1875】[SDOI2009]HH去散步
  17. C语言排序之冒泡法(起泡法)
  18. 大数据时代:大数据发展必备三个条件
  19. 腾讯云CentOS7 LAMP(linux的apache MariaDB php)yum方式部署
  20. Android 10 设置壁纸流程

热门文章

  1. java 8大数据类型
  2. node.js——麻将算法(六)简易版麻将出牌AI1.0
  3. [Android Traffic] 根据网络类型更改下载模式
  4. Alchemy环境的搭建
  5. 文件编程之Linux下系统调用
  6. 关于oracle spfile配置文件问题
  7. Javascript 中的长字符串拼接
  8. 云计算的认识和看法_【云计算】如何理解云计算才是正确的?
  9. 双柱状图柱子数量比较多_微生物组数据冲击图和柱状图一条代码解决
  10. .condarc文件是什么