来源:亿欧

概要:然而,如果请一个机器人来抓取同样的东西,你只会看到一个发呆的机器人或得到一团皱巴巴的东西抓在机器人手里。

帮我个忙,抓住你周围的一件东西。随便你怎么做,即使你以前从来没有做过这种事情,但是你的大脑会告诉你应该如何去做,比如说怎样抓取物体,要用多大的力量。这是人类与生俱来的动手能力。

然而,如果请一个机器人来抓取同样的东西,你只会看到一个发呆的机器人或得到一团皱巴巴的东西抓在机器人手里。这是因为机器人通常擅长需要很多力量的重复性工作,它们在面对陌生事物时做得还不够好。然而一家名为“Embodied Intelligence”的公司却能将机器人和人们的优势融合到一个新的系统中,使得普通人可以简便地教授机器人新任务。你可以把它想象成一个虚拟现实游戏,而只有你能操控那些巨大的机器人。

如果你想教机器人如何拿起扳手,你可以用如下几种方法。你可以把它所需要的动作进行编程——这个过程会非常沉闷冗长。

强化学习是一项更为复杂的新技术。加州大学伯克利分校实验室有一个名叫布雷特(Brett)的机器人,它可以进行自我强化学习,不断地尝试把方块放在方孔里。如果它的移动能让方块更靠近方孔,那么它就会得到奖励。一次次地尝试之后,机器人就会离其目标越来越近,直到最终成功完成此次任务。这生动地展现了一个机器人是如何在10分钟内自行掌握一个儿童游戏的。

相比之下,以往让机器人活动的编程耗时巨大。因为机器毕竟要受现实束缚,在有限的时间内只能进行一定量的训练尝试(而在模拟训练中强化学习速度要快得多,因为虚拟试验能更快地进行)。

其中一位操作员演示了机器人是如何把一个方块放在对应的方孔里的,这就是让机器人行为更为精细的技术——模仿学习。机器人的手臂像游戏操纵杆一样灵活,但可惜的是这种机器人无法教导自己进行新任务。

Embodied Intelligence公司所构想的是一个综合模仿学习和强化学习的混合系统。人类可以使用VR(虚拟现实)耳机和控制器,来遥控机器人执行某项任务。这在操作员和机器人之间创建了一个更加自然的动力学连接,即机器学习算法。这种算法可以把人类的行为匹配到机器人的运动控制之中。强化学习就这样开始了,机器人可以反复试验来不断改进自己的动作,直到它的工作能做的比人类教的更好为止。

Embodied Intelligence公司的联合创始人兼总裁彼得·阿贝勒表示,“通常情况下,人们希望自己的机器人是超人,做得要比人类训练师更好。人们还希望机器人在掌握了一项技能之后,可以自己进行反复训练,来让这项技能变得更快,更准确,更可靠,而不再需要人类对它进行持续训练。毕竟理论上讲,很多事人类是无法做得比机器人更快的。”

畅想一下未来的工厂是什么样子的。程序员不需要对在流水线上的机器人进行编码,而是在虚拟现实中训练机器人。也许机器人在一开始会表现不佳,但随着时间的推移,机器人会做得越来越好。而且随着研究人员构建出更好的学习算法,机器人还可能会承担起一项人类教授的特定任务,它还可以自己教自己完成不同的事情。

但是,目前这个系统还处于初期发展阶段。目前它正在研究PR2机器人,这是一种相对较慢且笨拙的机器人。现在的任何机器人都远不如人灵巧,所以即使这个东西擅长复制模仿操作者的动作,却也不能复制出精细的抓握。但是,如果Embodied Intelligence公司真的开发出这种系统出来,那么制造商很快就可以运用上,让工业用机器人向工人学习,之后工业机器人可以自行强化掌握的种种技能。

设想一下,我们让所有的机器人都搭载上这种系统。如果你有100台机器人在网络中交流,并且其中一个学到了一些特别有用的东西,那么它就可以把这些知识共享给其余99个机器人。这就是一种强大的蜂巢思想,一个人会则人人皆会。机器人甚至不必具有相同的规格,因为研究人员已经想出了信息在不同类型的机器之间转换的方法。

从近期来看,这不仅能使机器人变得更加智能,而且使他们更容易从人类身上学习新知识。虽然在实验室里编程布雷特(Brett)需要花费博士的很多时间,但Embodied Intelligence(公司的联合创始人兼首席执行官陈皮特表示,“如果使用了新系统,那么任何能够使用VR耳机的人都能够快速地教授机器人新技能。这将改变目前机器人远不及软件技术的现状,让机器人技术腾飞。”

那么,这是否会使机器人更容易取代工作人员?是的。但是机器人会接管那些繁琐重复又劳累的工作,解放掉这些工人,让他们去从事需要敏锐触觉以及创造力的工作。如果我们希望这种富有成效的关系成为现实,那么我们就需要机器人具备快速学习能力,让机器人成为人类的帮手。

新技术:如何用VR训练机器人?相关推荐

  1. 马斯克翻跟头机器人_马斯克又搞事情 用VR训练机器人模仿人类动作

    据该公司的开发者介绍:"我们已经研发了一款新算法--单次模仿学法算法." 人们先在VR中完成一次操作,随后机器人通过观看视频来模仿人类的行为.为了证明该算法,设计者进行了堆叠彩色方 ...

  2. Elon Musk的OpenAI用VR训练机器人:解锁更多复杂动作!

    ​ (52VR开发网2017年5月23日讯)又一个与Elon Musk有关的吸引人的项目! 但是,这次我们不是在谈论SpaceX或Hyper Tube,而是在说使用VR来教机器人做任务! ​    ​ ...

  3. 华盛顿大学对抗疾病的新型秘密武器:训练机器人从人类干细胞中培育微型器官

    内容来源:ATYUN AI平台 科学家们使用液体处理机器人从干细胞中培养出迷你肾脏 机器人能够在21天内培养类器官,并分析完成品 研究人员说,在完成这项任务时,机器人比人类更有效率 研究人员表示,机器 ...

  4. matlab如何求变换矩阵,如何用Matlab实现机器人的变换矩阵

    如何用Matlab实现机器人的变换矩阵 如何用Matlab实现机器人的变换矩阵 前言 其中有些思路参考了这篇博客,有兴趣的同学可以看一下博客参考(关于位姿变换矩阵) 刚开始学工业机器人的时候,大家都先 ...

  5. 一种模仿学习方法来训练机器人,而无需进行实际的人类演示

    背景 大多数人可以通过观察他人仅执行一次任务来学习如何完成给定任务.但是,被编程为通过模仿人类学习的机器人通常需要在一系列人类演示中进行训练,然后才能有效地复制所需的行为. 研究人员最近能够使用元学习 ...

  6. ML-Agents与训练达不到目的AI的斗争史-如何用unity训练一个类吸血鬼幸存者自动躲避AI(探讨,暂时非成功经验)1.0

    问题:如何用unity训练一个类吸血鬼幸存者自动躲避AI. 我的想法: 应该抓住问题的根源解决:类吸血鬼幸存者游戏的躲避的目的是使血量维持一个健康值,所以我的逻辑是对训练的AI所有奖励(AddRewa ...

  7. 如何用TensorFlow训练聊天机器人(附github)

    前言 实际工程中很少有直接用深度学习实现端对端的聊天机器人,但这里我们来看看怎么用深度学习的seq2seq模型来实现一个简易的聊天机器人.这篇文章将尝试使用TensorFlow来训练一个基于seq2s ...

  8. Kindred AI要让人戴VR眼镜训练机器人 使其变聪明

    人工智能系统正在变得越来越聪明,它们不仅能下围棋.炒股票,现在还学会了写代码.由微软和剑桥大学研究员一同开发的人工智能系统DeepCoder,完成了人类编程挑战赛所设定的基本挑战. DeepCoder ...

  9. 实践教程|如何用YOLOX训练自己的数据集?

    作者 | JuLec@知乎(已授权) 来源 | https://zhuanlan.zhihu.com/p/402210371 编辑 | 极市平台 导读 Yolo系列因为其灵活性,一直是目标检测热门算法 ...

最新文章

  1. KDD 2021 | 一种使用真负样本的在线延迟反馈建模
  2. 将继续深入学习网络编程
  3. JDK源码解析之 Java.lang.Object
  4. oracle 修改2个表,oracle学习笔记2:创建修改表
  5. java sql xml_Java ResultSet.getSQLXML方法代码示例
  6. 怎么重置unity界面_请问itween如何重置?
  7. (8)Xwork容器概览
  8. Arcgis Javascript那些事儿(十一)--网络分析服务使用
  9. 微信公众号支付JSAPI
  10. Sass基础学习(一)
  11. int为什么是-32768到32767
  12. APS Interview - Principles of Computer Organization
  13. 家用无线路由器哪个品牌好?程序员分享值得推荐的无线路由器
  14. 计算机综合布线考试试题A,综合布线试题A
  15. LaMDA 是有感觉的吗?
  16. 学习云计算与大数据就业前景好吗?
  17. Arduino LCD1602电子时钟
  18. 新冠疫情可视化(7月11日,7月12日)
  19. sklearn中的决策树(回归)
  20. 日麻十七步:关于如何从34张牌中取13张牌组成最大番数听牌

热门文章

  1. 远程实习 | 达特茅斯学院招收网络嵌入和图挖掘方向研究型实习生
  2. AI还原宋明清三朝皇帝,还找到了最匹配的明星脸,网友:四大美女安排上
  3. SAP QM执行事务代码QE23为检验批录入结果,报错-No selected set exists for the inspection point 200 or plant NMDC-
  4. SAP RETAIL 事务代码MP38可以为多个物料执行预测
  5. 专访张宏江:撑开深度学习瓶颈,中国也有做出国际顶尖研究的环境
  6. CSV合规的矫枉过正
  7. FAIR发布两大更新:PyTorch1.8和一个10亿参数自监督模型,自监督也学GPT-3套路?
  8. 智能制造业乘风破浪,工业机器人怎样勇立潮头?
  9. SAP S4HANA BP事务代码初始界面的ROLE和Grouping配置
  10. 脸书开源第一个使用卷积神经网络技术的端到端语音识别系统