「我要出轨了」!伯克利的这个AI,可以预测机器人何时将脱离
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
「脱离」 (disengagement),在自动驾驶系统中是一个重要的指标。
是指当自动驾驶汽车遇到故障,脱离自动驾驶模式,改为人类驾驶员接管车辆的情况。
很多人认为「脱离」次数越少,就能说明一个自动驾驶系统能力越强。因此,以往的研究都会把「脱离」当作是故障来排除掉。
但最近,UC伯克利的研究人员却「以毒攻毒」,直接用这样的数据来训练机器人,预测未来何时将发生脱离事件。
研究人员称它为LaND——从「脱离」中学会导航。
研究人员表示,通过这样的方法得到的结果,要比传统的强化学习、模仿学习都要强。
「开」着小车取数据
老规矩,先来看下训练数据。
既然伯克利的这项研究是想「以毒攻毒」,那么就必须收集出现故障时的那些数据。
于是,研究人员用一辆Clearpath Jackal机器人做测试。
先让这个机器人自己在路上「跑」,若是遇到如下三种情况则视为出故障,即开到人行道的两侧或撞到草丛等物体。
当出现故障的情况后,机器人就会进入「脱离」状态,人类研究员便用遥控器,把它重新置于有效位置,以便让它再次自主行进。
然后研究人员把在这些过程中,从机器人摄像头等传感器获取的图像等数据收集起来,作为训练数据。
投喂到神经网络做预测
拿到数据,就要开始训练了。
目的就是用这些数据,来预测机器人在未来是否会脱离。
具体的神经网络长这样。
神经网络先使用MobileNetV2,对输入的图像观测值进行处理,紧接着是一系列的全连接层。
这些图像层的输出,将作为递归神经网络LSTM的初始隐含状态(hidden state),依次处理机器人未来的每一个动作,并输出相应的预测脱离概率。
预测可视化的结果如下:
在众多可选路径中,颜色越深(红),则表明脱离的概率越高。
性能优于传统方法
最后,研究人员拿这种「以毒攻毒」的方法,与其它两种传统方法做对比,分别是模仿学习和强化学习。
在对比实验中,三种方法所采用的数据都是一致的,实验结果如表所示。
非常明显,当机器人在2.3公里长、从未走过的人行道中行进时,强化学习方法平均每2米就会脱离一次,模仿学习则是平均每13.4米就会脱离一次。
而伯克利提出的「以毒攻毒」方法,效果非常显著——平均每87.5米才会脱离一次。
作者介绍
这项研究的作者均来自UC伯克利。
△Gregory Kahn
论文一作叫Gregory Kahn,是UC伯克利EECS的一名博士生。主要研究目标是开发算法,使机器人能够在现实世界中操作。
△Pieter Abbeel
Pieter Abbeel是这项研究的另一位作者,目前在UC伯克利担任BAIR实验室的联合主任。
他的研究致力于建立更加智能的系统,其实验室推动了深度强化学习、深度模仿学习、深度非监督式学习、迁移学习、元学习、学会学习,以及研究人工智能对社会的影响。
参考链接:
https://venturebeat.com/2020/10/15/researchers-detail-land-ai-that-learns-from-autonomous-vehicle-disengagements/
论文地址:
https://arxiv.org/abs/2010.04689
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
「百度AI开发」系列课 免费报名
百度EasyDL不仅让企业「定制AI模型」像家用电器一般简单,并且还能像高级AI工程师一样专业。
10.21日起,3期公开课带你0门槛轻松上手EasyDL、实现AI模型训练与部署!扫码添加好友、加入课程直播群吧~ ▽
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !
「我要出轨了」!伯克利的这个AI,可以预测机器人何时将脱离相关推荐
- 百度「文心一言」阿里「通义千问」腾讯的AI将会叫什么呢
阿里于昨天2023.4.7下午上线通义千问,与ChatGPT类似,同样是基于语言模型训练的人工智能聊天平台.通义千问的核心功能分为四个大类:撰写短文.职场助理.电影脚本和写封邮件. 通义千问通义千问h ...
- 顶会竟然攀比起了拒稿率?教授发文怒斥「挑刺式审稿」
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:新智元 与大多数学科不同,在计算机科学领域,会议论文的分量 ...
- 如何设计 Web App 应用架构?「两分钟了解 IOING」
IOING 在做些什么? IOING 在你的代码和浏览器之间架设了一个中间解释层,该解释层提供了一套新的语法来填补浏览器所不具备的能力. SPA 开发痛点 开发一个 SPA 应用的痛点是不同模块页面的 ...
- 「动手学深度学习」在B站火到没谁,加这个免费实操平台,妥妥天花板!
论 AI 圈活菩萨,非李沐老师莫属. 前有编写「动手学深度学习」,成就圈内入门经典,后又在B站免费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量36万,不少课题组从导师到见习本科生都在追番. 如此 ...
- 倒计时1天!「2019 Python开发者日」报名即将关闭(附参会提醒)
「2019 Python开发者日」倒计时最后1天,仅剩少量余票,请扫码咨询 ↑↑↑ 相信很多人听过之前的 Python 进入小学课本.Python 进入浙江省高考等新闻,那么,有这么多头衔加持的 Py ...
- 生命的意义是什么?B站一位up主把这个「终极问题」甩给了AI
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 文末包邮送5本价值百元的高质量机器学习技术书籍 来源丨新智元 编辑丨 ...
- 在线试玩,在体感游戏中打败泰森,这位小哥破解了任天堂「拳无虚发」
视学算法报道 编辑:张倩.陈萍 加入体感控制,这位小哥破解了原版任天堂的拳击格斗游戏「拳无虚发」. 在经典红白机上玩拳击游戏是很多人的童年回忆,其中就包括任天堂 1987 年发布的拳击格斗游戏--「P ...
- PingCode入选36氪「WISE 2021新经济之王」年度硬核、新势力企业
近日,36氪在上海召开了"硬核时代"WISE2021新经济之王峰会.除大咖分享外,峰会还发布了『WISE 2021新经济之王』年度硬核企业.新势力企业榜单. 在本次榜单中 Ping ...
- 制定 OKR 时,怎样做到「少即是多」?
安迪·格鲁夫(Andrew S. Grove)在<高产出管理>中写到:「关注所有事和一件事都不关注,结果是相同的.」OKR 存在的部分意义即在于此--提醒我们关注最重要的,并保持聚焦. 对 ...
最新文章
- 【转载】基于AFNetWorking3.0的图片缓存分析
- 2012 人民搜索 实习生招聘 笔试题
- Git 在推送(Push)信息的时候提示git did not exit cleanly (exit code 1)的解决办法
- java sqlite 操作_Java SQLite 数据库操作
- ubuntu16.04 gcc降级到4.8
- Unable to locate Spring NamespaceHandler for XML schema namespace
- 宋宝华:火焰图:全局视野的Linux性能剖析
- springboot默认数据源如何设置连接数_Spring Boot学习:如何使用Druid数据源
- 用指纹解锁数据!云盒子企业网盘,新增指纹认证功能
- 计算机导论论文对课程的思考,计算机导论课浅析论文
- shiny-server部署
- 软件项目实施工作流程参考
- Springboot电子病历管理APP毕业设计源码010350
- java高校心理测评管理系统计算机毕业设计MyBatis+系统+LW文档+源码+调试部署
- 水星路由器DNS服务器未响应,用手机设置水星(mercury)路由器WiFi的步骤
- 为什么装完计算机系统后进不去,电脑系统装完后为啥进不去?
- 飞信消息通道服务器,和飞信_服务中心_中国移动通信
- [luogu1710]地铁涨价(bfs)
- 极光推送REST API与Java后台对接
- Linux 驱动USB键盘驱动入门demo