金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

「脱离」 (disengagement),在自动驾驶系统中是一个重要的指标。

是指当自动驾驶汽车遇到故障,脱离自动驾驶模式,改为人类驾驶员接管车辆的情况。

很多人认为「脱离」次数越少,就能说明一个自动驾驶系统能力越强。因此,以往的研究都会把「脱离」当作是故障来排除掉。

但最近,UC伯克利的研究人员却「以毒攻毒」,直接用这样的数据来训练机器人,预测未来何时将发生脱离事件

研究人员称它为LaND——从「脱离」中学会导航。

研究人员表示,通过这样的方法得到的结果,要比传统的强化学习、模仿学习都要强。

「开」着小车取数据

老规矩,先来看下训练数据。

既然伯克利的这项研究是想「以毒攻毒」,那么就必须收集出现故障时的那些数据。

于是,研究人员用一辆Clearpath Jackal机器人做测试。

先让这个机器人自己在路上「跑」,若是遇到如下三种情况则视为出故障,即开到人行道的两侧或撞到草丛等物体。

当出现故障的情况后,机器人就会进入「脱离」状态,人类研究员便用遥控器,把它重新置于有效位置,以便让它再次自主行进。

然后研究人员把在这些过程中,从机器人摄像头等传感器获取的图像等数据收集起来,作为训练数据。

投喂到神经网络做预测

拿到数据,就要开始训练了。

目的就是用这些数据,来预测机器人在未来是否会脱离

具体的神经网络长这样。

神经网络先使用MobileNetV2,对输入的图像观测值进行处理,紧接着是一系列的全连接层

这些图像层的输出,将作为递归神经网络LSTM的初始隐含状态(hidden state),依次处理机器人未来的每一个动作,并输出相应的预测脱离概率。

预测可视化的结果如下:

在众多可选路径中,颜色越深(红),则表明脱离的概率越高。

性能优于传统方法

最后,研究人员拿这种「以毒攻毒」的方法,与其它两种传统方法做对比,分别是模仿学习强化学习

在对比实验中,三种方法所采用的数据都是一致的,实验结果如表所示。

非常明显,当机器人在2.3公里长、从未走过的人行道中行进时,强化学习方法平均每2米就会脱离一次,模仿学习则是平均每13.4米就会脱离一次。

而伯克利提出的「以毒攻毒」方法,效果非常显著——平均每87.5米才会脱离一次。

作者介绍

这项研究的作者均来自UC伯克利。

Gregory Kahn

论文一作叫Gregory Kahn,是UC伯克利EECS的一名博士生。主要研究目标是开发算法,使机器人能够在现实世界中操作。

Pieter Abbeel

Pieter Abbeel是这项研究的另一位作者,目前在UC伯克利担任BAIR实验室的联合主任。

他的研究致力于建立更加智能的系统,其实验室推动了深度强化学习、深度模仿学习、深度非监督式学习、迁移学习、元学习、学会学习,以及研究人工智能对社会的影响。

参考链接:

https://venturebeat.com/2020/10/15/researchers-detail-land-ai-that-learns-from-autonomous-vehicle-disengagements/

论文地址:

https://arxiv.org/abs/2010.04689

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

「百度AI开发」系列课 免费报名

百度EasyDL不仅让企业「定制AI模型」像家用电器一般简单,并且还能像高级AI工程师一样专业。

10.21日起,3期公开课带你0门槛轻松上手EasyDL、实现AI模型训练与部署!扫码添加好友、加入课程直播群吧~ 

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

「我要出轨了」!伯克利的这个AI,可以预测机器人何时将脱离相关推荐

  1. 百度「文心一言」阿里「通义千问」腾讯的AI将会叫什么呢

    阿里于昨天2023.4.7下午上线通义千问,与ChatGPT类似,同样是基于语言模型训练的人工智能聊天平台.通义千问的核心功能分为四个大类:撰写短文.职场助理.电影脚本和写封邮件. 通义千问通义千问h ...

  2. 顶会竟然攀比起了拒稿率?教授发文怒斥「挑刺式审稿」

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:新智元 与大多数学科不同,在计算机科学领域,会议论文的分量 ...

  3. 如何设计 Web App 应用架构?「两分钟了解 IOING」

    IOING 在做些什么? IOING 在你的代码和浏览器之间架设了一个中间解释层,该解释层提供了一套新的语法来填补浏览器所不具备的能力. SPA 开发痛点 开发一个 SPA 应用的痛点是不同模块页面的 ...

  4. 「动手学深度学习」在B站火到没谁,加这个免费实操平台,妥妥天花板!

    论 AI 圈活菩萨,非李沐老师莫属. 前有编写「动手学深度学习」,成就圈内入门经典,后又在B站免费讲斯坦福 AI 课,一则艰深硬核讲论文的视频播放量36万,不少课题组从导师到见习本科生都在追番. 如此 ...

  5. 倒计时1天!「2019 Python开发者日」报名即将关闭(附参会提醒)

    「2019 Python开发者日」倒计时最后1天,仅剩少量余票,请扫码咨询 ↑↑↑ 相信很多人听过之前的 Python 进入小学课本.Python 进入浙江省高考等新闻,那么,有这么多头衔加持的 Py ...

  6. 生命的意义是什么?B站一位up主把这个「终极问题」甩给了AI

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 文末包邮送5本价值百元的高质量机器学习技术书籍 来源丨新智元 编辑丨 ...

  7. 在线试玩,在体感游戏中打败泰森,这位小哥破解了任天堂「拳无虚发」

    视学算法报道 编辑:张倩.陈萍 加入体感控制,这位小哥破解了原版任天堂的拳击格斗游戏「拳无虚发」. 在经典红白机上玩拳击游戏是很多人的童年回忆,其中就包括任天堂 1987 年发布的拳击格斗游戏--「P ...

  8. PingCode入选36氪「WISE 2021新经济之王」年度硬核、新势力企业

    近日,36氪在上海召开了"硬核时代"WISE2021新经济之王峰会.除大咖分享外,峰会还发布了『WISE 2021新经济之王』年度硬核企业.新势力企业榜单. 在本次榜单中 Ping ...

  9. 制定 OKR 时,怎样做到「少即是多」?

    安迪·格鲁夫(Andrew S. Grove)在<高产出管理>中写到:「关注所有事和一件事都不关注,结果是相同的.」OKR 存在的部分意义即在于此--提醒我们关注最重要的,并保持聚焦. 对 ...

最新文章

  1. 【转载】基于AFNetWorking3.0的图片缓存分析
  2. 2012 人民搜索 实习生招聘 笔试题
  3. Git 在推送(Push)信息的时候提示git did not exit cleanly (exit code 1)的解决办法
  4. java sqlite 操作_Java SQLite 数据库操作
  5. ubuntu16.04 gcc降级到4.8
  6. Unable to locate Spring NamespaceHandler for XML schema namespace
  7. 宋宝华:火焰图:全局视野的Linux性能剖析
  8. springboot默认数据源如何设置连接数_Spring Boot学习:如何使用Druid数据源
  9. 用指纹解锁数据!云盒子企业网盘,新增指纹认证功能
  10. 计算机导论论文对课程的思考,计算机导论课浅析论文
  11. shiny-server部署
  12. 软件项目实施工作流程参考
  13. Springboot电子病历管理APP毕业设计源码010350
  14. java高校心理测评管理系统计算机毕业设计MyBatis+系统+LW文档+源码+调试部署
  15. 水星路由器DNS服务器未响应,用手机设置水星(mercury)路由器WiFi的步骤
  16. 为什么装完计算机系统后进不去,电脑系统装完后为啥进不去?
  17. 飞信消息通道服务器,和飞信_服务中心_中国移动通信
  18. [luogu1710]地铁涨价(bfs)
  19. 极光推送REST API与Java后台对接
  20. Linux 驱动USB键盘驱动入门demo

热门文章

  1. 当postgres的主键序列不同步时,如何重置?
  2. 2.7 usb摄像头之usb摄像头描述符打印
  3. 区块链今年,胜过过去十年
  4. Java数据结构与算法之排序
  5. 通俗易懂----尾递归
  6. lnmp.org + phpstorm + xdebug
  7. ​浅谈Asp.net的sessionState
  8. “超级课程表”余佳文:初生牛犊不怕虎
  9. 黄聪:VS2010开发T4模版引擎之基础入门
  10. 浅谈Oracle Online redo log