https://www.toutiao.com/a6690749591517659655/

2019-05-14 13:25:33

商业分析师、记者和普通公众的大多数观点,似乎是Waymo在自动驾驶方面遥遥领先,而特斯拉相差很远。但当你研究神经网络的基本原理时,这种观点是没有意义的。

原文载于Medium,作者:Trent Eady

训练数据,是决定深度神经网络性能的基本因素之一。 (另外两个是网络结构和优化算法。)

作为通用原则,更多的训练数据能带来更好的性能。这就是为什么,我相信特斯拉拥有世界上最有前途的无人驾驶汽车项目,而不是Waymo。

△可视化的特斯拉车队(图片由特斯拉提供)

特斯拉的车队中有大约50万辆,配备了特斯拉所说的全自动驾驶硬件。每天,特斯拉的车队行驶里程约为1500万英里,相当于Waymo车队有史以来的总体行驶里程。

每天1500万英里,一年就是54亿英里,比Waymo预计的一年总里程多200倍。而且,特斯拉的车队也在以每周大约5000辆的速度增长。

在以下三个关键领域,数据会产生影响:

  • 计算机视觉
  • 预测
  • 路径规划/驾驶策略

计算机视觉

计算机视觉中,一个重要的任务是目标检测(object detection)。有些东西,比如马,很少出现在路上。每当特斯拉遇到神经网络认为可能是一匹马(或者可能只是一个无法识别的阻碍道路的物体)的东西时 ,摄像头就会拍下照片,然后通过无线网络上传。

车辆每年行驶数十亿英里是有帮助的,因为你可以找到许多稀有物体的例子。显而易见的是,随着时间的推移,特斯拉在识别稀有物体方面,将比Waymo更出色。

对于普通物体来说,Waymo和特斯拉的瓶颈,很可能是花钱让人们手动给图片贴标签。捕捉更多的图像,要比付钱给人们贴标签容易。

但是对于稀有物体来说,Waymo的瓶颈可能在于首先要收集图像,而对于特斯拉来说,瓶颈可能仅仅是贴标签和开发软件,以便在合适的时间触发拍照功能。相比之下,特斯拉占据更有优势的地位。

在下面的这段视频中,特斯拉的人工智能总监安德烈·卡帕斯(Andrej Karpathy)解释了特斯拉是如何获取图像训练目标检测算法的:

视频地址:https://youtu.be/33K3id2xNAE

预测

预测,是提前几秒预测汽车、行人和骑自行车的人的动作和行为的能力。

Waymo顶尖工程师之一安东尼·莱万多夫斯基(Anthony Levandowski)最近写道,

“之所以没有人实现完全自动驾驶,是因为现在的软件还不足以预测未来。”

莱万多夫斯基声称,自动驾驶汽车的主要故障类别,是错误地预测了附近汽车和行人的行为。

特斯拉拥有大约50万辆汽车的车队,在这里是一个极好的资源。任何时候,特斯拉对汽车或行人做出错误的预测,特斯拉都可以保存数据快照,以备以后上传并添加到特斯拉的训练数据集中。

特斯拉或许能够上传由其计算机视觉神经网络生成的场景抽象表征(其中物体被视觉化为彩色编码的长方体形状,而像素级信息被丢弃) ,而不是上传视频。 这将从根本上降低上传这些数据的带宽和存储要求。

虽然用于训练目标检测的图像需要人工标记,而预测神经网络,可以仅仅通过事件的时间序列就可以学习过去和未来之间的相关性。什么行为先于什么行为,是任何记录(视频或抽象表征)所固有的。安德烈·卡帕斯在下面的视频片段中解释了这个过程:

视频地址:https://youtu.be/A44hbogdKwI

由于不需要人类给数据贴标签,特斯拉可以尽可能多地收集有用的数据来训练它的神经网络。

这意味着,它的训练数据集的大小将与它的总里程数相关联。

和目标检测一样,特斯拉相对于Waymo的优势,不仅仅在于预测常见行为的数据更多,还在于能够收集罕见情况下的罕见行为的数据,以便预测这些行为。

路径规划/驾驶策略

路径规划和驾驶策略,指的是汽车采取的行动:在限速时保持在车道的中心,变更车道,超车,在绿灯时左转,看到乱穿马路的人停车,等等。

制定一套包含汽车在任何情况下可能需要采取的每一个行动的规则,似乎极其困难。解决这个难题的方法之一就是让神经网络模仿人类的行为。这被称为模仿学习(imitation learning),有时也称为学徒学习(apprenticeship learning),或从示范中学习。

训练过程,类似于神经网络通过绘制过去和未来之间的相关性,来学习预测其他道路使用者的行为。

在模仿学习中,神经网络通过它所看到的(通过计算机视觉神经网络)和人类驾驶员所采取的行动之间的相关性,来学习预测人类驾驶员会做什么。

△特斯拉自动驾驶演示的静止画面

模仿学习,最近获得了迄今为止最大的成功:AlphaStar。DeepMind使用了数百万人玩的星际争霸游戏数据库中的样本,来训练神经网络,使其能够像人类一样玩游戏。

这个网络学习了游戏状态和人类玩家行为之间的相互关系,从而学会了预测人类在面对特定游戏状态时会做什么。

仅通过这种训练,AlphaStar就达到了DeepMind预估的能力水平,在星际争霸的竞争排名中处于中等水平。随后,AlphaStar通过强化学习得到了增强,提升到了职业玩家水平。(自动驾驶汽车可能有也可能没有类似的增强——这就是另一个话题了。)

特斯拉正在将模仿学习应用到驾驶任务中,比如如何处理高速公路立交桥上的陡峭弯道,或者如何在十字路口左转。听起来,特斯拉计划将模仿学习扩展到更多的任务上,比如如何以及何时在高速公路上变更车道。在下面的这个视频片段中,卡帕斯描述了特斯拉如何使用模仿学习:

视频链接:https://youtu.be/v5l-jPsAK7k

与预测一样,上传汽车周围场景的抽象表征就足够了,而不用上传视频。 这将意味着更低的带宽和存储要求。

与预测一样,一旦数据上传,就不需要人工标记。由于神经网络是预测人类司机在给定世界状态下会做什么,它所需要的只是世界状态和司机的行为。模仿学习,本质上是预测特斯拉司机的行为,而不是预测特斯拉司机周围其他道路使用者的行为。与 AlphaStar 一样,所有需要的信息都包含在所发生事情的回放中。

根据卡帕斯关于预测超车的评论,特斯拉可以在无法正确预测前方车辆是否会驶入特斯拉车道时,来触发汽车保存这一场景。

类似的,当涉及路径规划或驾驶策略的神经网络,不能正确预测特斯拉实际的行为时,特斯拉可以捕获可以回放的数据。

埃隆·马斯克(Elon Musk)过去曾提到过这种能力(或类似的能力),尽管目前还不清楚它是否在特斯拉汽车上运行。

相反,当特斯拉处于自动驾驶状态,或即将到来半自动驾驶模式时,这可能会带来丰富的数据,其中系统做错了一些事情,然后人类司机迅速演示如何正确地执行此操作。

其他可能会捕捉回放的情况是:突然刹车或转弯,自动紧急刹车,撞车或碰撞警告等等,以及更复杂的机器学习技术,被称为异常检测( anomaly detection)。

如果特斯拉已经知道它想要捕捉什么,比如在十字路口左转,它可以设置一个触发器,在视觉神经网络看到交通灯和左转信号灯被激活,或者方向盘向左转时捕捉回放。

结论

由于拥有大约50万辆汽车,特斯拉在三个关键领域优于Waymo (及其它竞争对手):

  • 计算机视觉
  • 预测路径规划 / 驾驶策略

关于收集正确的数据,付钱给人们贴标签,或者付钱购买带宽和存储并不能消除这些优势。通过设计好的触发器,使用不需要人工标记的数据,以及使用抽象表征(回放)代替原始视频,这些问题都得到了解决。

商业分析师、记者和普通公众的大多数观点,似乎是Waymo在自动驾驶方面遥遥领先,而特斯拉相差很远。但当你研究神经网络的基本原理时,这种观点是没有意义的。

更重要的是,AlphaStar是复杂任务大规模模仿学习概念的一个证明。如果你怀疑特斯拉的方法是否正确,或者路径规划/驾驶策略是一个易于处理的问题,你必须解释为什么模仿学习适用于星际争霸而不适用于驾驶。

我预测,除非Waymo采取激进的行动,以增加其车队的规模——在未来1-3年,认为Waymo遥遥领先,特斯拉是远远落后的观点,将被广泛摒弃。

人们一直过于关注那些没有告诉我们系统稳定性的演示,非常有限的脱离指标,以及Google/Waymo与顶级机器学习工程师和研究人员的接触。

他们对训练数据的关注太少,特别是在Waymo没有足够的数据来做好识别稀有物体和行为方面。

△特斯拉的驾驶模拟(图片由特斯拉提供)

模拟不是Waymo的优势,因为特斯拉(像所有自动驾驶公司一样)也使用模拟。更重要的是,模拟不能生成罕见的对象和行为,而这些对象和行为,是模拟的创造者无法预料或不知道如何精确建模的。

纯粹的强化学习,并不适用于AlphaStar,因为星际争霸的行动空间太大,不适合随机探索,无法找到好的策略。

所以DeepMind必须通过模仿学习来引导学习。这显示了一个假设的弱点,就像 AlphaGo Zero 一样,纯粹的模拟体验可以解决任何问题。

特别是遇到像开车这样的问题时,预测人类的行为是一个关键组成部分。预测人类行为需要关于现实世界的经验信息。

自动驾驶汽车领域的观察者,可能低估了特斯拉吸引顶尖机器学习人才的能力。一项针对技术人员的调查发现,特斯拉是旧金山湾区第二受欢迎的公司,仅次于Google。

调查还发现,特斯拉在全球最受欢迎公司中排名第四,仅次于排名第二的Google。 (Shopify 在全球排名第三,SpaceX 排名第一。)

值得注意的是,机器学习的基本进步通常是由学术界、 OpenAI 以及 Google、 Facebook 和 DeepMind的企业实验室公开分享的。

特斯拉能做什么和Waymo能做什么之间的差别可能没那么大。

两家公司最大的区别在于数据。随着特斯拉的车队增长到100万辆汽车,它每月的行驶里程将达到10亿英里,是Waymo每月100万英里行驶里程的1000倍。

这1000倍的差异,对特斯拉来说意味着对稀有物体的检测更精确,对罕见行为的预测更准确,以及在面对罕见情况时,能够更好地制定路径规划/驾驶策略。

自动驾驶的挑战更多的是处理0.001%包含罕见边缘情况的里程,而不是99.99%不引人注目的里程。

因此,能从这0.001% 的里程数中收集大量训练数据的公司,比那些不能的公司做得更好,是合情合理的。

为什么说特斯拉在自动驾驶上比Waymo更占优势相关推荐

  1. 为什么说特斯拉研发自动驾驶AI芯片应该引起注意?

    来源:36Kr 概要:对于特斯拉而言,研发这款芯片+配套算法本质上还是对率先将自动驾驶汽车商业化节点的争夺. 特斯拉Model 3的量产问题仍未彻底解决,CEO Elon Musk又抛出了自研自动驾驶 ...

  2. 特斯拉完全自动驾驶可能再次涨价 涨至1.4万美元

    5月26日消息,据国外媒体报道,虽然特斯拉的Autopilot自动辅助驾驶功能导致了多起车祸,在未完全实现自动驾驶的情况下,加州机动车辆管理局也在对特斯拉宣称的完全自动驾驶是否存在误导宣传进行调查,但 ...

  3. 特斯拉新·自动驾驶系统就绪,马斯克拿SEC开怼抢热度

    李根 夏乙 发自 凹非寺  量子位 报道 | 公众号 QbitAI 终于啊终于,跳票数个月后,特斯拉软件系统V9,现在来了. 北京时间10月6日,特斯拉官方通告:北美地区的特斯拉车主,将率先完成更新推 ...

  4. 马斯克:7月份特斯拉完全自动驾驶选项涨价1000美元

    据国外媒体报道,当地时间周一特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,特斯拉电动汽车的"完全自动驾驶"选项价格将在7月1日上涨1000美元.目前"完全自动驾 ...

  5. 车萝卜CEO马斌斌:真正自动驾驶的时候你更需要HUD和ARHUD...

    目前所有的车内人机交互方案都还是以传统中控屏为核心交互界面,但这其实有很多的安全隐患. 12月21日,"2018硬科技行业领域峰会暨镁客网年会"在杭州香格里拉如期举行. 本次峰会汇 ...

  6. 特斯拉市值站上万亿元大关,BBA如何在“自动驾驶”上做空它?

    来源 | 新智驾 文 | 利荣,责编 | Carol 出品 | CSDN(ID:CSDNnews) 火火火火火. 特斯拉的市值一路狂飙.2月4日,在最新一轮暴涨后,马斯克都忍不住推出"大火& ...

  7. 特斯拉全新自动驾驶芯片最强?英伟达回怼,投资者用脚投票

    整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 马斯克前脚刚说完自家发布的自动驾驶计算机是全球最强,后脚就被英伟达怼了. 在刚刚结束的自动驾驶投资者日上,特斯拉发布了全自动驾驶( ...

  8. 特斯拉打响自动驾驶芯片反击战!

    继赛灵思拉上深鉴科技也要做针对自动驾驶领域的芯片后,最近,来自特斯拉的马老板按耐不住了,也要为自家的自动驾驶汽车造定制化芯片了. 特斯拉CEO埃隆•马斯克(Elon Musk)在第二季度财报电话会议上 ...

  9. 马斯克说,特斯拉最新自动驾驶芯片性能是英伟达的7倍​

    https://www.toutiao.com/a6683638469115249160/ 在近日举行的特斯拉自动驾驶开放日上,马斯克称特斯拉造出了全世界最先进的自动驾驶计算机. 这一计算机名为 Au ...

最新文章

  1. Nature news: 未来40年,DNA测序将走向何方?
  2. 卡片游戏 数学期望
  3. 如何写一个bootloader
  4. 密码学专题 OpenSSL标准转换指令
  5. 肖仰华 | 领域知识图谱落地实践中的问题与对策
  6. 新浪安装weiphp2.0的方法
  7. python字符宽度_Python计算字符宽度的方法
  8. C语言mutex使用案例,C语言 如何使用互斥锁严格交替使用两个线程?
  9. 力扣 距离顺序排列矩阵单元格
  10. CoreData 增删改查
  11. ActiveX 技术疑点 一
  12. 安卓ViewFlipper跑马灯效果
  13. 最简单的python爬虫案例,适合入门学习
  14. 成都拓嘉辰丰:拼多多商家是否可以代销
  15. 小程序之校园交流平台
  16. linux上怎么实现ssh免密登录
  17. Android - 接收、监听系统短信广播
  18. arm搭建云手机教程_全球首个ARM云手机解决方案 基于ARM架构华为云云手机开启公测...
  19. 代换密码详解+CTF事例
  20. 996 是付得起首付,却是还不了的贷

热门文章

  1. randomAccessFile
  2. 阿里云nginx配置ssl证书
  3. Hinton最新演讲透露下一代神经网络模型的构想 | SIGIR 2020
  4. 想找到女朋友,你得掌握这些算法
  5. 《深入浅出Ext JS(第2版)》获专家好评
  6. python基于dlib的face landmarks
  7. 独家 | 使EfficientNet更有效率的三种方法(附链接)
  8. 独家|OpenCV1.9 如何利用OpenCV的parallel_for_并行化代码(附代码)
  9. 独家 | 手把手教你用Python的Prophet库进行时间序列预测
  10. 大合集!80 篇 CVPR2020 论文分方向整理: 目标检测/图像分割/姿态估计等(附链接&下载)...