这张来自伪激光雷达论文的图片显示了旧的黄色实点云

作者 |  Brad Templeton

译者 | 天道酬勤,责编 | Carol

特斯拉 CEO 埃隆·马斯克(Elon Musk)对自动驾驶激光雷达(3D图像技术)的看法是众所周知的。他不打算在特斯拉里使用这个技术。TSLA(https://www.forbes.com/companies/tesla/#6aa1b19848d4)这是一个有争议的观点,只有历史才能证明他们在这场赌局中做的好不好。

特斯拉推广的一种方法有时称为伪或虚拟激光雷达。这涉及到构建工具来拍摄摄像机图像(立体或常规),并计算出图像中每个像素的距离。激光雷达实际上是通过计时光脉冲击到达像素并以光速返回所需的时间来计算出到每个像素的距离。另一方面,人类利用我们的大脑来估计距离。 我们知道物体有多大,它们如何运动,这让我们知道它们离我们有多远。我们还使用其他一些技巧,例如由于两只眼睛而产生的立体视觉,但只能适用于中等距离。另一个好技巧是“运动视差”,你可以跟踪事物在背景和其他事物下的运动方式,这会给你提供其他线索。

这是好事,人类的大脑可以胜任这项任务——事实上,你可以在开车的时候闭上一只眼睛来完成这项任务。人们正尝试利用神经网络来建立机器学习技术,来计算出与图像的距离。这是一个虚拟激光雷达。

训练虚拟激光雷达比训练许多神经网络要容易得多。正常情况下,训练需要你提供许多训练图像,而人类要努力计算出真实的距离。由于测试车上可能装有真正昂贵的激光雷达,因此你可以四处行驶来获得与从激光雷达中学到的“地面真实”距离数据相结合的训练数据。你向神经网络展示大量由激光雷达计算出真实距离的图像,并且它擅长于自行计算距离。这种技术是无监督学习的一种变体,因为你不需要人工标记,它比有监督学习便宜得多,因此,如果神经网络有什么东西可以做得很好,那就应该是这个。你还可以训练模拟器数据来改善模型。

另一种有用的训练技术是,根据现实世界中的物体以可预测的方式改变距离这一事实。当你看到一个物体沿着物理学允许的路径移动时,你的估计很可能是正确的。如果你看到物体以不可能的方式在太空中跳跃,你就会知道它们是错误的。

他们做得很好。神经网络的一个问题是它们倾向于观察单帧图像,而不是像人类那样看运动图像。实际上,人类在静止图像上会犯很多错误。随着时间的流逝,机器学习技术可能会超越这一点。问题是我们必须“拿你的生命做赌注”。你还需要对从未见过的事物进行处理,这可能会挑战神经网络。

例如,在前方道路的车道上停下了一些不寻常的东西。你需要知道它有多远,并且需要非常可靠地很快找到它。如果是一辆汽车,你会知道车有多大,所以你知道它有多远。同理,一辆汽车在侧身旋转(对于人类而言),但是训练数据库可能从未见过这种情况。对于一个随机物体,你想知道,它是一个远处的大物体还是一个附近的小物体?唯一的方法就是看它与道路几何形状的关系,这是更复杂的。

如果有人做到这一点,他们将拥有一种工具,可以拍摄相机图像,并产生激光雷达产生的3D“点云”,而且由于相机价格更便宜,因此可以以更低的成本进行生产。他们也可能在很长的距离内做到这一点。许多激光雷达只能看到约120m, 花式的看240m。众所周知,人类会理解他们在一英里以外看到的东西。

具有讽刺意味的是, 致力于激光雷达的开发人员已经建立了依赖于这些点云的系统,并花费了大量时间对其进行完善。如果一个伪LIDAR系统突然变得可用于产生质量点云,则他们可以立即使用它。那些一直希望使用伪激光雷达的人,在使用这种形式的数据方面不会有相同的经验。相反,他们将计划将其视觉系统的其他元素(将图像分割为不同的对象,并对它们进行分类)与距离估计结合在一起。他们可能没有能力利用他们一直希望的突破。

另一方面,使用公司的激光雷达只会说“太好了,我们可以用便宜的东西代替昂贵的激光雷达。” 如果他们也是制造激光雷达的公司(例如福特、克鲁斯、Waymo和Aurora),他们可能会觉得自己浪费了一些钱。

很明显,你需要知道道路上所有物体的距离,必须正确计算出距离,并且你必须快速完成计算。我们已经看到特斯拉自动驾驶仪多次撞向卡车、防撞栏和前方车道上被一辆突然驶离的汽车挡住的车辆。当道路上的障碍物突然出现在你的传感器上时,你要知道该障碍物离你有多远,这样你才可以启动紧急制动。激光雷达几乎总是这样做,但计算机视觉却不是。伪激光雷达是解决该问题的一项努力——但目前,大多数其他公司计划使用激光雷达来解决这个问题,他们知道这种方法是行得通的,但他们期希望看到这种方法会变得便宜。

当然,如果特斯拉是内部解决这个问题的公司,它就不会与其他公司分享(尽管示演示活动可能会促使其他公司做同样的事情)。感知团队也可能会尝试开发一种可以来匹配距离估计和分类,而不是生成激光雷达样式的点云。这不是伪激光雷达,但如果普遍准确的话,也同样有用。

原文链接:https://www.forbes.com/sites/bradtempleton/2020/04/14/if-teslas-dream-of-making-cameras-perform-as-well-as-lidar-comes-true-it-may-help-teslas-competitors-more/?ss=ai#1b9ad0f858e8

本文为 AI 科技大本营翻译,转载请注明出处

推荐阅读

  • 一键实现图像、视频卡通化,GAN又进化了

  • PyTorch 1.6、TensorFlow 2.3、Pandas 1.1同日发布!都有哪些新特性?

  • Python 还能实现图片去雾?FFA 去雾算法、暗通道去雾算法用起来! | 附代码

  • 程序员必备基础:Git 命令全方位学习

  • 微软直播马上开始,近百岗位等你来,快戳进直播间

如果特斯拉制造相机的梦想像激光雷达一样真正实现,它可能会帮助到更多同行...相关推荐

  1. 特斯拉又撞“人”了 汽车激光雷达“盛宴”开启

    随着越来越多的新车将搭载激光雷达提供更安全.更高级别的智能驾驶系统,依靠纯视觉感知的特斯拉正在被行业"孤立". "所有的传感器都有优缺点,"行业人士认为,但监管 ...

  2. 特斯拉改版Model3更便宜/ 贾跃亭又被申请限消/ GPT-3更新…今日更多新鲜事在此...

    日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大家好,今天是11月29日星期二. 科技圈都发生了哪些大事?来和日报君一起康康- 特斯拉重新设计Model 3 特斯拉的Model 3要升级了, ...

  3. 图森计划裁员25%/ 特斯拉被曝将冻结招聘/ 天才黑客Geohot从推特辞职…今日更多新鲜事在此...

    日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大家好,今天是12月22日星期四,距离周末还有两天,距离圣诞还有三天. 今天科技圈都有哪些大事发生,快来和日报君一起康康- 图森计划裁员25% ...

  4. 有了这份程序员面试指南,你离大厂 Offer 还远吗?| 附推荐书籍

    作者 | 码农唐磊 来源 | 程序猿石头 在这篇文章<面试 Google, 我失败了 | Google 面经分享>中,石头分享了 Google 中国的面试流程和体验,并分享了 HR 小姐姐 ...

  5. 科技股疯狂造富的背后,“泡沫”离我们到底有多远?

    作者 | 硬核云顶宫 责编 | 王晓曼 出品 | 程序人生(ID:coder_life) 2019年英特尔发布财报后,其股价一度暴跌逾8%.当时有分析师预测,英特尔虽然在2018年表现不佳,但以边缘计 ...

  6. 万字综述|自动驾驶多传感器融合感知

    原文地址:万字综述 | 自动驾驶多传感器融合感知 翻译:种争青 校稿:董亚微 00 摘要 多模态融合是自动驾驶系统感知的一个基本任务,最近引起了许多研究者的兴趣.然而,由于原始数据的噪声.信息的未充分 ...

  7. 怎么通过media foundation将图像数据写入虚拟摄像头_千倍成本压缩!特斯拉开发虚拟激光雷达,替代最贵自动驾驶传感器...

    「谁用激光雷达,谁完蛋!」 在去年特斯拉举办的 Autonomy Day 上,特斯拉 CEO Elon Musk 言辞激烈地炮轰激光雷达. 「昂贵的传感器是不必要的,这就像是一大堆昂贵的附属品.」 「 ...

  8. 特斯拉全自动驾驶硬件发布!马斯克明年推RoboTaxi:傻瓜才用激光雷达

    李根 乾明 发自 纽凹非寺  量子位 报道 | 公众号 QbitAI 想得远,做得大,diss一切,他行他上. 这就是伊隆·马斯克在刚刚结束的特斯拉自动驾驶开放日上的表现. 马斯克和软硬件高管们一起, ...

  9. ubuntu18.04 使用calibration_camera_lidar 实现激光雷达和相机联合标定

    Autoware1.10以上的软件都需要单独安装这个calibration标定工具箱 1.nlopt安装 新开一个终端: git clone git://github.com/stevengj/nlo ...

最新文章

  1. nginx添加stream模块1.20
  2. [Share]Web Directions Conferences
  3. 网络编程-计算机网络
  4. 【Win32汇编】测试Irvine32库
  5. Lambda表达式的使用
  6. Android 系统使用USB OTG功能/打开USB Host API功能
  7. linux和windows和鸿蒙,linux很好,但为何大家都用Win,鸿蒙系统站错阵营了吗?
  8. 对模块开发卷宗的理解_【设计思维】quot;真quot;模块化根本就不需要读源码!...
  9. 5G、IoT 时代下,手机聚焦拍照是否走错了方向?
  10. Linux保护线程,linux的线程是否受到了保护?
  11. linux 基础 —— 网络管理
  12. GDBT、AdaBoost、XGBoost提升算法解析
  13. Python编写的强大的、通用的解析器
  14. python用户画像_研究用户应该从哪几个维度去构建用户画像模型?
  15. Java手机列表(供开发者参考)
  16. All-Pay Contests 论文定理推导(博弈论+机制设计)
  17. 计算机管理guest用户在哪,电脑来宾账户权限设置怎么设置
  18. 100 个网络基础知识普及,看完成半个网络高手
  19. 使用Date日期对象来完成,在页面上根据不同时间显示不同的问候语,如:早上好,中午好,下午好,晚上好等信息...
  20. oracle 多行数据合并成一行数据

热门文章

  1. js变量以及其作用域详解
  2. Red Hat 5.8 CentOS 6.5 共用 输入法
  3. 学习html5系列之比较典型的div滥用
  4. NandFlash系列之一:NorFlash与NandFlash对比
  5. CCNA培训课总结笔记--交换机的基本配置(十三)
  6. object.ReferenceEquals(a,b)
  7. ORB-SLAM2从理论到代码实现(七):Tracking.cc程序详解(中)
  8. 理解java虚拟机工作后了解吗,【深入理解JAVA虚拟机】第4部分.程序编译与代码优化.2.运行期优化。这章提到的具体的优化技术,应该对以后做性能工作会有帮助。...
  9. 网络流—Edmonds-Karp 最短增广路算法(最大流)
  10. 20155321 实验四 Android程序设计