前言

如果大家关注上个月Nvidia GTC,那么大家应该会注意到Nvidia 老大黄仁勋介绍了他们自家的无人驾驶汽车,这个汽车的无人驾驶技术和以往的方法不一样,完全采用神经网络。这个系统取名为DAVE。
NVIDIA GTC Self-Driving Car
上面的视频需翻墙观看。

很庆幸的是,就在上周,Nvidia发表了他们的文章来介绍这个工作:
http://arxiv.org/abs/1604.07316

虽然这个工作暂时和Reinforcement Learning没有关系,但是相信他们会加上增强学习是这个无人车具备自主学习提升的能力。

Abstract

这个工作的思路可以说超级的简单,就是使用人类的驾驶数据来训练一个端到端的卷积神经网络CNN。输入是车载摄像头,输出直接是汽车的控制数据。想来这个事情在以前恐怕是难以想象的,要知道当前最先进的自动驾驶系统依然是采用标志识别,道路识别,行人车辆识别,路径规划。。。各种步骤来实现的。而现在这些通通不用,就给汽车一个图像,让汽车根据图像做判断。想想这是一个非常神奇的事情,虽然根据CNN的能力我们可以理解这是可以做到的。

那么这件事大概当前也就Nvidia可以做,因为他们有最先进的硬件Nvidia DevBox,Nvidia DRIVE PX。

那么通过训练,他们在一定程度上取得了成功。结果很重要。训练出来之后,这意味着在未来,随着性能的提升,训练的进一步强化,以及使用增强学习,未来的无人车将具备完全自己思考的能力。

DAVE-2 系统结构

这个系统叫做DAVE-2,DAVE其实是(DARPA Autonomous Vehicle的缩写,无人车比赛最早就是DARPA搞出来的)。整个硬件系统如下:

用三个摄像头,通过NVIDIA DRIVE PX做输入输出。
软件系统如下:

那么这里有个trick,就是我们人类只输入的是正确的样本,那么怎么让计算机面对错误的环境来做调整呢?很简单的trick,在车上面再安装两个摄像头,不过这两个摄像头的位置不在正中间,那么这两个摄像头看到的样本就是错误的。其他的偏移中间及旋转则可以根据3d变化来模拟出来。那么对应的偏移及旋转的控制量也可以计算出来。这样就有了一一对应的样本了。

那么这里我们也应该看到,输出是很简单的,就是汽车驾驶的轮子的角度。并没有速度控制。这一定程度上大大简化了训练的要求。

而对于训练,那就是简单的CNN-regression训练。
训练好之后,要forward就使用中间的摄像头

训练数据

72小时的人类数据。由于上面的多个摄像头的数据,及科研进行3d变换得到的模拟数据,总的样本将极其之大。

关于具体的网络结构还有训练细节大家还是看原文比较好。基本上没有大的trick。

小结

这个工作idea其实很简单,关键是实现,完全是一个非常复杂的系统工程,需要一个大的团队配合才能搞出来,和AlphaGo类似。这才是真正的智能车啊。明年将举行的Roborace想必将极大推进这方面的进展。

DRL前沿之:End to End Learning for Self-Driving Cars相关推荐

  1. 《Deep Reinforcement Learning for Autonomous Driving: A Survey》笔记

    B Ravi Kiran , Ibrahim Sobh , Victor Talpaert , Patrick Mannion , Ahmad A. Al Sallab, Senthil Yogama ...

  2. [文献精读] End-to-End Model-Free Reinforcement Learning for Urban Driving using Implicit Affordances

    End-to-End Model-Free Reinforcement Learning for Urban Driving using Implicit Afforda 思维导图 摘要 1 引言 2 ...

  3. 【论文阅读】End-to-End Model-Free Reinforcement Learning for Urban Driving Using Implicit Affordances

    文章名:CVPR2020: End-to-End Model-Free Reinforcement Learning for Urban Driving Using Implicit Affordan ...

  4. 文章解读 -- Self-Supervised Pillar Motion Learning for Autonomous Driving

    文章解读 – Self-Supervised Pillar Motion Learning for Autonomous Driving 1. 摘要 当高度动态环境下,与多样交通参与者进行互动时,自动 ...

  5. Quora上How important is deep learning in autonomous driving?答案的搬运

    原题目链接 https://www.quora.com/How-important-is-deep-learning-in-autonomous-driving# 答案1 Deep learning ...

  6. 前沿视频教室——《C#图解教程》是本好书,强烈推荐!

    前沿视频教室--<C#图解教程>是本好书,强烈推荐! 本文转载自前沿视频教室:http://learning.artech.cn/ 从昨天中午到今天上午,我读完了<C#图解教程> ...

  7. 自动驾驶前沿综述:基于深度强化学习的自动驾驶算法

    ©作者 | 陈道明 学校 | 布里斯托尔大学 研究方向 | 自动驾驶方向 这是 21 年的一篇综述文章,可以算得上是最前沿的自动驾驶技术综述.这几年随着深度表征学习的发展,强化学习领域也得到了加强.本 ...

  8. 深度强化学习综述论文 A Brief Survey of Deep Reinforcement Learning

    A Brief Survey of Deep Reinforcement Learning 深度强化学习的简要概述 作者: Kai Arulkumaran, Marc Peter Deisenroth ...

  9. 【Paper】Deep Learning for Anomaly Detection:A survey

    论文原文:PDF 论文年份:2019 论文被引:253(2020/10/05) 922(2022/03/26) 文章目录 ABSTRACT 1 Introduction 2 What are anom ...

最新文章

  1. 我的一个rsync的包装
  2. 一种ui app写法
  3. 代码生成工具之MyGeneration
  4. 【算法导论】学习笔记——第9章 中位数和顺序统计量
  5. python生成热度图_python根据输入的数据在地图上生成热力图效果
  6. 计算机三维辅助设计3DMaX,计算机辅助设计(AUTOCAD、3DMAX).docx
  7. 10.恩智浦-车规级-MCU:S32K11X FTM-PWM输出实验
  8. a += 1、a = a + 1、a++区别
  9. 深度优先搜索——走迷宫问题
  10. #程序员健康 如何解救你的鼠标手
  11. 小米更新到MIUI13版本后,进行android调试,出现无法实现USB下载安装的问题
  12. 提升线下实体店铺购物体验
  13. 【小学信息技术教资面试】教案模板
  14. java中web错误返回码,关于在java程序里调用webservice报500返回码的有关问题
  15. HTML5讲解与演示转载整理
  16. 互联网协议 — TCP — 报文格式
  17. 玛雅云渲染计算机设置,Maya如何使用云渲染,怎么操作?
  18. Leetcode 999. Available Captures for Rook
  19. 1,WLAN的基本概念
  20. 从 1 秒到 10 毫秒!在 APISIX 中减少 Prometheus 请求阻塞

热门文章

  1. 老中医一生心得,看了对你的下半生大有好处
  2. 【毕设学习之转录组技术一:基因组成+转录流程】
  3. 计算机显示没有可以的ip地址,我的电脑的IP地址显示不出来怎么办
  4. python入门小程序代码_源码精灵游戏小程序,python入门游戏,点开既玩
  5. CGAL进行半边塌缩之前的可塌缩性判断
  6. python 常见字符串与函数的用法
  7. 抠图 php中文网,ps套索工具怎么抠图
  8. 关于自建cdn使用时的跨域问题
  9. 看完项目经理平均工资,看看你拉后腿了吗?
  10. frameset框架集实例