早期做自动驾驶的小伙伴几乎每个人都自己动手写过车道线识别程序,OpenCV写写,霍夫变换写写,模板匹配写写,再复杂一点弄个RANSAC,或者滤波投票。然而一遇到光线变化就挂了,遇到天气变化也会挂,车速高了也挂,总之各种挂。体验了各种挫败感之后,大部分人都转而投向激光和差分的方案,丢下一句“现在视觉还尚未成熟”之类的话。

我之前也一直这么认为,视觉太难做,直到我有一天看到了Mobileye的结果,漂亮得一塌糊涂,比如上图里这种,从没有车道线的地方都能推理出车道线(传说中的HPP,Holistic Path Planning),只能说彻底给跪了。

几周前创新港做过一期专门的微讲座,请了Mobileye中国区总经理苏淑萍女士介绍工作,期间她分享了这样一些数字,截至2015年底,全球超过1000万装机量,覆盖超过20家车企的273款车型。集成度极高的解决方案,快速的市场推进速度,无一不让所有人觉得眼前一亮,而这些成功的背后,则是其多年积累的强大算法支撑。

两位老伙计

1999年,早在Google自动驾驶火起来的十年之前,以色列Hebrew大学教授Amnon Shashua(现任CTO)和连续创业成功者Ziv Aviram(现任CEO)就看到了视觉技术用于汽车安全的可能性,联合创办了Mobileye,致力于用单目视觉提供包括行人检测、车道保持和自适应巡航等辅助驾驶技术。

2014年8月IPO,Mobileye被称为以色列有史以来最成功的IPO,首日涨幅接近50%。时至今日谈起这家公司,相信大家都不陌生了,毕竟市值过百亿的算法公司不多,而连续十几年看准一件事情坚持做下来的实属凤毛麟角。

成功总是青睐有准备的人,从商业上来讲,Aviram丰富的经验赢得了强有力的资金支持,一开始不考虑机构的钱,固执的认为机构都是急于变现的人,他的模式让我想起网易的丁磊。因此,从开始直到2007年,Mobileye的资金支持大部分来自朋友和天使投资人,这群人充分的信任给了Mobileye充分的发展空间,使其早期基于视觉的方案在业界不看好的情况下顽强生存了下来,并证明了自己的价值所在(当年BMW,GM和Volvo成为首批配装Mobileye的车企)。在此之后,Aviram开始引进机构投资,此时的机构已经认识到了Mobileye的潜力,支持力度很大,使得哪怕在2008-2010年经济衰退期,Mobileye的账面上都余粮很多,从技术上可以比较激进发展。

从技术上来讲,早在2000年左右,比较了毫米波、激光雷达和摄像头传感器之后,考虑到可靠性、易用性和性价比,Shashua就坚定地走上了单目视觉这条路。一直以来,Shashua致力将Mobileye打造成当今ADAS的核心部件。远在大多数车企意识到ADAS重要性之前,他们已经设计出一套完整的、可提供多种安全功能的集成视觉系统,以至于后来2010年率先推出行人碰撞预警系统,2013年推出自动紧急刹车系统,2013年推出纯视觉ACC系统等,都充分体现了Shashua对此有非常超前的认识。

在一次接受哈佛商学院的采访中,Shashua还提到Mobileye发展过程中最重要的两个战略决定:一是将各类安全功能全部集成到一款产品中,而不是拆分销售,很大程度上提高了产品的竞争力和可维护性;二是决定自主研发片上系统(SoC),这为后来量产化时降低成本、掌握更多设计自主权打下了基础。

自动驾驶线路图

在辅助安全产品上的成功,让两位创始人开始展望未来,而辅助功能的进一步升级就是自动驾驶。随着城市交通拥堵的日益严重,以及不靠谱司机的日益增多,NHSTA开始着手推动自动驾驶功能上车,具体的是在其评分标准中,达到4-5星评级的产品,应具备一定程度的自动驾驶能力,例如ACC和AEB。

对此,在过去的一年中,Mobileye比较侧重地向自动驾驶方向做了一些调整,在2016年的CES上,Shashua给了一个很偏技术的keynote演讲,阐述了在自动驾驶方面的路线图:以当前的感知产品为基础,为自动驾驶系统提供可行区域和障碍物信息;通过已经配装在车上的Mobileye进行地图的收集,以及开发驾驶决策控制算法。

长久以来,自动驾驶技术被划分为两个阵营,一个是源自Darpa,由一群机器人学家构成的“特定区域全自动驾驶派”,以Google为首,试图通过大数据和人工智能技术来革新驾驶体验。另一个则是源自车企,由一群汽车电子工程师构成的“全区域部分自动驾驶派”,试图将该技术以新功能的形式添加到汽车进而盈利。Mobileye偏向后者,希望能够以一种递进的方式,逐步推进自动驾驶技术,而Shashua的计算机科学背景让他们同时兼顾了人工智能技术,并将其大量运用于产品当中。

总体来讲,Mobileye在自动驾驶的布局分为三个部分,也可以认为是三个阶段:感知、高精地图和驾驶决策。

当前比较成熟的,是它的感知技术,已经大量运用在已有产品中,主要提供一个环境模型(Environmental Model),包括运动和静止的物体、车道线、可行驶区域和交通标志等。

多年的积累,让Mobileye在环境模型方面能够提供的内容远超竞争对手,在别人还在尝试提高单一车道线的检测精度时,Mobileye已经可以提供道路的语义级特征描述,例如当前行驶车道的左右车道线、左右车道的左右线以及道路分叉等等,均通过深度神经网络识别。

谈到深度学习,就需要提一下现在很火的End-to-End方法。智驾深谈第一期的时候,我们曾经介绍了独行侠GeoHot和他的Comma.ai,Shashua对于端到端方法也有自己的看法,简单来说是不看好的。他认为端到端不考虑专家经验,不考虑领域知识,不考虑人工监督,对极端情况(Corner Cases)的应变能力比较差。相比来讲,Mobileye将感知任务划分成多个模块,每个对应一个人工监督的神经网络,所得出的效果已经可以产品化。

第二个方面,是高精度地图技术(称作REM,Road Experience Management),该技术是自动驾驶不可或缺的支撑,区别是是否使用复杂的3D激光雷达来采集和制作地图,Shashua认为并不需要,而是通过图像中丰富的纹理和色彩特征来生成地图。Mobileye采取的策略是三维上稀疏,地面一维稠密的结构,三维元素不会包括原始图像数据,而是经过识别后的语义信息。

地面一维的信息则包括的比较多,建立了一个道路模型,包括车道线的精确位置、连接关系等。

值得一提的是,当前高精度地图供应商,在生产和维护地图方面成本很高,而Mobileye则采取群体智能的方式来解决这个问题,通过大量装配在量产车上的Mobileye现有产品来分布式收集和更新数据。

第三个方面,也是自动驾驶技术公认的难点,即决策与规划技术。目前Mobileye也在利用深度学习进行初步的尝试,跟DeepMind采用的DQN网络不同,他们还考虑了驾驶过程中的时序性。

结语

总体上来看,Mobileye依托单目视觉技术,正在逐步铺平通向全自动驾驶的道路,在此过程中不断收集驾驶数据,优化驾驶模型,更新驾驶产品。今天的Mobileye ADAS系统,在未来会逐渐完成高速自动、环路自动和城区自动等功能,最终达到A点到B点的全自动驾驶,让我们拭目以待。

文章转自新智元公众号,原文链接

【智驾深谈】Mobileye,用单目视觉点亮自动驾驶相关推荐

  1. 【智驾深谈】一张图看清自动驾驶产业

    自动驾驶三层次 通常来讲,自动驾驶技术可以划分为三个层次,感知->认知->行动,然后不断循环.参考上面一张网图,其中行动层包括转向.油门和制动三大控制器(以及执行机构),感知部分包括两方面 ...

  2. 【智驾深谈】George Hotz,桀骜不逊的自动驾驶破局者

    左为 2007年 GeoHot 展示其成功破解苹果第一代 iPhone,右为 Engadet 日前采访 common.ai 新车发布时,一身西装革履的 GeoHot.图片来源:thenexttech. ...

  3. 【智驾深谈】特斯拉死亡事故官方洗白,业界被判死缓(万字报告)

    2016年5月7日,一款特斯拉2015 Model S型轿车在经过佛罗里达州Williston西郊高速公路的时候,与一辆拖挂卡车相撞,驾驶员当场收到致命伤害.从该车提取的数据显示: 碰撞时刻特斯拉处于 ...

  4. 【智驾深谈】自动驾驶潜在突破点:传感器与车载集成系统(万字干货)

    近来,采埃孚(ZF)收购激光雷达公司Ibeo的40%股权,Velodyne旗下激光雷达公司Velodyne LiDAR获福特汽车和百度联合注资1.5亿美元.Mobileye宣布终止与特斯拉的合作,不再 ...

  5. 冉斌谈基于车路协同的自动驾驶

    冉斌谈基于车路协同的自动驾驶 (chinahighway.com) 当前,自动驾驶技术是ITS的热门话题,无人驾驶汽车正逐渐风靡全球.经过长期的发展,自动驾驶目前已进入量产化阶段,除了我们耳熟能详的特 ...

  6. 发布职位:毫末智行HAOMO.AI#a轮数亿,美团首钢高瓴资本解决方案:自驾系统+自驾计算平台+末端物流整体解决方案 渐进式自动驾驶研发技术路线(量产L2->L5)base;北上保定前

    发布职位:毫末智行HAOMO.AI# a轮数亿,美团首钢高瓴资本 解决方案:自驾系统+自驾计算平台+末端物流整体解决方案 渐进式自动驾驶研发技术路线(量产L2->L5) base:北上保定 前端 ...

  7. 自动驾驶行业观察之2023上海车展-----智驾供应链(1)

    芯片供应商发展 地平线:发布新一代BPU®智能计算架构,宣布与采埃孚合作 业务数据: 征程芯片总出货量:地平线公布征程芯片出货量突破了300万片,与超过20家车企共计120多款车型达成量产定点合作. ...

  8. 融资、量产和一栈式布局,这家Tier 1如此备战高阶智驾决赛圈

    作者 | Bruce 编辑 | 于婷 从早期的ADAS,到高速/城市NOA,智能驾驶的竞争正逐渐升级,这对于车企和供应商的核心技术和产品布局都是一个重要的考验. 部分智驾供应商已经在囤积粮草,响应变化 ...

  9. 腾讯新公开这张「图」,我看了眼,上面写满「智驾」二字

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 格局稳固的车载地图市场,来了一个新玩家. 刚刚,就在今年的数字生态大会上,腾讯发布了最新的车载导航产品腾讯智驾地图. 不寻常是" ...

最新文章

  1. 0x56. 动态规划 - 状态压缩DP(习题详解 × 7)
  2. mysql5.7单机多实例_Mysql 5.7.21单机多实例安装
  3. 转:Fedora 17安装后配置|rpmfusion源|Rhythmbox mp3 wma支持插件|smplayer
  4. Gradle在大型Java项目上的应用
  5. pom.xml配置详解
  6. 第五十五期:区块链将在2020年实现的重大改变
  7. V210 UART TX 流程
  8. Atitit.遍历图像像素点rgb java attilax总结
  9. request.get_full_path() 和request.path区别
  10. 图 Graph-图的相关算法
  11. 安卓listview点击空白事件_王者荣耀安卓苹果ios改空白名;重复名字特殊昵称教程...
  12. 喜庆:上周阅读量5W,超过了99%的C友
  13. oracle 自动化运维--自动搭建oracle dataguard 运维工具(开发源代码)
  14. tar命令中--exclude参数详解
  15. ODC(Orthogonal Defect Classification)简介
  16. 三次握手与四次挥手的爱恨情仇
  17. Linux下cp和scp的详细说明及其他们的区别
  18. 在线考试系统的性能需求分析
  19. 以太网网卡历史-3com,intel及其它
  20. 学计算机前后对比的图片,大学生“修图前后”对比照,差距一目了然,男生帅气女生惊艳...

热门文章

  1. Linker加载so失败问题分析
  2. iOS 新窗口在最上层
  3. TCPView for Windows
  4. Linux 系统的配置文件
  5. 有一种爱,永远也无法逾越
  6. Docker 容器技术 — docker run
  7. OpenAirInterface,开源的 4G EPS 实现
  8. altium designer PCB 屏蔽DRC报错
  9. NR 5G MAC媒体接入控制
  10. Java vs Big data 哪种编程语言更好?