作者 | 白日梦想家

编辑 | 王博

2022年过去,数据驱动成为自动驾驶演进共识。沿着数据驱动这条路线,自动驾驶加速迈入智算时代。

智算中心应运而生。

实际上,将智算引入自动驾驶的开先河者是特斯拉,其率先发布了专用于自动驾驶训练的超级计算中心Dojo,此后,一众玩家如毫末、小鹏等纷纷宣布建立智算中心。

各大智算中心比拼什么?

答案是,如何用低成本且高效的方式实现海量数据的闭环驱动。

“自动驾驶大模型加速降低开发成本,数据更接近人驾环境。基于量产实车数据的仿真技术将与自动驾驶云端超大模型结合,迎来新突破。超算中心成为自动驾驶的入门配置。”毫末智行董事长张凯在2023十大自动驾驶趋势预测中表示。

1月5日,在第七届HAOMO AI DAY上,毫末智行正式发布了由其与字节跳动旗下火山引擎联合打造的智算中心雪湖绿洲(MANA OASIS),这也是中国自动驾驶公司首个设立的智算中心。

“绿洲”登场,为我们揭开了智算时代的战场一角,也让毫末成为对阵特斯拉中最有看点的自动驾驶公司之一。

自建智算中心,剑指数据闭环

这应该是目前中国自动驾驶行业最大智算中心了。

每秒浮点运算可达67亿亿次,存储带宽每秒2T,通信带宽每秒800G,毫末官方在介绍MANA OASIS时给出这样一组数据。

基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现了计算、存储、通讯能力,可让数据更快速转化成知识。

有了这一新利器,毫末智行CEO顾维灏宣布,预计2024年上半年,毫末城市NOH落地将达到100城,2025年实现全无人驾驶。

MANA OASIS的出现是有其背景的。

随着感知技术与计算平台的逐渐成熟与趋同,影响高阶自动驾驶落地的关键因素,不再是解决常见的一般案例,而是解决“路口”问题,也即各类不常见,但不断出现的“长尾问题”,

作为一种模仿人类的科学,AI自动驾驶与人类认知世界的逻辑基本一致,想让汽车更好地理解世界,就需要构建更精准的模型。但算法模型的建立并非一劳永逸,自动驾驶车辆在行驶过程中总会遇到各种陌生场景。

因此,如何对新场景数据进行大规模高效处理并快速优化算法模型,即成为自动驾驶技术迭代的关键。换言之,构建基于数据驱动的自动驾驶数据闭环,让数据实现高效流动,是实现高阶自动驾驶的必由之路。

为满足实现数据闭环的所需要的超大算力数据中心,MANA OASIS出现了。

它的直接任务,便是为毫末智行的MANA数据智能体系提供超级算力,帮助MANA的五大模型实现低成本且高效的迭代。

MANA OASIS具备4大核心能力,包括以稳健系统架构保证高效存储和网络通讯、数据管理能力、算力优化能力以及训练加速能力。

顾维灏介绍,基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,可以让GPU不再等待数据,数据转化成知识的速度也会更快。毫末数据、算力、训练效率也迎来全面提升。

具体来看,在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经2年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500us

算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。

训练效率方面,基于Sparse MoE,通过训练平台的持续优化,毫末可实现单机训练百亿参数大模型,以及实现跨机共享expert的方法,完成千亿参数规模大模型训练,训练成本降低到百卡周级别,训练效率提升100倍。

那么,MANA OASIS是怎么提升毫末的数据闭环效率的呢?

帮助MANA五大模型升级,更低成本、更高效

基于MANA OASIS智算中心,MANA数据智能体系的五大模型迎来了升级。

这五大模型包括:视频自监督大模型、3D重建大模型、多模态大模型、动态环境大模型以及人驾自监督认知大模型。

其中,视频自监督大模型、3D重建大模型的应用目的是为了降低成本,另外三个大模型的应用是为了提升数据流转效率。

具体来说,毫末智行视频自监督大模型主要做数据标注工作,能够让毫末 4D clip 标注实现 100%自动化,人工标注成本降低 98%。

3D 重建大模型可以实现以低成本获取 normal case,生成各种高成本 corner case,其生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加 NeRF 生成的数据后,还可将感知的错误率降低 30%以上。

多模态互监督大模型,能够精准识别异形障碍物。毫末智行通过引入激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达,而通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。

动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。

毫末智行通过在 BEV(鸟瞰图)的 feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将 BEV 特征,解码为结构化的拓扑点序列,实现车道拓扑预测,从而使毫末智行在感知能力上能够像人类一样在标准地图的导航提示下就可以实现对道路拓扑结构的实时推断。

毫末智行认为,解决了路口问题实际就解决了大部分城市 NOH 问题,目前在保定、北京,毫末对于 85%的路口拓扑推断准确率高达 95%。即便是非常复杂、非常不规则的路口,毫末也能准确预测。

人驾自监督认知大模型,能够掌握高水平司机的开车技法,让驾驶决策更聪明。

在探索“使用大量人驾数据,毫末智行全新引入用户真实的接管数据,同时用 RLHF(从人类反馈中强化学习)思路先训练一个 reward model(奖励模型)来挑选出更好的驾驶决策。通过这种方式,使毫末智行在掉头、环岛等公认的困难场景中,通过率提升 30%以上。

此外,基于绿洲的支持,MANA最新的车端感知架构,从过去分散的多个下游任务都集成到一起,形成一个更加端到端架构,包括红绿灯、局部路网、预测等任务,实现了跨代升级。

以上这些,意味着毫末的感知能力更强,自动驾驶功能有了更大的可挖掘空间。

 2025年实现全无人驾驶,毫末的底气是什么?

此次AI DAY上,毫末智行正式宣布将在2025年实现全无人驾驶。

毫末智行的底气在是什么?顾维灏给出的答案,是重感知的技术路线、大模型的技术应用。

这里有一个先后顺序,需要先有大量数据,再进行数据的处理和应用。

在智算中心之前,毫末智行率先引入Transform等新技术,确立以数据闭环驱动形式的数据智能体系MANA,其已经成为毫末智行所有产品迭代的核心动力,截止目前,其学习时长已经超过42万小时,虚拟世界驾龄相当于人类司机5.5万年的驾龄。

当前,毫末智行已经完成数十万全要素、多模态CLIPS的标注,在场景库积累方面已经建设完成300万小时中国道路驾驶认知场景库,可以真正做到感知智能和认知智能的有效协同。

之后,怎么更好的处理数据。

智算中心的建立,能够让毫末智行在实现数据高效流转闭环的同时,还能够降低整个研发成本,从而促进自动驾驶系统快速实现量产落地。

值得一提的事,毫末智行自研的AEB算法助力魏牌、欧拉、坦克共计四款车型获得ENCAP、ANCAP五星安全,毫末是中国首个自研AEB算法落地海内外的公司,毫末也成为第一个出海欧洲、澳洲的自动驾驶公司。

在专利方面,截止到2022年12月,毫末拥有专利证书146件,全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域。

实际上,毫末还有一重优势,那就是背靠长城的量产优势。

毫末智行能够快速实现量产能力,也是能够反哺其自动驾驶技术快速升级迭代的重要因素之一。

目前正在陆续交付中的车型有摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等。

这些车型上市之后,也能够为毫末智行提供越来越多的高质量的自动驾驶数据,助力其自动驾驶系统不断迭代升级。

截止2022年底,毫末HPilot搭载车型近20款,已经搭载上市车型包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等。用户辅助驾驶行驶里程突破2500万公里。

城市辅助驾驶上,毫末智行的城市NOH软件达到交付状态,目前已经开启多城路测,毫末城市 NOH 是中国第一个可大规模落地的城市导航辅助驾驶,搭载毫末城市 NOH 的车型将在 2023 年上市。预计在2024年上半年落地城市达到100个。

毫末智行虽然成立仅三年时间,但已经稳居中国量产自动驾驶第一名。凭借此次发布的智算中心绿洲,毫末在自动驾驶领域的身位将持续靠前。

技术路线殊途同归,自动驾驶决战2025

自动驾驶行业已经进入以商业化量产为主的下半场竞争。

据不完全统计,除北上广之外,深圳、重庆、长沙等40多个省市,都积极出台相应管理办法或实施细则,从载人测试、道路测试、示范运营到无人化等多个阶段开展探索,大力推进自动化驾驶。

同时,据《中国自动驾驶乘用车市场数据追踪报告》发布的数据显示,2022年1季度国内L2级自动驾驶在乘用车市场的新车渗透率已达23.2%。

汽车之家研究院最新的一组报告预测,到2025年,中国L2级以上智能汽车销量将超过1000万辆,相应的智能汽车渗透率将达到49.3%。

与数据形成对比的,则是国内企业在自动驾驶赛道中激进的态度。

除了毫末外,百度此前宣布将于2023年打造全球最大无人驾驶服务区,华为计划将在2025年成为中国自动驾驶领导者。小马智行则表示2025年无人驾驶讲迎来真正的商业化应用。

与此同时,随着自动驾驶商业化落地竞争的开始,不管是走渐进式路线,还是跨越式路线,亦或者是纯感知路线,或多传感器融合路线,最终大家的目的都在殊途同归,即加速自动驾驶技术的量产落地,抢占自动驾驶决赛入场资格。

有业内人士表示,预计到2025年,自动驾驶行业的入场券将会截止。而作为国内走在自动驾驶量产前列的企业,毫末智行无疑已经获得2025决赛入场资格证。

张凯曾提到,数据是驱动自动驾驶成熟的核心要义,渐进式路线是数据积累的最佳路径。如今,随着智算中心绿洲的出现,毫末对数据和大模型的应用越来越娴熟,自动驾驶再进一步已是顺理成章。

手握智算中心“绿洲”,毫末跑在中美自动驾驶长跑第一线相关推荐

  1. @所有城市:想建AI智算中心的看这里!国家认可的那种

    金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 比算力.拼速度,今年火得藏不住. 就这两年,全球明星公司都纷纷开造,自建智算中心. 大洋彼岸特斯拉,马斯克今年重要的成就就是自研AI超 ...

  2. 浪潮、寒武纪联手,目标:新基建智算中心

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 4月22日,浪潮与中科寒武纪科技股份有限公司(以下简称寒武纪)在京宣布双方签署元脑战略合作协议.双方将整合优质的产品和技术研发资源,联手开发 ...

  3. 计算力即生产力,智算中心就是智慧时代的“发电厂” | MEET2021

    编辑部 整理自 MEET 2021  量子位 报道 | 公众号 QbitAI 进入AI时代,什么最重要? 算法固然是AI技术的核心,但是没有强大算力的支持,AI技术就很难得到落地.现在连AI技术创新本 ...

  4. 智算中心新基建 浪潮首发智算中心操作系统

    2020年11月25日,"远见卓实 践所未见"浪潮云海创新论坛2020在济南召开.会议分享了浪潮对于前沿科技的创新洞见,并以扎实可靠的落地实践为用户呈现技术的商业价值. 会上,浪潮 ...

  5. 【IPF2020】浪潮集团高级副总裁彭震:智算中心 筑基智慧世界

    [快讯]浪潮关注智算中心,据浪潮集团高级副总裁彭震来看主要归结为几个主要问题,分别是算力.数据以及互联.此外针对智算中心的分析往往不仅仅是一个中心的单一要素,更多是很多中心之间彼此互联的关系,如何解决 ...

  6. “算力经济”时代扑面而来,智算中心成未来数据中心进化方向

    科技云报道原创. 自第三次工业革命以来,算力与人们生活越来越密不可分. 如今,算力正在成为像水.电一样必不可少的基础设施,尤其是近三年疫情倒逼产业数字化的发展,进一步提升了算力对于社会运转的重要程度. ...

  7. IMAX China去年实现扭亏为盈;华为助力打造成都智算中心;Quantinuum和IBM壮大量子生态系统 | 全球TMT...

    国内市场 IMAX China公布2021年全年财务业绩.公司大中华区2021年全年收入约为 1.13亿美元,同比增长116%.与2020年全年净亏损460万美元相比,公司2021年经调整净利润约为4 ...

  8. 国内首个,成都智算中心成东数西算应用混合方案的数据中心样板

    像搭建乐高积木一样建设数据中心? 没错,这就是成都智算中心的建设模式.成都智算中心是"东数西算"国家一体化大数据中心成渝枢纽节点的样板工程.西南地区最大的人工智能计算中心,包括人工 ...

  9. 浪潮信息做pc服务器,浪潮信息:高性能AI服务器将成为智算中心生产算

    川北在线核心提示:原标题:浪潮信息:高性能AI服务器将成为智算中心生产算力的动力机组 智算中心,不管我们看得见,还是看不见,它将源源不断提供智慧时代的动力计算力. 4月9日,在IPF2020浪潮云数据 ...

最新文章

  1. LFSR 和 m序列
  2. 架构师之前,请先进阶,不要只会 Spring
  3. 1.9 归一化输入-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授
  4. 计算机专业英语书本笔记,英语语言学概论笔记《全集》.doc
  5. Linux(8) —— grep命令
  6. windows7旗舰版系统自带组件IIS搭建ftp
  7. C语言 FileStreaming fwritefread
  8. 一篇总结得超全的前端进阶文章!入门、技巧、方法、书籍、网站...一步到位!
  9. python是面向对象还是面向过程的语言_关于python是面向对象还是面向过程的分析...
  10. Linux下部署Spring Boot项目
  11. TimerTimerTask原理分析
  12. netty java_GitHub - leihuazhe/Java11-Netty-Demo: 基于Java11 构建的 netty 服务端客户端 模块化例子...
  13. 基于SSM开发自行车在线租赁管理系统
  14. 智能配电系统监控解决方案在长白山机场配电工程的研究与应用
  15. html中<img src=““ alt=““>标签里面alt的作用
  16. 吞剑!喷火!这种江湖卖艺套路能吸引观众吗?
  17. WIN11添加我的电脑图标等的方法
  18. PostgreSQL之外键约束
  19. 如何安装Windows操作系统
  20. ADN FDN SDN

热门文章

  1. 成熟短视频直播APP软件开发必备接口
  2. Python如何获取大量电影影评,做可视化演示
  3. PHP扩展 zqf 兼容7.0
  4. linux自动锁屏命令_自制Linux终端锁屏工具
  5. CC攻击常见类型集合
  6. 【定义并实现一个学生类(Student)】
  7. linux开启UDP端口
  8. css圆变球体,CSS 实现的各种球体效果
  9. oracle job的创建和删除,oracle job的创建和删除
  10. ETCD 源码学习--Raft 中 progress 的 inFlight 实现(九)