编辑部 整理自 MEET 2021
量子位 报道 | 公众号 QbitAI

当下,AI芯片将迎来什么样的挑战?

随着软件步入“2.0时代”,数据开始驱动AI进化,算力也逐渐成为智能化的基石。

但除了芯片本身的算力提升,AI算法对芯片的要求,也还会越来越高。

一方面,AI算法的发展日新月异,从人工设计特征,到深度学习神经网络模型,发展速度已经远超AI硬件改进的速度。

另一方面,软件2.0时代,灵活的AI开发、有效的数据闭环,将成为AI系统的新特征,这又会对AI芯片提出更多要求。

前后浪潮,一同夹击。AI芯片,应当如何破圈?

在MEET 2021智能未来大会现场,地平线联合创始人兼技术副总裁黄畅,给我们分享了对于AI芯片行业发展的思考。

在不改变原意的基础上,量子位对黄畅的演讲内容进行了编辑整理。

关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。本次大会现场有李开复等20余位行业顶级大咖分享,500余名行业观众参与,超过150万网友在线收看直播。包括新华社、搜狐科技、澎湃新闻、封面新闻等数十家主流媒体在内纷纷报道,线上总曝光量累计超过2000万。

演讲要点

  • AI的核心理念,就是不断地用机器替代人做更多的事情,包括学习本身。

  • “软件2.0”,指的是将整套AI系统的开发、测试、改进、安全评估,放在真实的物理世界中迭代提升,形成一个数据迭代闭环。

  • 如今,图像识别算法的进化速度,甚至已超过半导体行业的摩尔定律。

  • 即使功耗再低、面积再小,芯片也不能没有性能。而芯片的运算能力指标(TOPS),并不能反映最先进的算法带来的性能提升。因此,地平线提出了一个新指标MAPS,来合理地评估计算性能。

  • 只有将最先进的算法、和最先进的处理器架构结合在一起,才能更好地对算法进行优化。

  • 车载AI芯片,不仅是智能汽车的数字发动机,也是整个芯片行业的珠穆朗玛峰。

(以下为黄畅演讲分享全文)

飞速演进的AI算法

自上世纪60年代被提出后,AI经历了几个发展阶段。

从早期的符号主义、基于规则的专家系统,到后来的人工设计特征、浅层学习,再到今天的深度学习、超越深度学习的新范式……

每个发展阶段中,AI的核心理念,都是不断地用机器替代人做更多的事情,包括学习本身

但与其他领域不同,AI涉及的问题,难以用分解简化。

以计算机视觉为例。

在我们看来,下图是一只猫;但对于计算机而言,它只是一堆数据。

如何让计算机理解这张图,是一个复杂、高度非线性的问题。

上世纪80~90年代,计算机视觉的先驱,曾提出一种场景理解框架:用计算机提取图片中的物体边缘、构造2D物体,并理解2D物体之间的深度关系(2.5D信息),以获得3D模型。

但这个框架过于理想化。

不仅在框架计算时会引入大量不确定性(错误、噪音),输入图像本身也存在物体尺度变化、流水遮挡、同类物体类内差异等问题。

而且,现实场景下存在大量光源,各种光会从不同角度、位置出发,在空间中发生反射、折射等变换。

但计算机,却无法逆向还原这一过程。

伴随着AI发展进入下一阶段,专家们开始尝试设计一些简单特征(如SIFT、HOG等特征)。

这些特征,通常用于描述边缘、纹理等信息。

然后,计算机会用机器学习中的浅层学习(如SVM、随机森林等)模型来处理特征。

这些模型的参数不多,通常只经过2~3层非线性变化。

十几年前,随着稀疏编码(Sparse Coding)出现,这条路走到了极致。

这种方法基于无监督学习,将特征表达从低维映射到高维,并在高维稀疏空间中,用线性方法进行图像分类。

尽管参数很多,但稀疏编码并非端到端学习模式,仍属于浅层应用框架。因此,它的提升空间非常有限。

2012年,深度学习开始在计算机视觉领域“一飞冲天”。

随着深度学习的发展,各种AI模型的运算效率变得更高。

如果配合上特定的硬件设计,还能很好地扩大模型的容量、提升模型识别精度。

早期的深度学习网络,仍然由专家设计。但后来,研究者们开始让AI自主发现能提取最优关键特征的网络架构、构造神经网络。

这期间,AI模型变得更加多样化,算法也在不断进步,其速度甚至超过了半导体行业的摩尔定律。

过去8~10年里,处理器性能大约每隔18个月翻倍,但在保持精度相同的前提下,算法的计算量每隔10~14个月就能减半。

如今,只需要几百分之一的计算量,AI算法就能达到8年前图像识别的精度。

相比于传统方法(下图黑线)会导致精度饱和,深度学习(下图红线)的优势在于,它能很好地利用大数据、大模型和大计算量,来提升模型精度。

但与AlphaGo不同,基于深度学习的AI系统不能只建立在模拟器中。

以地平线从事的自动驾驶行业为例。

相比于虚拟世界,自动驾驶所应用的真实物理世界(像动植物、自然气候等)在不断发展变化、并持续涌现出新的任务和边角案例(corner case)。

因此,我们不能只在“虚拟世界”(如模拟器)中,训练端到端算法(感知、预测、规划、决策)、再将它们部署到汽车上。

我们必须将整套AI系统的开发、测试、改进、安全评估,放在真实的物理世界中迭代提升,形成一个数据迭代闭环。

这,便是所谓的“软件2.0”。

软件2.0时代,AI芯片新指标

软件2.0开发系统,是目前可行度最高的大规模持续迭代AI系统。

这个AI系统建立于自动化平台上,通过构造一个完整的数据闭环,来快速提取物理世界的数据。

然后,将数据送入后端训练、迭代模型,以提升系统的精度与效率,再通过OTA更新前端模型。

这是一个包含数据和计算系统在内的、非常完整的体系。

那么,这个数据闭环长什么样?

如下图,传统的“数据标注→训练→评测”,只是其中的一个小闭环,里面的数据是“死”的。

真正的大数据闭环,实际上包含这一训练模型,它会通过OTA服务器,将模型部署到机器人端(如自动驾驶车辆)。

然后,再由机器人端采集数据,并通过数据挖掘送到闭环数据系统,进行快速迭代。

这样的“小闭环+大闭环”,构成了整个“软件2.0”的开发系统。

这些年来,我们的软件算法演进速度很快。

但算法的演进速度,是以巧妙的算法设计为代价的。算法越巧妙,对计算架构的要求就更高。

像传统的通用并行计算架构GPU,已经无法满足目前先进AI算法的需求,因为它的整体计算效率,其实相当低下。

举个例子,下面是用运算能力(TOPS)达每秒30万亿次的处理器系统,运行各种算法任务的结果。

理想情况下,系统的算力利用率,应该能达到100%;但实际上,算力利用率普遍只有5%~60%

精度相同时,算法计算量越小,计算效率通常也越低。

因此,处理器的架构设计非常重要。架构设计得越合理,算法运行就越高效。

为了合理地评估计算性能,地平线提出了一个新指标MAPS(Mean Accuracy-guaranteed Processing Speed,在精度有保障范围内的平均处理速度)。

为什么要提出这个新的指标?

事实上,芯片的评估,往往有三个指标(PPA):性能(Performance)、功耗(Power)、面积(Area)。

其中,功耗和面积分别决定了芯片的使用、制造成本,但无论功耗再低、面积再小,芯片都不能没有性能

然而运算能力(TOPS)指标,并不能反映最先进算法带来的性能提升。

因此,我们定义了MAPS,这个指标通过可视化和量化的方式,在合理的精度范围内,以“快”和“准”两个维度,评估芯片对数据的平均处理速度。

例如,在不同芯片上对ImageNet数据集进行图像分类。

首先,选择适合芯片的算法,然后从“快”和“准”两个维度,对芯片的速度和精度进行评估。

上图的三条曲线,就对应了三颗不同芯片的物体识别效果。

这三颗芯片,分别是地平线第三代处理器、第五代处理器和英伟达Xavier芯片。

对比发现,在图像分类中,地平线第三代处理器只需要8%的功耗,就能达到英伟达50%的性能;第五代芯片只需要50%的功耗,就能达到英伟达500%的性能。

在目标检测中,第五代处理器同样用50%的功耗,就达到了英伟达13倍的性能。

如果只沿用通用计算架构,很难为先进算法做出优化。

只有将最先进的算法、和最先进的处理器架构设计结合,才能在功耗和性能上同时达到最优。

在软件2.0时代,算力的重要性不言而喻,尤其是领域相关的算力,而非通用算力。

如果对领域相关的算力进行评估,一个更合理的指标就是MAPS。从这一指标来看,地平线设计芯片的功耗和性能,要比通用设计芯片的优势更大。

在钻研AI芯片技术的过程中,我们也发现一个很有趣的现象。

一方面,我们在不断提高AI技术;另一方面,AI技术也改进了我们的生产制造。以芯片设计为例,普通工程师进行电路连线需要6周,但AI只需要6小时。

事实上,AI技术的出现,给芯片设计带来了巨大挑战。

AI任务要求,芯片除了算力、还必须携带大量计算和存储单元,即对存储带宽提出了更高要求。

反之,AI技术,也在快速推动AI芯片的发展。

车载AI芯片,行业的珠穆朗玛峰

地平线渴望万物智能的时代,在我们看来,汽车终将成为四个轮子上的超级计算机。

而车载AI芯片,不仅是智能汽车的数字发动机,也是整个芯片行业的珠穆朗玛峰,其设计难度和质量要求(车规级)都很高。

地平线的定位是Tier2,为产业赋能。我们既能供应芯片,也能提供完整方案,同时,还可以开放工具链,提供算法、模型样例,进行专业化的培训服务。

今年,地平线开启了前装量产元年。

地平线车规级芯片“征程2”,目前出货量已突破10万,还签下了20多个前装定点项目。

目前,全球仅有三家公司,实现了车规级AI芯片规模化量产,地平线就是其中一家,也是国内唯一一家实现车规级AI芯片大规模量产的企业。

而长安UNI-T和奇瑞蚂蚁,也已经率先采用地平线的芯片,用作智能驾舱和高级别辅助驾驶。

今年3月,“征程2”在长安UNI-T上实现前装量产;9月,奇瑞蚂蚁搭载“征程2”正式上市,实现L2+级自动驾驶。

从自动驾驶到智能座舱,汽车智能化的大潮即将涌来,势不可当。

我们希望通过努力去赋能百业,让我们的客户和用户,都能享受到AI带来的收益。同时,我们也愿意与更多伙伴一起踏上这一征程。

谢谢大家!

(最后,如果想回看大会全程,请点击阅读原文)

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

地平线黄畅:软件2.0时代,数据驱动进化,算力将成为智能化的基石丨MEET2021...相关推荐

  1. 软件 2.0 时代的程序分析

    作者 | 张昕 整理 | 晴天 作者经历: 2020.9 – 现在,北京大学计算机系助理教授 2017.9 – 2020.8,美国麻省理工学院计算机与人工智能实验室博士后 2017,博士,美国佐治亚理 ...

  2. 百胜erp软件下载 php,百胜erp软件迎来电商软件3.0时代

    百胜ERP软件迎来电商软件3.0时代 电子商务的发展日新月异,带来了新的商业革命.消费者需求的个性化.网上购物渠道的多样化和企业电商业务的战略化发展趋势,使企业对电子商务软件的需求不断升级.电商信息化 ...

  3. 软件2.0时代来了!特斯拉AI负责人说:神经网络正在改变编程

    原作:Andrej Karpathy 安妮 编译自 Medium 量子位 出品 | 公众号 QbitAI 本文作者Andrej Karpathy,现任特斯拉人工智能负责人,曾任OpenAI研究专家.在 ...

  4. 【软件2.0】软件2.0时代来了!特斯拉AI负责人说:神经网络正在改变编程

    本文作者Andrej Karpathy,现任特斯拉人工智能负责人,曾任OpenAI研究专家.在斯坦福大学读博时师从李飞飞,主要研究方向是卷积神经网络结构.自然语言处理及它们在计算机视觉上的应用. Ka ...

  5. ai自动写JAVA代码,人工智能自动写作软件2.0时代(示例代码)

    大家好,人工智能人工智能(ai)的定义是计算机科学的一个分支,自20世纪70年代以来被称为世界三大最先进技术之一(空间技术.能源技术和人工智能).它有许多定义,它们都是有意义的,没有对错之分.人工智能 ...

  6. 软件2.0时代之三:毛新生谈他眼中的Web2.0

    软件2.0时代之三:毛新生谈他眼中的Web2.0 2007.08.31  来自:CSDN      共有评论(7)条 发表评论   [收藏到我的网摘] Web是一个"活物",是一个 ...

  7. Andrej Karpathy最新专访:AGI、Optimus、软件2.0时代丨万字精华观点

    10月底,在著名AI播客主持人Lex Fridman长达三个小时的访谈节目中,特斯拉前AI总监Andrej Karpathy谈及了他对于Transformer.神经网络.大规模语言模型.AGI的理解, ...

  8. 软件 3.0:人工智能驱动下的未来

    [CSDN 编者按]软件 3.0 有望改变我们构建技术以及与技术交互的方式.这场革命的核心在于人工智能驱动的开发,以实现无缝的.类似人与人的软件交互. 原文链接:https://divgarg.sub ...

  9. 「软件」2.0时代已经到来,你需要这样的开发工具

    互联网催生了软件的繁荣,而在AI浪潮的推动下,软件正在朝着更「智能」的方向发展,也就是「软件2.0」时代.「软件2.0」其实就是神经网络,也就是这一波AI浪潮的基石. 在「软件1.0」时代,程序员用J ...

最新文章

  1. python爬虫搜特定内容的论文_python基于BeautifulSoup实现抓取网页指定内容的方法...
  2. Python基本数据类型 set()
  3. [转载]JAVA实现鼠标右键功能
  4. 使用OClint进行iOS项目的静态代码扫描
  5. 审批流_怎样让审批工作流和应用数据分离?
  6. 的优缺点_浅谈桉木家具的优缺点
  7. 『飞秋』Windows7新功能体验(1):为Windows 7 Media Center安装网络电视(Internet TV)
  8. Hibernate 注解(Annotations 一)
  9. 工业4.0围观,大炒作,大问题,大差距,你发现了吗?
  10. BZOJ 1673 [Usaco2005 Dec]Scales 天平:dfs 启发式搜索 A*搜索
  11. python 找到装饰器_Python 装饰器的总结(一)
  12. rl滤波器原理_浅谈滤波器原理以及其他基础知识
  13. 多位专家解读工业3D打印“叫好不叫座”
  14. Python爬虫滑块验证
  15. 计算机硬盘有坏道,硬盘有坏道怎么办 硬盘坏道分类
  16. LintCode168.吹气球
  17. 桥接模式+C#发送邮件+配置文件
  18. [NOIp 2014]解方程
  19. 以太网与 TCP/IP
  20. 如何轻松搭建Java安卓开发环境

热门文章

  1. Eclipse Android插件中的“调试证书已过期”错误
  2. 数据分析师常用的十种数据分析思路,你都知道吗?
  3. Linux state 方式 安装nginx 服务
  4. Python生产环境部署(fastcgi,uwsgi)
  5. 产品策略研究期的数据分析与挖掘
  6. 0x01 念念Python,必有回响
  7. 读书--编写高质量代码 改善C#程序的157个建议2
  8. Nginx防盗链详细设置
  9. C# 参考之访问关键字:base、this
  10. flutter doctor --android-licenses 报错解决方案