近几年来,人工智能行业飞速发展。麦肯锡预测人工智能可在未来十年为全球GDP增长贡献1.2个百分点,为全球经济活动增加13万亿美元产值,其贡献率可以与历史上第一次“工业革命”中蒸汽机等变革技术的引入相媲美。

从产业链来看,人工智能可以分为技术支撑层、基础应用层和产品层,各层面环环相扣,基础层和支撑层提供技术运算的平台、资源、算法,应用层的发展离不开基础层和技术的应用。

人工智能产业链

资料来源:凯联资本投研部

基础层分为硬件和软件。硬件即具备储存、运算能力的芯片,以及获取外部数据信息的传感器;软件则为用以计算的大数据。这里我们着重分析硬件部分的智能芯片。

1、智能芯片

按技术架构来看,智能芯片可分为通用类芯片(CPU、GPU、FPGA)、基于FPGA的半定制化芯片、全定制化ASIC芯片、类脑计算芯片(IBMTureNorth)。对于绝大多数智能需求来说,基于通用处理器的传统计算机成本高、功耗高、体积大、速度慢,难以接受。因此以CPU、GPU、FPGA、ASIC和类脑芯片为代表的计算芯片以高性能计算能力被引入深度学习。

AI半导体分类

资料来源:谷歌,凯联资本投研部

2017年各AI企业公开芯片数据

资料来源:中国科学院自动化研究所,凯联资本投研部

(1)GPU

大规模数据量下,传统CPU运算性能受限。遵循的是冯诺依曼架构,其核心就是:存储程序,顺序执行。随着摩尔定律的推进以及对更大规模与更快处理速度的需求的增加,CPU执行任务的速度受到限制。GPU在计算方面具有高效的并行性。用于图像处理的GPU芯片因海量数据并行运算能力,被最先引入深度学习。CPU中的大部分晶体管主要用于构建控制电路(如分支预测等)和Cache,只有少部分的晶体管来完成实际的运算工作。GPU 与 CPU 的设计目标不同,其控制电路相对简单,而且对Cache的需求较小,所以大部分晶体管可以组成各类专用电路和多条流水线,使GPU的计算速度有了突破性的飞跃,拥有惊人的处理浮点运算的能力。

GPU与CPU结构对比

资料来源:谷歌,凯联资本投研部

(2)FPGA

FPGA(可编程门阵列,Field Programmable GateArray)是一种集成大量基本门电路及存储器的芯片,最大特点为可编程。可通过烧录FPGA配置文件来来定义这些门电路及存储器间的连线,从而实现特定的功能。此外可以通过即时编程烧入修改内部逻辑结构,从而实现不同逻辑功能。FPGA具有能耗优势明显、低延时和高吞吐的特性。不同于采用冯诺依曼架构的CPU与GPU,FPGA 主要由可编程逻辑单元、可编程内部连接和输入输出模块构成。FPGA每个逻辑单元的功能和逻辑单元之间的连接在写入程序后就已经确定,因此在进行运算时无需取指令、指令译码,逻辑单元之间也无需通过共享内存来通信。因此,尽管FPGA主频远低于CPU,但完成相同运算所需时钟周期要少于CPU,能耗优势明显,并具有低延时、高吞吐的特性。

FPGA结构图

资料来源:谷歌,凯联资本投研部

(3)ASIC

ASIC 芯片是专用定制芯片,为实现特定要求而定制的芯片。除了不能扩展以外,在功耗、可靠性、体积方面都有优势,尤其在高性能、低功耗的移动端。谷歌的TPU、寒武纪的GPU,地平线的BPU都属于ASIC芯片。谷歌的TPU比CPU和GPU的方案快30-80倍,与CPU和GPU相比,TPU把控制缩小了,因此减少了芯片的面积,降低了功耗。其缺点在于开发周期长、投入成本大,一般公司难以承担。

张量处理器(tensor processing unit,TPU)是Google为机器学习定制的专用芯片(ASIC),专为Google的深度学习框架TensorFlow而设计。与GPU相比,TPU采用低精度(8 位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。Google在2016年首次公布了TPU。2017年公布第二代TPU,并将其部署在Google云平台之上,第二代TPU的浮点运算能力高达每秒180 万亿次。

AI芯片主要性能对比

资料来源:学术论文,凯联资本投研部

2、智能芯片架构

架构创新是解决成本不断上涨的关键。随着市场对芯片计算能力的需求提高,芯片制造工艺也在不断提高,与之而来的是芯片制造成本不断涨高,解决这个问题的关键则是架构创新。目前 AI 芯片主要架构有CPU+GPU、CPU+FPGA、CPU+ASIC等。

主流AI处理器的制程和架构

资料来源:电子发烧友,凯联资本投研部

3、智能芯片的应用

深度学习主要分为训练和推断两个环节:在数据训练(training)阶段,大量的标记或者未标记的数据被输入深度神经网络中进行训练,随着深度神经网络模型层数的增多,与之相对应的权重参数成倍的增长,从而对硬件的计算能力有着越来越高的需求,此阶段的设计目标是高并发高吞吐量。

推断(inference)则分为两大类——云侧推断与端侧推断,云侧推断推断不仅要求硬件有着高性能计算,更重要的是对于多指令数据的处理能力。就比如Bing搜索引擎同时要对数以万计的图片搜索要求进行识别推断从而给出搜索结果;端侧推断更强调在高性能计算和低功耗中寻找一个平衡点,设计目标是低延时低功耗。

因此从目前市场需求来看,人工智能芯片可以分为三个类别:

1) 用于训练(training)的芯片:主要面向各大AI企业及实验室的训练环节市场。目前被业内广泛接受的是“CPU+GPU”的异构模式,由于AMD在通用计算以及生态圈构建方面的长期缺位,导致了在深度学习GPU加速市场 NVIDIA一家独大。面临这一局面,谷歌今年发布TPU2.0 能高效支持训练环节的深度网络加速。我们在此后进行具体分析;

2) 用于云侧推断(inferenceoncloud)的芯片:在云端推断环节,GPU不再是最优的选择,取而代之的是,目前 3A(阿里云、Amazon、微软 Azure)都纷纷探索“云服务器+FPGA”模式替代传统CPU以支撑推断环节在云端的技术密集型任务。但是以谷歌TPU为代表的ASIC也对云端推断的市场份额有所希冀;

3) 用于端侧推断(inferenceondevice)的芯片:未来在相当一部分人工智能应用场景中,要求终端设备本身需要具备足够的推断计算能力,而显然当前ARM等架构芯片的计算能力,并不能满足这些终端设备的本地深度神经网络推断,业界需要全新的低功耗异构芯片,赋予设备足够的算力去应对未来越发增多的人工智能应用场景。我们预计在这个领域的深度学习的执行将更多的依赖于ASIC。

想脱单,找湾区人工智能

长按扫码撩海归

觉得不错, 请随意转发,麻烦点个在看!

人工智能产业链深度透析—基础层相关推荐

  1. 人工智能产业链深度透析-技术层

    如前文<人工智能产业链深度透析-基础层>所述,基础支撑层的算法创新发生在上世纪80年代末,是大数据和计算力将人工智能推到镁光灯之下,而建立在这之上的基础技术便是计算机视觉.语音识别和自然语 ...

  2. 人工智能产业链深度透析—产业应用医疗篇

    AI技术赋能医疗健康领域,使得医疗机构和人员的工作效率得到显著提高,医疗成本大幅降低,并且可以使人们做到科学有效的日常检测预防,更好地管理自身健康. 根据信通院ICT监测平台数据显示:近几年,AI+医 ...

  3. 人工智能全产业链深度透析--(综合)

    一.人工智能产业链 从人工智能的发展路径角度,可拆解人工智能产业链. 人工智能技术体系分为基础层.技术层与应用层,基础层最靠近"云",应用层最靠近"端". 1基 ...

  4. Linux 文件系统的工作原理深度透析

    磁盘为系统提供了最基本的持久化存储. 文件系统则在磁盘的基础上,提供了一个用来管理文件的树状结构. 那么,磁盘和文件系统是怎么工作的呢?又有哪些指标可以衡量它们的性能呢? 索引节点和目录项 文件系统, ...

  5. 2020年中国新基建人工智能产业链全景图深度分析汇总(附完整企业名单)

    来源:北京物联网智能技术应用协会 "新基建"是与传统基建相对应,结合新一轮科技革命和产业变革特征,面向国家战略需求,为经济社会的创新.协调.绿色.开放.共享发展提供底层支撑的具有乘 ...

  6. 人工智能产业链:2021年中国人工智能产业链图谱|产业链全景图

    近些年来,人工智能厚积薄发,在全球范围内掀起了科技企业竞争的风潮,受到了各界的关注.人工智能作为新一轮产业变革的核心驱动力,正在释放历次科技革命和产业变革的巨大能量.相比于互联网产业,我国人工智能发展 ...

  7. 人工智能发展趋势——深度AI科普调研团队

    人工智能的最新发展趋势 1956年的达特茅斯会议首次提出人工智能的定义:使一部机器的反应方式像一个人在行动时所依据的智能.经过超过半个世纪的发展,人工智能已经渡过了简单地模拟人类智能的阶段,发展为研究 ...

  8. 2020中国人工智能产业链企业图谱(名单)

    如今,"AI+"社会已步步临近,社会各界也正积极勾勒未来人工智能的完美图景. 国外人工智能巨头动作不断,在基础技术.应用领域方面都有诸多突破,可总结为三点:基础研究能力强.跨界创新 ...

  9. 【工业互联网】透析富士康上市:工业互联网不可错过的投资机会?

    本文系安信新三板诸海滨团队原创,注明来源,欢迎转载 透析富士康上市: 挖掘工业互联网的若干投资机会 --独角兽专题研究 报告回顾 主要观点 四十余年消费电子制造巨头崛起,智能制造助力IPO闪电过会 富 ...

最新文章

  1. 热门解读:大促的活动设计及效果评估的优化
  2. laravel静态资源
  3. Apache Drill 1.4性能增强的简要概述
  4. 第三十八期:用Git帮助写作者更好地完成工作
  5. 禁止访问磁盘的注册表
  6. 数组、链表、哈希……Qt中丰富的容器类
  7. 严蔚敏算法约瑟夫环_极客算法训练笔记(三),链表详细图解,别再逃避了朋友...
  8. Bailian3143 验证“歌德巴赫猜想”【筛选法】
  9. 【NOIP2012】【Luogu1080】国王游戏(贪心,邻项交换)
  10. 简单批处理内部命令简介(转)
  11. voc数据集转换为txt
  12. atitit.提升开发效率---使用服务器控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比较
  13. crc java_求这个CRC16算法的java版实现!!!
  14. unity3D【全版本】设置中文
  15. 【北京迅为】i.MX6ULL终结者硬件资源说明
  16. 同比 数据模型 环比_使用数据分析软件进行同比和环比数据分析
  17. 机械键盘恢复出厂fn_机械键盘使用说明
  18. 关于 试图加载格式不正确的程序。 (异常来自 HRESULT:0x8007000B) 的 解决方法
  19. 白泽四足机器人Opencat玩法之——校准关节和陀螺仪
  20. C语言利用二叉树的操作实现根据给定的字符串生成二叉树并前序、中序、后序输出二叉树。

热门文章

  1. xp系统服务器dns怎么设置在哪里设置,xp系统DNS怎么设置 DNS设置步骤
  2. 《深入理解 Spring Cloud 与微服务构建》第十章 路由网关 Spring Cloud Zuul
  3. nginx实现https网站设置
  4. 熟悉HBase基本操作
  5. 【JQuery】jQuery中的常用方法小结
  6. css清除浮动的集中方法
  7. 《TCP/IP详解》读书笔记
  8. 自己实现一个右滑删除的ListView
  9. Leetcode:convert_sorted_array_to_binary_search_tree
  10. PowerDesigner逆向工程从现有数据库生成PDM