来源:OFweek人工智能网

4月19日,有消息称,阿里巴巴达摩院正在研发一款神经网络芯片——Ali-NPU,主要运用于图像视频分析、机器学习等AI推理计算。按照设计,这款芯片性能将是目前市面上主流CPU、GPU架构AI芯片的10倍,而制造成本和功耗仅为一半,其性价比超过40倍。

事实上,随着人工智能产业的发展,CPU、GPU、TPU、DPU、NPU、BPU……各种PU也开始爆发式出现。那么,究竟这些PU在性能和使用上有何异同,又有哪些优劣呢?

CPU:计算力占据部分很小 擅长逻辑控制

CPU是最为普遍,最为常见的中央处理器。主要包括运算器(ALU)和控制单元(CU),除此之外还包括若干寄存器、高速缓存器和它们之间通讯的数据、控制及状态的总线。依循冯诺依曼架构,CPU需要大量空间放置存储单元和控制逻辑,计算能力只占据很小的部分,更擅长逻辑控制。

CPU结构简化图


GPU:计算单元数量众多 但无法单独使用

GPU的诞生可以解决CPU在计算能力上的天然缺陷。采用数量众多的计算单元和超长的流水线,善于处理图像领域的运算加速。但GPU的缺陷也很明显,即无法单独工作,必须由CPU进行控制调用才能工作。

CPU、GPU微架构对比图

TPU:高性能低功耗 然则开发周期长、转换成本高

谷歌专门为 TensorFlow 深度学习框架定制的TPU,是一款专用于机器学习的芯片。TPU可以提供高吞吐量的低精度计算,用于模型的前向运算而不是模型训练,且能效更高。但它的缺陷主要是开发周期长、可配置性能有限,缺乏灵活性且转换成本高。

DPU:可实现快速开发与产品迭代

国际上,Wave Computing最早提出DPU。在国内,DPU最早是由深鉴科技提出,是基于Xilinx可重构特性的FPGA芯片,设计专用深度学习处理单元,且可以抽象出定制化的指令集和编译器,从而实现快速的开发与产品迭代。

深鉴“雨燕”DPU平台

NPU:运行效率提升 不支持大样本训练

NPU是神经网络处理器,在电路层模拟人类神经元和突触,并且用深度学习指令集直接处理大规模的神经元和突触,一条指令完成一组神经元的处理。相比于CPU和GPU的冯诺伊曼结构,NPU通过突触权重实现存储和计算一体化,从而提高运行效率。但NPU也有自身的缺陷,比如不支持对大量样本的训练。

BPU:比在CPU上用软件实现更为高效 不可再编程

BPU是由地平线主导的嵌入式处理器架构。第一代是高斯架构,第二代是伯努利架构,第三代是贝叶斯架构。BPU主要是用来支撑深度神经网络,比在CPU上用软件实现更为高效。然而,BPU一旦生产,不可再编程,且必须在CPU控制下使用。

从CPU、GPU的市场来看,已经基本被英特尔、英伟达和AMD三分天下。而在ASIC框架下的TPU,只有谷歌的体量和实力才有开发专用加速的动力。

推出DPU的深鉴科技有清华和斯坦福双重学术背景,公司目前的两条发展路线是:以芯片技术为主的纯技术路线,以及基于技术的产品路线。其处理器做深度学习应用端,不做训练端。目前,其深度压缩技术可以将神经网络压缩数十倍而不影响精度,还可以使用芯片存储深度学习算法模型,减少内存读取次数,降低运行功耗。

去年底,地平线在创办两年后终于发布首款芯片——“征程”与“旭日”。目前,这两款处理器都属于嵌入式人工智能视觉芯片,分别面向智能驾驶和智能摄像头。2018年CES上,英特尔和地平线还发布了基于伯努利架构的新一代征程处理器,其发展路径图为:2018年,感知;2019年,建模;2020年,决策。

而因为与英特尔的合作,地平线不禁让市场联想到英特尔早前重金收购的Mobileye。在嵌入式人工智能领域,Mobileye是业界领头羊。地平线在英特尔的定位版图是否是中国版Mobileye?但其创始人余凯的抱负是,地平线是要做中国的英特尔。

相较而言,阿里在三家中最为热衷芯片布局,上述包括寒武纪、深鉴科技均有阿里参投。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

“芯痛”之下阿里苦心研发NPU AI芯片究竟哪款PU更厉害?相关推荐

  1. 阿里平头哥研发专用 SoC 芯片;部分 MacBook Pro 被禁止上飞机;VS Code 1.37 发布 | 极客头条...

    快来收听极客头条音频版吧,智能播报由标贝科技提供技术支持. 「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有 ...

  2. 小米高管:已投大量精力研发手机AI芯片,造不造还没定

    原作 Arjun Kharpal Root 编译自 CNBC 量子位 报道 | 公众号 QbitAI 小米国际业务负责人,王翔,今天在MWC移动世界大会召开前接受CNBC采访时表示,该公司正在探索人工 ...

  3. 刷爆了!BAT这场AI芯片之战,你更支持谁​?

    刚刚,云栖大会现场,阿里巴巴集团CTO.达摩院院长张建锋向全场展示了含光800--阿里第一款AI芯片. 为了这款芯片,阿里一年前放下狠话,但谁也没想到一年后即亮相:不仅完成流片,还已在阿里云上正式上线 ...

  4. 阿里文娱首次公开!AI 如何对爆款内容未卜先知?

    阿里妹导读:文娱内容很难有完整的量化指标体系,内容的复杂性决定了文娱产品的不确定性.我们如何利用AI+大数据能力,建造文娱的内容认知大脑?串联内容全生命周期,实现对内容.流量.宣推等的"未卜 ...

  5. 阿里达摩院自主研发AI芯片 布局“中国芯”

    阿里巴巴达摩院正研发一款神经网络芯片--Ali-NPU,该芯片将运用于图像视频分析.机器学习等AI推理计算. 此款芯片的研发,未来将会更好的实现AI智能在商业场景中的运用,提升运算效率.降低成本. 阿 ...

  6. 阿里巴巴宣布正自主研发AI芯片,性价比是同类产品40倍

    李根 发自 凹非寺  量子位 报道 | 公众号 QbitAI 中国芯的消息,最近紧紧牵动每一个中国人的心. 今天,阿里对外透露了芯片研发的最新进展:阿里巴巴达摩院正研发一款神经网络芯片--Ali-NP ...

  7. 聚焦“芯”产业,搭建“芯”桥梁——清微智能出席AIIA2020年度AI芯片交流会

    2020年7月30日,以"聚焦'芯'产业,搭建'芯'桥梁"为主题的"2020年度AI芯片交流会"在北京市海淀区永丰产业基地设计园举办.会议由中国人工智能产业发展 ...

  8. 深度 | AI芯片终极之战

    深度 | AI芯片终极之战 https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652712307&idx=1&sn= ...

  9. AI芯片技术市场思考

    AI芯片技术市场思考 参考文献连接 https://mp.weixin.qq.com/s/qYv3EpZiYlld7FV-bnvSEw https://mp.weixin.qq.com/s/kQ3XF ...

最新文章

  1. YARN中的失败分析
  2. kafka记录及面试题
  3. 程序员必备 Git 分支开发规范指南
  4. 用集合实现二分(折半)查找
  5. IOError: encoder jpeg not available
  6. 淘宝店铺类目怎么删除
  7. SSH 命令的11种用法
  8. imagecopyresampled要生成彩色却生成了灰色图片
  9. python控制蓝牙pybluez_Python之蓝牙通讯模块pybluez学习笔记
  10. 设置电脑 保护视力 还有桌面默认颜色
  11. arcgis html图像标记,图片标记
  12. bestCoder 百度之星程序设计资格赛 1005下棋
  13. 打破校史!「双非」高校,首发 Science
  14. 快速排序深度优化详解
  15. 《协整理论与波动模型-金融时间序列分析及应用(第二版)》
  16. Windows电脑桌面透明云便签怎么自定义设置便签快捷键?
  17. 前端框架:jQuery
  18. ​人和人之间的差距在哪里?
  19. web自动化测试理论之selenium八大定位 -(2)
  20. 一对一直播系统源码——如何只需三步搭建

热门文章

  1. 独家 | 2种数据科学编程中的思维模式,了解一下(附代码)
  2. 支持实践教学:清华大数据能力提升项目举办CIKM AnalytiCup2017冠军团队经验分享会
  3. 重磅!Science 上海交大发布最新“全世界最前沿的125个科学问题”!
  4. 2021中国大学排名发布:北京大学连续14年位居榜首
  5. 涨点明显 | 全面刷新COCO检测和分割Top-1(附论文下载)
  6. SAP QM初阶之检验批系统状态中的CTCM该如何消除?
  7. SAP RETAIL 如何查看分配表是参考哪个PO来创建的?
  8. RPA有哪些优点和缺点?
  9. 避免神经网络过拟合的5种技术
  10. SAP HU上面的'Obj.to Which HU Belongs'栏位初探