达芬奇架构是基于AI计算功能设计的,并基于高性能3D Cube计算引擎,极大地提高了计算能力和功耗比。
根据达芬奇架构,进行了以下优化:

多核堆栈用于并行计算能力扩展
通过设计片上存储器 on-chip memory(高速缓存/缓冲区Cache/Buffer)以缩短Cube操作和存储距离,减少了对DDR的访问,并减轻了冯·诺依曼的瓶颈问题。
在计算和外部存储之间设计了高带宽片外存储器(HBM),以克服计算资源共享存储器的访问速度限制。
为了支持大规模的云侧神经网络训练,设计了超高频段网状网络(LSU),以互连多个多维数据集扩展芯片。
总而言之,达芬奇体系结构具有以下三个features:
**

1. Unified Architecture

支持从tens of milliwatts to hundreds of watts 的全场景AI系列芯片。

2. Scalable Computing

  1. 每个AI内核可以在一个时钟周期内完成4096个MAC操作。
  2. 灵活的多核堆栈,可扩展的多维数据集:16 x 16 x N,N = 16/8/4/2/1
  3. 在训练和推理方案中支持多种混合精度(int8 / int32 / FP16 / FP32)和数据精度要求。
  4. 集成张量,矢量和标量计算单位。

3. 可扩展的片上互连Scalable Memory
用于特定和分布式,显式控制的内存分配设计

4 TByte / s L2缓冲区

1.2 TB / s HBM高带宽内存

4. 可扩展的片上互连******On-chip Interconnection

超高带宽片上网状网络[Ultra-high bandwidth on-chip mesh network (LSU)]

基于达芬奇的创新架构,华为首次发布了7 nm Ascend 910(Ascend-Max)和12 nm Ascend-Mini(Ascend 310)。 Ascend 910是世界上最大的单芯片计算密度。 支持在云端进行分布式大规模培训。 如果集成了1024个Ascend 910,则将创建全球最大的AI计算集群,提供256P的性能。 无论模型多么复杂,都可以轻松地对其进行训练。

基于达芬奇架构,华为还计划了适用于蓝牙耳机,智能手机和可穿戴设备的Ascend Ascend芯片系列(Nano,Tiny和Lite)。 将来,Ascend Ascend芯片系列将以IP模式与其他芯片集成在一起,以服务各种智能产品。

此外,达芬奇AI芯片架构还考虑了软件定义的AI芯片的功能。 CANN是用于芯片的高度自动化的操作员开发工具。 它是为神经网络定制的计算架构。 CANN将开发效率提高了三倍。 除效率外,还考虑了操作员绩效以适应AI应用程序的快速发展。

transfer from:
https://forum.huawei.com/enterprise/en/huawei-da-vinci-ai-chip-architecture/thread/616780-895

华为达芬奇AI芯片架构相关推荐

  1. 华为达芬奇架构到底好在哪里?

    华为达芬奇架构好在哪里?从使用效果看,我们华为手机的AI能力就能体现实实在在的好效果.如果从技术角度看,达芬奇架构可以在同样的单位功耗下提供更多的AI算力.而现在的科技时代正是人工智能AI快速发展的时 ...

  2. ▷Scratch资讯丨华为达芬奇计划

    华为达芬奇计划 华为内部"达芬奇计划"首次曝光:该计划旨在将AI带入华为所有的产品和服务中,最首要的一步,就是开发用于数据中心的AI芯片,挑战英伟达!华为内部已经制定了代号&quo ...

  3. 华为“达芬奇计划”首次曝光!

    据外媒 The Information 报道,华为目前正在开展一个代号为达芬奇计划"Project Da Vinci"的新项目! "达芬奇计划"旨在将AI带入华 ...

  4. 外媒曝华为“达芬奇计划” 或对英伟达构成威胁

    关注网易智能,聚焦AI大事件,读懂下一个大时代! [网易智能讯 7月13日消息]据外媒the information报道,华为目前正在开展一个代号为达芬奇计划"Project Da Vinc ...

  5. 深度解读达芬奇架构:华为AI芯片的“秘密武器”

    本文转自华为官网 2019年6月,华为发布全新8系列手机SoC芯片麒麟810,首次采用华为自研达芬奇架构NPU,实现业界领先端侧AI算力,在业界公认的苏黎世联邦理工学院推出的AI Benchmark榜 ...

  6. 华为麒麟810芯片鸿蒙,华为发布全新人工智能手机芯片麒麟810!采用自研达芬奇架构NPU...

    6月21日,华为于武汉召开新品发布会,正式推出次旗舰nova 5系列新品手机.在此次发布会上,华为手机产品线总裁何刚表示,截止2019年5月30日,华为手机年度全球发货量达到了1亿台.首先亮相发布会的 ...

  7. 基于TI Davinci架构的双核嵌入式应用处理器OMAPL138开发入门(TI达芬奇双核开发资料 [

    基于TI Davinci架构的双核嵌入式应用处理器OMAPL138开发入门 一.简介 TI的达芬奇架构嵌入式应用处理器使用DSP与ARM结合的非对称多核结构,当然现在也有管脚全兼容的单核.本文要介绍的 ...

  8. 阿里含光 VS 华为昇腾:AI芯片路在何方

    含光 2019年9月25日,阿里在云栖大会上推出了AI推理芯片--含光800. 基于含光800的AI云服务也在发布当天同步上线. 含光800表现 含光800的峰值性能为78563 IPS(每秒能处理7 ...

  9. 【转】一张图详解华为昇腾310 AI芯片:自研达芬奇架构 算力和能效比大幅提升

    转自:http://www.twoeggz.com/news/11598502.html 10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案.与此同时,华为发布了自研云 ...

  10. 华为发布7nm制程麒麟810芯片:自研达芬奇架构 nova5首搭

    昨日华为消费者业务手机产品线总裁何刚在武汉发布了华为麒麟810芯片,该芯片采用7nm制程,采用了华为自研的达芬奇架构的NPU. 据华为方面介绍,麒麟810采用7nm工艺制程,相比8nm工艺,能效提升2 ...

最新文章

  1. MPLS *** 高级教程(张洋讲解演示版)
  2. HTTP metadata数据
  3. 能量时域空间物理_5G新在哪儿(11)-下行公共物理控制信道
  4. 数据结构源码笔记(C语言):Josephus问题之循环链接表
  5. 神策 2020 数据驱动用户大会:新愿景 + 新定位 + 新舰队正式亮相!
  6. 当浏览器窗口大小改变时,设置显示内容的高度
  7. oracle两种用户认证方式
  8. 孙鑫VC学习笔记:第三讲 MFC应用程序框架
  9. 计算机学院实验室安全管理办法,江苏大学计算机学院实验室安全管理制度
  10. App拉起:h5打开app指定页面
  11. 工程结算的23个问题及技巧
  12. CVPR 2022 | UniDet:通用的多数据集目标检测
  13. 【processing】Daniel Shiffman编程挑战题解、思维介绍及代码(1)穿越星际效果编译
  14. https://mp.weixin.qq.com/s?__biz=MzkxNTIzODIxNQ==tempkey=MTEwOV9qbGlub091aVlKb1NtOVZKV3lTcHgwd3U0NG
  15. Python实现海洋测绘基于最小二乘法的潮汐调和分析
  16. winnt.h的错误解决办法
  17. markdown 转word
  18. 维深集团荣获2004年物流与采购信息化优秀方案大奖
  19. 基于ssm的crm系统开源_基于云的CRM软件工具
  20. 密钥生成工具类:RSA2 256位 加解密工具类 RsaUtils

热门文章

  1. 一带一路专题:农业、经济、地理距离、友好城市等七大维度面板数据
  2. 基于Springboot+MyBatisPlus+Vue前后端分离大学生毕业论文答辩系统
  3. seige压力测试用法
  4. 区块链中的哈希到底是什么?
  5. android高帧率模式,《和平精英》等五款游戏已经适配小米10系列高帧率模式
  6. R语言入门:使用函数sample进行抽样
  7. 安师大计算机专业排名多少,安师大的计算机专业怎么样
  8. 简单行人疏散 Java版
  9. 第二章 认识的本质及其规律笔记
  10. 经验10年搞不过卖烧烤的!后入阿里我软件测试是怎么学废的,这些话我想送给一事无成的自学测试们...