华为达芬奇AI芯片架构
达芬奇架构是基于AI计算功能设计的,并基于高性能3D Cube计算引擎,极大地提高了计算能力和功耗比。
根据达芬奇架构,进行了以下优化:
多核堆栈用于并行计算能力扩展
通过设计片上存储器 on-chip memory(高速缓存/缓冲区Cache/Buffer)以缩短Cube操作和存储距离,减少了对DDR的访问,并减轻了冯·诺依曼的瓶颈问题。
在计算和外部存储之间设计了高带宽片外存储器(HBM),以克服计算资源共享存储器的访问速度限制。
为了支持大规模的云侧神经网络训练,设计了超高频段网状网络(LSU),以互连多个多维数据集扩展芯片。
总而言之,达芬奇体系结构具有以下三个features:
**
1. Unified Architecture
支持从tens of milliwatts to hundreds of watts 的全场景AI系列芯片。
2. Scalable Computing
- 每个AI内核可以在一个时钟周期内完成4096个MAC操作。
- 灵活的多核堆栈,可扩展的多维数据集:16 x 16 x N,N = 16/8/4/2/1
- 在训练和推理方案中支持多种混合精度(int8 / int32 / FP16 / FP32)和数据精度要求。
- 集成张量,矢量和标量计算单位。
3. 可扩展的片上互连Scalable Memory
用于特定和分布式,显式控制的内存分配设计
4 TByte / s L2缓冲区
1.2 TB / s HBM高带宽内存
4. 可扩展的片上互连******On-chip Interconnection
超高带宽片上网状网络[Ultra-high bandwidth on-chip mesh network (LSU)]
基于达芬奇的创新架构,华为首次发布了7 nm Ascend 910(Ascend-Max)和12 nm Ascend-Mini(Ascend 310)。 Ascend 910是世界上最大的单芯片计算密度。 支持在云端进行分布式大规模培训。 如果集成了1024个Ascend 910,则将创建全球最大的AI计算集群,提供256P的性能。 无论模型多么复杂,都可以轻松地对其进行训练。
基于达芬奇架构,华为还计划了适用于蓝牙耳机,智能手机和可穿戴设备的Ascend Ascend芯片系列(Nano,Tiny和Lite)。 将来,Ascend Ascend芯片系列将以IP模式与其他芯片集成在一起,以服务各种智能产品。
此外,达芬奇AI芯片架构还考虑了软件定义的AI芯片的功能。 CANN是用于芯片的高度自动化的操作员开发工具。 它是为神经网络定制的计算架构。 CANN将开发效率提高了三倍。 除效率外,还考虑了操作员绩效以适应AI应用程序的快速发展。
transfer from:
https://forum.huawei.com/enterprise/en/huawei-da-vinci-ai-chip-architecture/thread/616780-895
华为达芬奇AI芯片架构相关推荐
- 华为达芬奇架构到底好在哪里?
华为达芬奇架构好在哪里?从使用效果看,我们华为手机的AI能力就能体现实实在在的好效果.如果从技术角度看,达芬奇架构可以在同样的单位功耗下提供更多的AI算力.而现在的科技时代正是人工智能AI快速发展的时 ...
- ▷Scratch资讯丨华为达芬奇计划
华为达芬奇计划 华为内部"达芬奇计划"首次曝光:该计划旨在将AI带入华为所有的产品和服务中,最首要的一步,就是开发用于数据中心的AI芯片,挑战英伟达!华为内部已经制定了代号&quo ...
- 华为“达芬奇计划”首次曝光!
据外媒 The Information 报道,华为目前正在开展一个代号为达芬奇计划"Project Da Vinci"的新项目! "达芬奇计划"旨在将AI带入华 ...
- 外媒曝华为“达芬奇计划” 或对英伟达构成威胁
关注网易智能,聚焦AI大事件,读懂下一个大时代! [网易智能讯 7月13日消息]据外媒the information报道,华为目前正在开展一个代号为达芬奇计划"Project Da Vinc ...
- 深度解读达芬奇架构:华为AI芯片的“秘密武器”
本文转自华为官网 2019年6月,华为发布全新8系列手机SoC芯片麒麟810,首次采用华为自研达芬奇架构NPU,实现业界领先端侧AI算力,在业界公认的苏黎世联邦理工学院推出的AI Benchmark榜 ...
- 华为麒麟810芯片鸿蒙,华为发布全新人工智能手机芯片麒麟810!采用自研达芬奇架构NPU...
6月21日,华为于武汉召开新品发布会,正式推出次旗舰nova 5系列新品手机.在此次发布会上,华为手机产品线总裁何刚表示,截止2019年5月30日,华为手机年度全球发货量达到了1亿台.首先亮相发布会的 ...
- 基于TI Davinci架构的双核嵌入式应用处理器OMAPL138开发入门(TI达芬奇双核开发资料 [
基于TI Davinci架构的双核嵌入式应用处理器OMAPL138开发入门 一.简介 TI的达芬奇架构嵌入式应用处理器使用DSP与ARM结合的非对称多核结构,当然现在也有管脚全兼容的单核.本文要介绍的 ...
- 阿里含光 VS 华为昇腾:AI芯片路在何方
含光 2019年9月25日,阿里在云栖大会上推出了AI推理芯片--含光800. 基于含光800的AI云服务也在发布当天同步上线. 含光800表现 含光800的峰值性能为78563 IPS(每秒能处理7 ...
- 【转】一张图详解华为昇腾310 AI芯片:自研达芬奇架构 算力和能效比大幅提升
转自:http://www.twoeggz.com/news/11598502.html 10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案.与此同时,华为发布了自研云 ...
- 华为发布7nm制程麒麟810芯片:自研达芬奇架构 nova5首搭
昨日华为消费者业务手机产品线总裁何刚在武汉发布了华为麒麟810芯片,该芯片采用7nm制程,采用了华为自研的达芬奇架构的NPU. 据华为方面介绍,麒麟810采用7nm工艺制程,相比8nm工艺,能效提升2 ...
最新文章
- MPLS *** 高级教程(张洋讲解演示版)
- HTTP metadata数据
- 能量时域空间物理_5G新在哪儿(11)-下行公共物理控制信道
- 数据结构源码笔记(C语言):Josephus问题之循环链接表
- 神策 2020 数据驱动用户大会:新愿景 + 新定位 + 新舰队正式亮相!
- 当浏览器窗口大小改变时,设置显示内容的高度
- oracle两种用户认证方式
- 孙鑫VC学习笔记:第三讲 MFC应用程序框架
- 计算机学院实验室安全管理办法,江苏大学计算机学院实验室安全管理制度
- App拉起:h5打开app指定页面
- 工程结算的23个问题及技巧
- CVPR 2022 | UniDet:通用的多数据集目标检测
- 【processing】Daniel Shiffman编程挑战题解、思维介绍及代码(1)穿越星际效果编译
- https://mp.weixin.qq.com/s?__biz=MzkxNTIzODIxNQ==tempkey=MTEwOV9qbGlub091aVlKb1NtOVZKV3lTcHgwd3U0NG
- Python实现海洋测绘基于最小二乘法的潮汐调和分析
- winnt.h的错误解决办法
- markdown 转word
- 维深集团荣获2004年物流与采购信息化优秀方案大奖
- 基于ssm的crm系统开源_基于云的CRM软件工具
- 密钥生成工具类:RSA2 256位 加解密工具类 RsaUtils
热门文章
- 一带一路专题:农业、经济、地理距离、友好城市等七大维度面板数据
- 基于Springboot+MyBatisPlus+Vue前后端分离大学生毕业论文答辩系统
- seige压力测试用法
- 区块链中的哈希到底是什么?
- android高帧率模式,《和平精英》等五款游戏已经适配小米10系列高帧率模式
- R语言入门:使用函数sample进行抽样
- 安师大计算机专业排名多少,安师大的计算机专业怎么样
- 简单行人疏散 Java版
- 第二章 认识的本质及其规律笔记
- 经验10年搞不过卖烧烤的!后入阿里我软件测试是怎么学废的,这些话我想送给一事无成的自学测试们...