英伟达开源深度学习加速器介绍
数字逻辑设计的开源项目非常少,这一方面是因为门槛比较高,学生很难验证学习;另一方面是项目迭代反馈的周期很长。比较有名的开源代码网站当属OpenCore,它的官方网站是:https://opencores.org/,不过逛过的同学也发现其实开源的项目还是非常少的,只有基本的FFT、LMS算法等,鲜少大型开源项目。目前来说最有名的开源数字逻辑项目就是RISC-V微处理器项目了,官方网站是https://riscv.org/,不过该项目是使用伯克利大学自己开发的类似scala语言的chisel语言。
现如今开源数字逻辑设计除了RISC-V微处理器,还有一个重量级玩家,那就是英伟达,它在2017年9月正式开源深度学习加速器,官方地址为http://nvdla.org/。开源代码的地址是https://github.com/nvdla/。其中sw是软件代码,hw是硬件代码。hw包括了c++建模代码(cmod)和verilog(vmod)实现代码,vmod/nvdla就是核心实现代码了,vmod/rams是NVDLA使用的RAM模型代码。
英伟达官方提供的NVDLA结构图
NVDLA其实就是一个卷积神经网络加速器(只能推断,并不能进行训练),它还需要外部的CPU和内存单元才能完整驱动整个加速器,CPU通中断和CSB总线控制NVDLA加速器。http://nvdla.org/primer.html大致介绍了NVDLA的基本框架,http://nvdla.org/hw/v1/hwarch.html介绍了硬件实现的框架,http://nvdla.org/hw/contents.html是硬件的介绍手册。NVDLA的设计本身并没有特别创新之处,主要有卷积、池化、非线性激活函数操作等运算,为了降低带宽,权重阈值还进行了压缩。卷积加速使用MAC单元,可以支持多种模式,包括直接卷积,Winograd方法,某些非线性激活函数使用LUT实现,可编程配置。看它的源代码,发现它的部分运算单元的RTL代码貌似是生成的,不是人写的,调试仿真的代码比较具有参考性,可以看看大公司是怎么仿真验证的,但是注释也不是很多,阅读起来比较累。
NVDLA可以在FPGA上实现(最初在十几个FPGA上实现的),官方推荐了亚马逊云计算的FPGA平台,目前不知道已经完成到什么地步了,按照国外论坛的问题,完整版本的NVDLA似乎还是无法在单片FPGA上实现,基本都是分开在几片FPGA上实现。国内也有人在FPGA平台上实现了,居然有人使用Xilinx的VC707平台进行仿真调试还做了视频上传到B站上。。。https://www.bilibili.com/video/av16833656,简直丧心病狂。
英伟达开源深度学习加速器介绍相关推荐
- NVIDIA英伟达:深度学习服务器搭建指南 | 交流会笔记
主讲人:Ken(何琨)| NVIDIA开发者社区经理 张康 屈鑫 编辑整理 量子位 出品 | 公众号 QbitAI 7月21日,量子位联合NVIDIA英伟达举行了线下交流会,跟现场近百位开发者同学共同 ...
- 实测 | 英伟达A100深度学习性能:训练速度高达V100的3.5倍!
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习> ...
- 震撼!英伟达用深度学习做图像修复,毫无ps痕迹
在计算机视觉研究领域,NVIDIA常常让人眼前一亮. 比如"用Progressive Growing的方式训练 GAN,生成超逼真高清图像","用条件 GAN 进行 20 ...
- 英伟达开源自动驾驶AI算法,升级芯片性能7倍于Xavier
2019-12-18 13:24:27 乾明 编辑整理 量子位 报道 | 公众号 QbitAI 一年一度,英伟达GTC China如期举办. 今年的英伟达创始人黄仁勋,对自动驾驶极为关注. 不仅发布 ...
- 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架
https://cloud.tencent.com/developer/article/1119468 目录 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架 使用 NVDLA 加 ...
- 快速图像增强的简便大法来了,英伟达开源新库代号“DALI”| CVPR 18
林鳞 编译整理 量子位 出品 | 公众号 QbitAI 又有新的开源库来了,英伟达出品,数量×2. 正在举行的CVPR 2018大会上,英伟达开源了数据增强库NVIDIA DALI和图像解码库NVID ...
- 【AI 简报20201018期】英伟达开源「Imaginaire」、智能手表争夺战是如何打响的?
导读:本期为 AI 简报 20201018期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 8 条,希望对您有所帮助~ 有更好的建议或者意见请在下方留言~ AI 1. 图神经网络新课 ...
- AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍
AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍 深度学习框架 深度学习框架优势 深度学习框架设计思路 飞桨开源深度学习平台 飞桨开源深度学习平台全景 框架和全流程工具 模 ...
- AI + 3D!英伟达开源3D深度学习框架Kaolin
点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...
最新文章
- STL标准库六大组件
- 关于反爬虫,看这一篇就够了 1
- obj是什么意思_为什么要学正则表达式 - 3
- 记Booking.com iOS开发岗位线上笔试
- chrome浏览器最小字号解决方案
- 第三次学JAVA再学不好就吃翔(part44)--匿名内部类
- SQL注入-基于MySQL的注入提权(十七)
- 本地连接虚拟机 Oracle数据库 报ORA-12541:TNS:no listener
- php限制只能中文,php如何实现一个账号只能有一个人登录
- java printstream 覆盖了_Java PrintStream clearError()方法与示例
- 洛谷——P1320 压缩技术(续集版)
- ubuntu下安装最新 版jre 7
- Linked List Cycle | ||
- 帆软超级链接使用(根据内容跳转不同页面、超级链接使用js并传参、超级链接参数传递)
- Moebius for SQLServer负载均衡
- 什么是设计模式?为什么要使用设计模式?有什么好处?
- element-ui下载文件功能
- ORDER: OpenWorld Object Detection on Road Scenes
- CMA资质认定和CNAS实验室认可的区别有哪些?
- 网约车,于无声处听惊雷