数字逻辑设计的开源项目非常少,这一方面是因为门槛比较高,学生很难验证学习;另一方面是项目迭代反馈的周期很长。比较有名的开源代码网站当属OpenCore,它的官方网站是:https://opencores.org/,不过逛过的同学也发现其实开源的项目还是非常少的,只有基本的FFT、LMS算法等,鲜少大型开源项目。目前来说最有名的开源数字逻辑项目就是RISC-V微处理器项目了,官方网站是https://riscv.org/,不过该项目是使用伯克利大学自己开发的类似scala语言的chisel语言。

现如今开源数字逻辑设计除了RISC-V微处理器,还有一个重量级玩家,那就是英伟达,它在2017年9月正式开源深度学习加速器,官方地址为http://nvdla.org/。开源代码的地址是https://github.com/nvdla/。其中sw是软件代码,hw是硬件代码。hw包括了c++建模代码(cmod)和verilog(vmod)实现代码,vmod/nvdla就是核心实现代码了,vmod/rams是NVDLA使用的RAM模型代码。

英伟达官方提供的NVDLA结构图

NVDLA其实就是一个卷积神经网络加速器(只能推断,并不能进行训练),它还需要外部的CPU和内存单元才能完整驱动整个加速器,CPU通中断和CSB总线控制NVDLA加速器。http://nvdla.org/primer.html大致介绍了NVDLA的基本框架,http://nvdla.org/hw/v1/hwarch.html介绍了硬件实现的框架,http://nvdla.org/hw/contents.html是硬件的介绍手册。NVDLA的设计本身并没有特别创新之处,主要有卷积、池化、非线性激活函数操作等运算,为了降低带宽,权重阈值还进行了压缩。卷积加速使用MAC单元,可以支持多种模式,包括直接卷积,Winograd方法,某些非线性激活函数使用LUT实现,可编程配置。看它的源代码,发现它的部分运算单元的RTL代码貌似是生成的,不是人写的,调试仿真的代码比较具有参考性,可以看看大公司是怎么仿真验证的,但是注释也不是很多,阅读起来比较累。

NVDLA可以在FPGA上实现(最初在十几个FPGA上实现的),官方推荐了亚马逊云计算的FPGA平台,目前不知道已经完成到什么地步了,按照国外论坛的问题,完整版本的NVDLA似乎还是无法在单片FPGA上实现,基本都是分开在几片FPGA上实现。国内也有人在FPGA平台上实现了,居然有人使用Xilinx的VC707平台进行仿真调试还做了视频上传到B站上。。。https://www.bilibili.com/video/av16833656,简直丧心病狂。

英伟达开源深度学习加速器介绍相关推荐

  1. NVIDIA英伟达:深度学习服务器搭建指南 | 交流会笔记

    主讲人:Ken(何琨)| NVIDIA开发者社区经理 张康 屈鑫 编辑整理 量子位 出品 | 公众号 QbitAI 7月21日,量子位联合NVIDIA英伟达举行了线下交流会,跟现场近百位开发者同学共同 ...

  2. 实测 | 英伟达A100深度学习性能:训练速度高达V100的3.5倍!

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习> ...

  3. 震撼!英伟达用深度学习做图像修复,毫无ps痕迹

    在计算机视觉研究领域,NVIDIA常常让人眼前一亮. 比如"用Progressive Growing的方式训练 GAN,生成超逼真高清图像","用条件 GAN 进行 20 ...

  4. 英伟达开源自动驾驶AI算法,升级芯片性能7倍于Xavier

    2019-12-18 13:24:27 乾明 编辑整理  量子位 报道 | 公众号 QbitAI 一年一度,英伟达GTC China如期举办. 今年的英伟达创始人黄仁勋,对自动驾驶极为关注. 不仅发布 ...

  5. 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架

    https://cloud.tencent.com/developer/article/1119468 目录 业界 | 英伟达开源硬件加速项目NVDLA:一种标准化的推断加速框架 使用 NVDLA 加 ...

  6. 快速图像增强的简便大法来了,英伟达开源新库代号“DALI”| CVPR 18

    林鳞 编译整理 量子位 出品 | 公众号 QbitAI 又有新的开源库来了,英伟达出品,数量×2. 正在举行的CVPR 2018大会上,英伟达开源了数据增强库NVIDIA DALI和图像解码库NVID ...

  7. 【AI 简报20201018期】英伟达开源「Imaginaire」、智能手表争夺战是如何打响的?

    导读:本期为 AI 简报 20201018期,将为您带来过去一周关于 AI 新闻 9 条,其他互联网圈内新闻 8 条,希望对您有所帮助~ 有更好的建议或者意见请在下方留言~ AI 1. 图神经网络新课 ...

  8. AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍

    AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍 深度学习框架 深度学习框架优势 深度学习框架设计思路 飞桨开源深度学习平台 飞桨开源深度学习平台全景 框架和全流程工具 模 ...

  9. AI + 3D!英伟达开源3D深度学习框架Kaolin

    点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...

最新文章

  1. STL标准库六大组件
  2. 关于反爬虫,看这一篇就够了 1
  3. obj是什么意思_为什么要学正则表达式 - 3
  4. 记Booking.com iOS开发岗位线上笔试
  5. chrome浏览器最小字号解决方案
  6. 第三次学JAVA再学不好就吃翔(part44)--匿名内部类
  7. SQL注入-基于MySQL的注入提权(十七)
  8. 本地连接虚拟机 Oracle数据库 报ORA-12541:TNS:no listener
  9. php限制只能中文,php如何实现一个账号只能有一个人登录
  10. java printstream 覆盖了_Java PrintStream clearError()方法与示例
  11. 洛谷——P1320 压缩技术(续集版)
  12. ubuntu下安装最新 版jre 7
  13. Linked List Cycle | ||
  14. 帆软超级链接使用(根据内容跳转不同页面、超级链接使用js并传参、超级链接参数传递)
  15. Moebius for SQLServer负载均衡
  16. 什么是设计模式?为什么要使用设计模式?有什么好处?
  17. element-ui下载文件功能
  18. ORDER: OpenWorld Object Detection on Road Scenes
  19. CMA资质认定和CNAS实验室认可的区别有哪些?
  20. 网约车,于无声处听惊雷

热门文章

  1. MySQL第三次作业-----单表查询和多表查询
  2. Golang Gob编码(gob包的使用)
  3. 游戏大师约翰·卡麦克
  4. 微信开发者工具如何集成SVN、同时解决集成SVN无效果的问题
  5. 有关win7 设备管理器空白,没有声音的问题
  6. 工程师论文发表多少钱
  7. 26岁,月入3万,癌症晚期:熬夜没什么,就是容易死!
  8. 吉林大学操作系统上机(实验一:Linux进程与线程通讯)
  9. 安卓如何调出软键盘_Android开发中软键盘的显示和隐藏
  10. 【java初学】匿名内部类和多线程