EIE为韩松博士在ISCA 2016上的论文,实现了压缩的稀疏神经网络的硬件加速。

与其近似方法的ESE获得了FPGA2017的最佳论文。

背景与介绍

最新的DNN模型都是运算密集型和存储密集型,难以硬件部署。

提出了EIE (Efficient Inference Engine)的方法,将压缩模型应用与硬件。

矩阵表示

这是一个稀疏矩阵相乘的过程,输入向量a,乘以矩阵W,输出矩阵为b,然后经过了ReLU。

用于实现相乘累加的单元称为PE,相同颜色的相乘累加在同一个PE中实现。例如上面绿色的都是PE0的责任。则PE0只需要存下来权值的位置和权值的值。所以上面绿色的权值在PE0中的存储为下面这样:

硬件实现

CCU(Central control unit中央控制器)用于查找非零值,广播给PE(Processing Element处理单元,可以并行的单元,也是上文中的PE)。图a为CCU,

b为单个 PE单元, 实现将CCU广播过来的数据进行卷积的相乘累加和ReLU激活。

分为几部分

PE之间用H-tree结构,可以保证PE数量增加时布线长度以log函数增长(增长最缓慢的形式)

作者运用台积电TSMC的45nm的处理器。

韩松 EIE: Efficient Inference Engine on Compressed Deep Neural Network论文详解相关推荐

  1. 韩松EIE:Efficient Inference Engine on Compressed Deep Neural Network论文详解

    EIE为韩松博士在ISCA 2016上的论文.实现了压缩的稀疏神经网络的硬件加速.与其近似方法的ESE获得了FPGA2017的最佳论文. 目录 一.背景与介绍 1.1 Motivation 1.2 前 ...

  2. [论文阅读] EIE: Efficient Inference Engine on Compressed Neural Network

    这是收录于ISCA16(International Symposium on Computer Architecture). 其是Deep Compression以及DSD的系列篇,其在Deep Co ...

  3. Identifying drug–target interactions based on graph convolutional network and deep neural network 论文

    Identifying drug–target interactions based on graph convolutional network and deep neural network 文章 ...

  4. 论文翻译:2022_PACDNN: A phase-aware composite deep neural network for speech enhancement

    论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络 相似代码:https://github.com/phpstorm1/SE-FCN 引用格式:Hasannezhad M,Yu H,Z ...

  5. 文献记录(part33)-Hierarchical deep neural network for mental stress state detection using IoT ...

    学习笔记,仅供参考,有错必纠 仅记录实验 文章目录 Hierarchical deep neural network for mental stress state detection using I ...

  6. 5.深度学习练习:Deep Neural Network for Image Classification: Application

    本文节选自吴恩达老师<深度学习专项课程>编程作业,在此表示感谢. 课程链接:https://www.deeplearning.ai/deep-learning-specialization ...

  7. 4.深度学习练习:Building your Deep Neural Network: Step by Step(强烈推荐)

    本文节选自吴恩达老师<深度学习专项课程>编程作业,在此表示感谢. 课程链接:https://www.deeplearning.ai/deep-learning-specialization ...

  8. 论文阅读(XiangBai——【AAAI2017】TextBoxes_A Fast Text Detector with a Single Deep Neural Network)...

    XiangBai--[AAAI2017]TextBoxes:A Fast Text Detector with a Single Deep Neural Network 目录 作者和相关链接 方法概括 ...

  9. 论文阅读 [TPAMI-2022] ManifoldNet: A Deep Neural Network for Manifold-Valued Data With Applications

    论文阅读 [TPAMI-2022] ManifoldNet: A Deep Neural Network for Manifold-Valued Data With Applications 论文搜索 ...

最新文章

  1. 2018半年总结:走过的路
  2. 印制塑料卡片中的IC芯片
  3. WordPress 2.9.2 使用感受
  4. 用:after伪类写背景
  5. Redis-学习笔记06【Redis案例】
  6. boost::polygon模块实现自定义polygon相关的测试程序
  7. python深入_Python深入(上)
  8. 【Python】基本统计值计算
  9. 最长公共子序列模板(LCS)和LICS模板
  10. 使用NetronGraphLib类库开发Qfd质量屋编制工具
  11. Atitit.json xml 序列化循环引用解决方案json
  12. 安装logstash7.3.2遇到的坑及解决方案
  13. java菜鸟教程100_JAVA/JSP学习系列之一
  14. layui 时间控件 只显示时分或者分秒
  15. CATIA转的STP打开什么都没有_ProE打开Creo7.0模型文件的方法视频教程
  16. 利润分配计算机公式,利润与利润分配表计算公式大全
  17. 约当标准型_特征向量到约当标准型
  18. java判断闰年条件
  19. cube配置定时器ETR2模式测频实验
  20. 《最好的告别》是有尊严的离开

热门文章

  1. 国内首个开源网络流量可视化分析平台 -- 流影
  2. postgresql 12.0 源码编译安装
  3. Arduino--YF-S201水流量检测传感器
  4. 00后面试华为软件测试工程师,竭尽全力拿到15K。。。。。
  5. Snowflake生成的ID是全局递增唯一么?怎么实现全局递增的唯一ID?
  6. 项目设计Andriod部分-做一个学习类App-1
  7. 神兽麒麟kylin驾驭指南
  8. 强人工智能基本问题:自上而下还是自下而上? 1
  9. 最大公约数和最小公倍数实现
  10. FCKEDITOR编辑器的使用