Exploring the Regularity of Sparse Structure in Convolutional Neural Networks

方法介绍

  • 目的:
    探索稀疏性和预测精度之间的关系
    能不能在稀疏性的规则中找到一个平衡点,这个点是如何提升硬件实现效率的

  • 为了探索上面的问题,文章设置了几种不同的剪枝粒度等级,在前人的基础上进行对比实验,探索剪枝粒度和预测精度之间的关系,分析不同粒度等级下的存储量和硬件效率
    Range of granularity粒度范围也是文章的一个点,按照dim的增加划分为不同的粒度等级,四个,第一个是细粒度,也就是逐元素的,剩下三个都归为粗粒度

  • 因为文章更关注粒度尺寸在实验中的影响而不是prune的方法,所以文章里用了一个简单直观的方法->
    pruning criterion in “Learning both weights and connections for efficient neural network.”

    Gi代表不同的粒度等级,包括按不同粒度等级区分的一组weights;Si就代表在粒度等级的划分下,不同组间进行比较的依据;
    剪枝时确定稀疏性参数,就是通过敏感性分析,逐层的剪枝,在训练集上衡量精度损失来确定最终的稀疏性参数

实验探索和结论

  • 相同稀疏度情况下在不同剪枝粒度的情况下的accuracy

    Figure 4,相同稀疏度情况下在不同剪枝粒度的情况下的accuracy
    和表哥里的第一大行是对应的,按横坐标1-0.248的位置竖向比较,
    粗粒度比如减filter确实会造成很大的精度损失,另一方面,比较小的粒度尺寸下,粗粒度也能得到和细粒度比较相似的精度曲线
    剪枝就像是一个正则化a regularizer. Coarse-grained sparsity not only reduces the number of parameters but also constrains the positions of parameters限制了这些参数的位置, which is an even stronger regularizer. That’s why at low sparsity rate we observed the accuracy improvement in Figure 4.图四,可以看到accuracy有提升

  • 存储空间上的比较

    存储空间上的比较,稀疏网络一般都按CRS压缩行存储,存储值和索引,粗粒度由于有极强的规律性,能够节省一定的索引的存储空间,比细粒度占的存储空间要少,如图5;
    Figure 7,compare the accuracy of different pruning granularities at the same level of storage相同存储率的情况下不同剪枝粒度对精度的影响,可以看到在80baseline上更紧凑,也说明粗粒度 index saving 也是比较有效的。
    最后的存储,use 4-bit indices to store the distances between adjacent non-zeros, following the method in Deep Compression同样沿用了韩松在deep compression中介绍的方法

  • 粗粒度对于硬件实现方面的帮助

    这个图是说,我把weights和input activations都用稀疏格式存储,输出是用正常的dense存储,在计算输出的时候,先用weights和activations的索引进行一一对应,也就是这两条虚线,索引的比较也就是相当于一个控制信号,满足这个控制信号了再做weights和activations的对应位置相乘和累加的操作在一层计算结束后,输出的activations再压缩成稀疏存储重复刚才的过程

总结

总的来说,文章还是比较支持粗粒度稀疏的,节约索引存储空间,能得到更大的压缩率,对硬件效率的提升也比较有帮助

  • Due to the advantage of index saving, coarse-grained pruning is able to achieve a higher model compression ratio.
  • coarse-grained sparsity saves 2* output memory access compared with fine-grained sparsity, and 3* compared with dense implementation.
  • coarse-grained sparsity enables more efficient hardware architecture design of deep neural networks.

神经网络压缩(6):Exploring the Regularity of Sparse Structure in Convolutional Neural Networks相关推荐

  1. Exploring the Regularity of Sparse Structure in Convolutional Neural Networks(在卷积神经网络中探索稀疏结构的规律性)

    作者提出 基于论文Learning both weights and connections for efficient neural network修剪的方法在保留精度以及实现更高的压缩率方面确实很 ...

  2. 吴恩达深度学习笔记——卷积神经网络(Convolutional Neural Networks)

    深度学习笔记导航 前言 传送门 卷积神经网络(Convolutional Neural Networks) 卷积神经网络基础(Foundations of Convolutional Neural N ...

  3. 深度模型压缩论文(03)- Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self

    文章目录 1.摘要和背景 1.1 摘要 1.2 背景 2.方法和贡献 2.1 方法 2.1.1 训练过程 2.1.2 loss介绍 2.2 贡献 3.实验和结果 3.1 实验 3.2 结果 4.总结和 ...

  4. 深度学习之卷积神经网络(Convolutional Neural Networks, CNN)

    前面, 介绍了DNN及其参数求解的方法(深度学习之 BP 算法),我们知道DNN仍然存在很多的问题,其中最主要的就是BP求解可能造成的梯度消失和梯度爆炸.那么,人们又是怎么解决这个问题的呢?本节的卷积 ...

  5. Convolutional Neural Networks卷积神经网络(二)

    Deep Learning(深度学习)学习笔记整理系列 zouxy09@qq.com http://blog.csdn.net/zouxy09 作者:Zouxy version 1.0 2013-04 ...

  6. Convolutional Neural Networks for Sentence Classification(卷积神经网络句子分类)

    目录 摘要 原文 翻译 单词解释 技术解读 引言 原文 翻译 单词解释 技术解读 原文 翻译 单词解释 技术解读 原文 翻译 单词解释 技术解读 原文 翻译 单词解释 技术解读. Model 原文 单 ...

  7. 【压缩感知】Convolutional Neural Networks for Non-iterative Reconstruction of Compressively Sensed Images

    1.基本信息 论文:S. Lohit, K. Kulkarni, R. Kerviche, et al, Convolutional Neural Networks for Noniterative ...

  8. 卷积神经网络图像纹理合成 Texture Synthesis Using Convolutional Neural Networks

    卷积神经网络的图像纹理合成 TextureSynthesis Using Convolutional Neural Networks Taylor Guo, 2017年4月29日 星期六 摘要 本文介 ...

  9. 【卷积神经网络的加速】Speeding up Convolutional Neural Networks with Low Rank Expansions

    主题:[深度卷积神经网络的加速] Speeding up Convolutional Neural Networks with Low Rank Expansions 附上论文链接:上一篇中提到的低秩 ...

最新文章

  1. 使用Java企业级技术开发大型系统(3)
  2. 初学python的30个操作难点汇总(入门篇)希望对你有帮助
  3. neo4j图形数据库JAVA实现
  4. JSPServlet学习手册
  5. 大学计算机应用技术基础,大学计算机应用技术基础实践教程(Windows7+Office2010/21世纪高等学校计算机规划教材...
  6. 小程序上传图片到七牛云(支持多张上传,预览,删除)
  7. node.js HelloWord
  8. input标签的值只能两位小数_Day51 HTML表格表单标签、flask框架
  9. 数据库(表)导入导出备份
  10. fastapi 的启动方式
  11. mysql中如何将几个没有关系的结果集放在一起
  12. 只想做程序员的钢铁侠埃隆·马斯克,是如何成为亿万富翁的?
  13. HDU 1074 Doing Homework 状态压缩 + 搜索
  14. 18.看板方法---精益的一种经济学模型
  15. Java加密压缩文件
  16. 1.C语言0基础自学-从第一行代码开始
  17. qt 字体旋转90_如何识别图片和视频上文字的字体
  18. 陕西国防学院计算机系网络教研室,陕西国防工业职业技术学院:全卫强副院长赴各院部调研教师发展工作...
  19. 网站漏洞修补之苹果cms建站系统
  20. 1002 写出这个数 (20 分)

热门文章

  1. 重装系统:cdboot:couldn't find ntldr
  2. 全球及中国非接触式红外数字温度计行业研究及十四五规划分析报告
  3. Docker容器之Consul部署
  4. cajviewer打不开,卸载重装也于事无补。一分钟解决,亲测有效。
  5. matlab电流源,DC电压/电流源 GS200
  6. 个人发展战略思维导图
  7. 5.文献研读---基于教育数据挖掘的在线学习者 学业成绩预测建模研究--陈子健 朱晓亮...
  8. ps 动画gif制作
  9. python将经纬度标注在地图上_python读txt与写excel,将经纬度坐标点显示在地图上...
  10. ArcGIS学习笔记-1.功能-1.4 矢量图基本