tensorflow 训练权重不更新_TensorFlow模型剪枝原理

封面图片：ThisisEngineering RAEng on Unsplash

本文是对论文“To prune, or not to prune: exploring the efficacy ofpruning for model compression”的摘抄。这篇文章是TensorFlow模型优化工具文档中推荐的，作者Michael H. Zhu，来自斯坦福大学。在这里可以找到论文原文。背景

对于资源有限的移动终端设备来说，内容带宽通常是一个重要的限制因素。模型压缩至少有两点好处：减少耗电的内存访问次数；同等带宽下提升压缩模型参数的获取效率。剪枝将不重要的模型权重归零，实现了模型压缩的同时只带来了较小的质量损失。剪枝之后的模型是稀疏的，在支持稀疏矩阵加速运算的硬件上可以进一步获得加速效果。

国冰提示：英伟达的第三代张量核心(Tensor Core)对于稀疏矩阵的运算有约5倍的性能提升。这一点我们在文章“RTX30系列，香吗”中有过介绍。

在模型内存足迹(memory footprint)一定的前提下，如何获得最准确的模型，是本文的核心内容。作者通过对比两种模型来回答这个问题。第一种，先训练一个大模型，然后通过剪枝将其转换为一个强稀疏模型；第二种，直接训练一个非稀疏模型，尺寸与稀疏模型相当。在具体的模型架构与任务上，作者做出以下选择：

图像分类：Inception V3与MobileNets
序列分析：stacked LSTMs与seq2seq

tensorflow 训练权重不更新_TensorFlow模型剪枝原理相关推荐

PyTorch载入预训练权重方法和冻结权重方法
载入预训练权重 1. 直接载入预训练权重简单粗暴法: pretrain_weights_path = "./resnet50.pth" net.load_state_dict(t ...
深度学习加载预训练权重好处
深度学习加载预训练权重好处: 在模型开始训练前,使模型参数得到一个好的初始化,对于后面的训练学习有非常大的帮助.
使用TensorFlow训练WDL模型性能问题定位与调优
简介 TensorFlow是Google研发的第二代人工智能学习系统,能够处理多种深度学习算法模型,以功能强大和高可扩展性而著称.TensorFlow完全开源,所以很多公司都在使用,但是美团点评在使用 ...
使用PaddleFluid和TensorFlow训练序列标注模型
专栏介绍:Paddle Fluid 是用来让用户像 PyTorch 和 Tensorflow Eager Execution 一样执行程序.在这些系统中,不再有模型这个概念,应用也不再包含一个用于描述 ...
Pytorch基础训练库Pytorch-Base-Trainer(支持模型剪枝分布式训练)
Pytorch基础训练库Pytorch-Base-Trainer(支持模型剪枝分布式训练) 目录 Pytorch基础训练库Pytorch-Base-Trainer(PBT)(支持分布式训练) 1.I ...
使用tensorflow object detection API 训练自己的目标检测模型（三）
在上一篇博客"使用tensorflow object detection API 训练自己的目标检测模型 (二)"中介绍了如何使用LabelImg标记数据集,生成.xml文件,经过 ...
将TensorFlow训练的模型移植到Android手机
2019独角兽企业重金招聘Python工程师标准>>> 前言本文中出现的TF皆为TensorFlow的简称. 先说两句题外话吧,TensorFlow 前两天热热闹闹的发布了正式版r ...
基于pytorch的模型稀疏训练与模型剪枝示例
基于pytorch的模型稀疏训练与模型剪枝示例稀疏训练+模型剪枝代码下载地址:下载地址 CIFAR10-VGG16BN Baseline Trained with Sparsity (1e-4) P ...
将tensorflow训练好的模型移植到Android (MNIST手写数字识别)
将tensorflow训练好的模型移植到Android (MNIST手写数字识别) [尊重原创,转载请注明出处]https://blog.csdn.net/guyuealian/article/det ...

tensorflow 训练权重不更新_TensorFlow模型剪枝原理

tensorflow 训练权重不更新_TensorFlow模型剪枝原理相关推荐

最新文章

热门文章