使用模型压缩库Distiller遇到的问题
KeyError: "param 'initial_lr' is not specified in param_groups[0] when resuming an optimizer"
在使用下面命令训练mobilenetV1模型时,为了加快速度,我从网上下载了一个预训练模型mobilenet_sgd_68.848.pth.tar,结果如下设置时,报错如上。
python3 compress_classifier.py --arch=mobilenet ../../../data.imagenet --resume-from=../checkpoint/imagenet/mobilenet_sgd_68.848.pth.tar --lr=0.045 --batch=256 -j=32 --vs=0 --name=mobilenet_v1_training -p=50 --wd=1e-4 --epochs=200 --compress=../baseline_networks/mobilenet_imagenet_baseline_training.yaml
#
根据https://github.com/WenmuZhou/PSENet.pytorch/issues/28
提示,我将distiller/config.py 中的
lr_schedulers = __factory('lr_schedulers', model, sched_dict, optimizer=optimizer,last_epoch=(resumed_epoch if resumed_epoch is not None else -1))
修改为:
lr_schedulers = __factory('lr_schedulers', model, sched_dict, optimizer=optimizer,last_epoch=(-1 if resumed_epoch is not None else -1))
成功训练不报错,但是不知道缘由!!!
使用模型压缩库Distiller遇到的问题相关推荐
- Intel发布神经网络压缩库Distiller:快速利用前沿算法压缩PyTorch模型
Intel发布神经网络压缩库Distiller:快速利用前沿算法压缩PyTorch模型 原文:https://blog.csdn.net/u011808673/article/details/8079 ...
- 神经网络压缩库Distiller学习
课题需要来学习一下Intel开源的Distiller神经网络压缩库. Intel 主要根据以下特征和工具构建了 Distiller: 集成了剪枝.正则化和量化算法的框架 分析和评估压缩性能的一组工具 ...
- 神经网络压缩库 Distiller
Distiller 是 Intel 开源的一个用于神经网络压缩的 Python 包,可减少深度神经网络的内存占用.提高推断速度并节省能耗.Distiller 为 PyTorch 环境提供原型和分析压缩 ...
- intel神经网络压缩库distiller使用时遇到的问题
ModuleNotFoundError: No module named 'distiller' 原因:一开始没有按照README给出的方法,用conda新建了虚拟环境然后使用 pip install ...
- PyTorch 深度学习模型压缩开源库(含量化、剪枝、轻量化结构、BN融合)
点击我爱计算机视觉标星,更快获取CVML新技术 本文为52CV群友666dzy666投稿,介绍了他最近开源的PyTorch模型压缩库,该库开源不到20天已经收获 219 颗星,是最近值得关注的模型压缩 ...
- 可真有你的!EasyEdge模型压缩新姿势……
近年来,深度学习技术在诸多领域大放异彩,因此广受学术界和工业界的青睐.随着深度学习的发展,神经网络结构变得越来越复杂.复杂的模型固然具有更好的性能,但是高额的存储空间与计算资源消耗使其难以有效地应用在 ...
- 深度学习(机器学习)模型压缩开源库整理
最近由于项目要求,需要对模型进行压缩,查了一下都有 哪些开源出来的模型压缩开源库,然后看到原作者已经总结得挺好的, 值得学习!!! Tensorflow Lite:https://tensorflow ...
- 自动特征工程、NAS、超参调优和模型压缩,微软开源的NNI一库搞定!
点击我爱计算机视觉标星,更快获取CVML新技术 2018年9月,微软亚洲研究院发布了第一版 NNI (Neural Network Intelligence) ,目前已在 GitHub 上获得 3.8 ...
- 模型压缩:模型量化打怪升级之路-工具篇
本文转载自商汤泰坦公开课. 1/ 最近发现一些还在学校读书的同学非常关注一个量化工作精度的高低,读过我上篇分享(模型压缩:模型量化打怪升级之路 - 0 序章)的同学应该知道,部分学术界的工作与工业界的 ...
- 系统学习深度学习(二十九)--模型压缩
参考:https://blog.csdn.net/wspba/article/details/75671573 若有不对,欢迎指正,先谢了 目前,通常意义上的网络模型压缩,主流思路有两个方向,一个是设 ...
最新文章
- Opencv java模板匹配-角点检测(11)
- go中的WebSocket
- Acwing第 1 场周赛【完结】
- Spring Data JPA 条件查询的关键字
- android刷新时的圆形动画_【Android】圆形揭露动画
- Sentinel 分布式系统的流量防卫兵
- 不使用for完成一段有空格间隔的字符串,分辨长度大于等于4的单词(求各位高人修改,我表示我是菜鸟,这个算法实在太长了)...
- 基本的阿里云Linux服务器设置
- 解决putty自动断开问题
- 自动计数报警器c语言程序,自动计数报警器.ppt
- 前端学习之百叶窗效果
- 保温杯市场前景分析及行业研究报告
- Python3.7 安装Airflow 报错tenacity.async import AsyncRetrying
- 相对路径与绝对路径的写法
- 个人学习(解决)练习ssm框架遇到的问题No qualifying bean of type ‘service.BookTypeService‘ available:
- 论文笔记(二):基于卷积神经网络的高分辨率遥感图像上的水体识别技术
- SQL Extractor 数据库修复取证大师软件功能介绍
- 人工智能小白日记之2准备篇
- Windows 11 正式版最低配置要求来了,你的电脑支持吗?
- jquery报错 $(‘....‘).lazyload is not a function解决方法
热门文章
- win10现在可以双击跑jar包了
- linux dolphin模拟器,Dolphin for Mac(GameCube模拟器)
- win7声音小图标不见了,如何修复
- 英文名字按首字母排序分类显示
- 登录验证,如果输入错误次数超过3次,则锁定该账户
- Markdown部分语法使用
- 概率熵物质混乱能量耗散信息熵
- 内网网段范围_局域网网段到底是什么意思?怎么划分的啊?为什么要划分网段?...
- 编码器的集电极输出、电压输出、互补输出和线性驱动输出
- AWash: Handwashing Assistance for the Elderly with Dementia via Wearables