基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
1)量化:High-Bit(>2b): QAT, PTQ, QAFT; Low-Bit(≤2b)/Ternary and Binary: QAT
2)剪枝:正常、规整和分组卷积结构剪枝
3)针对特征(A)二值量化的BN融合(训练量化后,BN参数 —> conv的偏置b)
4)High-Bit量化的BN融合(训练量化中,先融合再量化,融合:BN参数 —> conv的权重w和偏置b)
对比实验如下,相关代码下载地址:下载地址
类型 | W(Bits) | A(Bits) | Acc | GFLOPs | Para(M) | Size(MB) | 压缩率 | 损失 |
---|---|---|---|---|---|---|---|---|
原模型(nin) | FP32 | FP32 | 91.01% | 0.15 | 0.67 | 2.68 | *** | *** |
采用分组卷积 |
基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)相关推荐
- 基于Pytorch的Transformer翻译模型前期数据处理方法
基于Pytorch的Transformer翻译模型前期数据处理方法 Google于2017年6月在arxiv上发布了一篇非常经典的文章:Attention is all you need,提出了解决s ...
- 2、【KV260开发】yolov4模型训练、量化、编译、部署
前言 由于毕业设计就是基于KV260搞智能监控那一套,因此主要关注深度学习应用这一块,硬件部门涉及比较少. 通过Vitis AI官方手册可知,成功完成一个深度学习应用需要四个步骤:模型训练.量化.编译 ...
- 【视频课】模型剪枝+模型量化+知识蒸馏典型实践!
前言 欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下: 第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用. 第2层 ...
- 【视频课】深度掌握模型剪枝+模型量化+知识蒸馏3大核心模型压缩技术理论!...
前言 欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下: 第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用. 第2层 ...
- 艾伦人工智能研究院开源AllenNLP,基于PyTorch轻松构建NLP模型
艾伦人工智能研究院(AI2)开源AllenNLP,它是一个基于PyTorch的NLP研究库,利用深度学习来进行自然语言理解,通过处理低层次的细节.提供高质量的参考实现,能轻松快速地帮助研究员构建新的语 ...
- 基于PyTorch的Seq2Seq翻译模型详细注释介绍(一)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/qysh123/article/deta ...
- 【视频课】模型优化拆分!分别学习模型剪枝与模型量化理论与实践
前言 好的模型结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践中也是模型是否能上线的关键.对各类底层深度学习模型设计和优化技术理解的深度是决定我们能否在深度学习项目中游刃有 ...
- 【模型部署】NNI:剪枝和量化
目录 一 简介 1 剪枝和量化 2 NNI 二 安装NNI 三 剪枝 四 量化 一 简介 1 剪枝和量化 将神经网络部署在计算资源匮乏或具有严格延迟要求的设备上的时候,需要先对模型进行压缩处理.模型压 ...
- 浅谈模型压缩之量化、剪枝、权重共享
之前陆陆续续看了许多模型压缩相关的文章,自己业务中也接触过一些相关的客户,今天周末没事做,把模型压缩相关的内容整理一下做个分享.可能更多地从科普的角度去介绍,因为我也不是专业做这方面技术的研究. 首先 ...
最新文章
- java多线程 ThreadPoolExecutor 策略的坑
- 【必看】如何在 Linux 上恢复误删除的文件或目录
- 在代码中使用SqlCommand对象
- python原理及代码_链表的基本原理及Python代码的实现,与,python
- oracle设置表的主键和外键,Oracle中给表添加主键、外键
- centos配置java环境变量_【开发笔记】-CentOS配置Java环境变量
- Xml和Tomcat
- RAW socket使用
- 用VFP实现一个网盘软件,上传,下载,删除一个不少
- [笔记]Windows核心编程《十七》内存映射文件
- 七、项目沟通管理(输入/工具与技术/输出)
- Andersen Global宣布进驻印度市场
- latex参考文献bib基本格式_在Latex中利用.bib进行参考文献管理
- 职高计算机专业能考大学吗,为什么千万不要上职高 上职高能考大学吗
- 图书管理系统Java
- KAMA-库夫曼自适应移动均线
- linux 动态扫描 数码管,七段数码管动态扫描原理及其实现方法
- 牛客小白月赛6 I.公交线路
- GPRS模块SIM900A为什么连接USB-TTL没反应
- 关于LD1117S12TR
热门文章
- 【CV】OpenCV(基于Python)学习笔记
- 前端面经笔记 2021.8.28
- C++实现九九乘法表
- CSS3---6.文字阴影
- (multi)set的某些操作
- [hdu 1561] The more, The Better
- 2022-2028年中国环烷基润滑油行业市场研究及前瞻分析报告
- Numpy 一维、二维数组、size/dtype/shape属性、数组函数arange/linspace/logspace /diag/zeros/ones/random 、多维数组索引和筛选)
- 关于JQuery中的ajax请求或者post请求的回调方法中的操作执行或者变量修改没反映的问题...
- GHOST还原教程详细