2D_Detection-模型加速(网络篇)
layout: post
title: 2D_Detection-模型加速(网络篇)
date: 2021-09-04 16:34:34.000000000 +09:00
categories: [算法篇]
tags: [CV, 综述]
mathjax: true
更多内容可访问个人博客:2D_detection检测综述
- 前言
- 详细介绍
- 网络加速
- SqueezeNet
- MobileNet
- ShuffleNet
- OneNet
- 网络剪枝
- 网络加速
前言
深度学习网络的加速问题包含两部分内容:网络结构侧的加速和工程侧的加速。网络层面的加速主要从网络结构上进行优化,关注点在于网络的计算量和参数量上。
详细介绍
网络加速
从中可以了解轻量级网络设计上的一些通用策略。另外这里补充了另一个网络:OneNet,该网络主要探讨了物体检测的 去NMS
方案。最后,补充一种即插即用的网络加速策略:网络剪枝。
SqueezeNet
- 减小卷积核: 从AlexNet到SqueezeNet,可以发现尽量避免使用大的卷积核,或者可以采用多个小卷积核操作替换大卷积核操作(感受野一样,但是参数量更少,且效果更好)
- squeeze-expand操作:squeeze的操作在于减少计算量,expand操作在于减少精度下降。在后续的Inception系列的网络上都可以看到此类操作的影子(Inception系列可参考:2D_Detection-BackBone)。
MobileNet
MobileNet是轻量化网络的经典之作,其关键在于提出了 可分离卷积
,对于可分离卷积在2D_Detection-基本深度学习单元中有所介绍。
Inverted Residual Block
: 其核心为两个部分:残差结构+沙漏结构。残差结构参考ResNet,沙漏结构的关键同样利用了1X1网络结构来进行升维和降维操作,顺序为:1x1升维->可分离卷积->1x1降维。ReLU6
: MobileNetV1采用ReLU6函数: relu6(x)=min(max(x,0),6)relu6(x)=min(max(x, 0), 6)relu6(x)=min(max(x,0),6)。该激活函数的优势在于限制了ReLU的输出值范围,使得在移动端设备上的FP16低精度模式上依然能有很好的数值分辨率。但是该激活函数的问题是其对特征输出带来的损失,因为其在两端都做了截断处理。尤其在低维特征上,损失更为明显。因此MobileNetV2采用的损失函数策略是:高维特征输出(1x1升维和可分离卷积输出)仍然采用ReLU6激活函数,但在降维后直接采用线性激活函数。
精调网络结构:作者主要对尾部结构进行网络结构的调整,核心思想还是基于1X1卷积网络进行维度变化,减小feature map,从而降低计算量:
引入SE模块:即插即用的模块,其核心是添加了通道的注意力模块。作者在引入该模块的适合采用了一定的技巧,减少SE模块的时间消耗:将SE模块放在深度卷积后,且现将池化后的channel特征通过fc缩小4倍然后再经过fc回去,再和深度卷积后的特征按照位相加:
激活函数:核心是
sigmoid
激活函数较慢,采用h-swish
激活函数,该函数基于ReLU实现,速度更快,兼容性更好些。
ShuffleNet
ShuffleNet系列论文包括两篇:ShuffleNetV1和ShuffleNetV2。个人认为ShuffleNet系列最大启发点包含两个部分:
- 提出了
Channel shuffle
的概念,且该操作可以基于常规张量操作实现,一定程度上提供了一个更轻量化的channel内特征融合的方案(对比基于1x1卷积的channel融合方案)。 - 从实际硬件推理角度(应该是GPU?)探讨了高性能网络设计的基本规则,有一定借鉴意义。
基于此,作者发现ShuffleNetV1存在一些不合理的设计,并以此设计了新的ShuffleNetV2结构:
OneNet
前文更多介绍Backbone层面上的网络加速策略, OneNet则是在检测网络层面设计了Non-NMS的网络检测方案,从整体方案角度其优势在于:
OneNet的核心在于其训练过程的样本匹配策略,即如何让网络学习到 one-to-one
的匹配策略。
网络剪枝
网络剪枝其实可以认为是一种通用的网络加速策略,一般用在网络方案确定后的网络加速。微软开源的NNI工具提高了一些常用模型剪枝和量化策略。
网络剪枝的原理在于深度模型的过度参数化,也可以认为是其过拟合的一种表现。网络剪枝按照原理上可以分为两类:一类是结构化剪枝;一类是非结构化剪枝:
非结构化剪枝则是从更细粒度上进行模型权重的裁剪:将原本稠密的参数矩阵裁剪为更为稀疏的参数矩阵。其一般流程为:
2D_Detection-模型加速(网络篇)相关推荐
- 模型加速之轻量化网络
模型加速之轻量化网络 当前物体检测结构大都依赖使用卷积网络进行特征提取,即 Backbone,通常使用 VGGNet.ResNet 等优秀的基础网络,但是这些网络往往计算量巨大,依赖这些基础网络的检测 ...
- 【模型加速】关于模型加速的总结
概述 ● 模型加速的目标: a. Increase inference speed:加快推理速度(应用层面). b. Reduce model size:压缩模型. ● 关于模型的加速大致可以分为三个 ...
- 用软件可编程FPGA加速网络边缘的移动应用总结
用软件可编程FPGA加速网络边缘的移动应用 Accelerating Mobile Applications at the Network Edge with Software-Programmabl ...
- 模型转换、模型压缩、模型加速工具汇总
点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 编辑丨机器学习AI算法工程 一.场景需求解读 在现实场景中,我们经常会遇到这样一个问题,即某篇论 ...
- SIGIR‘22 推荐系统论文之图网络篇
2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...
- 大模型的1000+篇文章总结
大模型的1000+篇文章总结 本文收集和总结了有关大模型的1000+篇文章,由于篇幅有限只能总结近期的内容,想了解更多内容可以访问:http://www.ai2news.com/, 其分享了有关AI的 ...
- Android面试题网络篇
Android面试题网络篇,由本人整理汇总,后续将继续推出系列篇,如果喜欢请持续关注和推荐. 系列文章目录: Android面试题View篇 Android面试题进程篇 Android面试题线程篇 T ...
- 14种轻量级网络综述 — 主干网络篇
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨VincentLee 来源丨晓飞的算法工程笔记 编辑丨极市平台 导读 早期的卷积神经很少考虑参数 ...
- 【华为云 ModelArts-Lab AI实战营】第三期:图像分类 (III) 模型参数网络调优
https://github.com/huaweicloud/ModelArts-Lab/issues/219 本期实战为图像分类第三期.本期实战,本期我们将会以 "VGG16模型" ...
最新文章
- Android安装apk
- H.264解码器ffmpeg完整优化代码(包括PC和Windows Mobile版本)
- 原码一位乘法器设计_数字IC校招基础知识点复习(七)——超前进位加法器、Wallace树、Booth乘法器...
- 我的docker随笔31:oracle数据库再次部署
- iOS NSString的常用用法
- bcd 初始化库系统卷失败_开源IP地址管理系统,告别传统IP统计方式(安装部署篇)
- linux设备驱动归纳总结(三):1.字符型设备之设备申请【转】
- mysql中修改表字段的类型长度_mysql中修改表字段名/字段长度/字段类型详解
- JDKAndroid下载安装
- LateX安装下载使用详细教程
- matlab 转子振动,转子—支承系统振动不平衡响应的MATLAB实现
- 第五次作业+度盘下载器
- python爬虫 爬取京东网页
- 2017 icpc 西安赛区 B.Coin(推公式+二项式定理)
- 【弹吉他必备的乐理知识】【2】节拍
- 重磅推荐,国内国外优秀的素材资源网站
- cmnet 和 cmwap 收费等区别
- svchost.exe占用内存过高解决办法
- 企业报表插件怎么用?
- 图像的高频信息和低频信息代表的含义(以奇异值分解实现图像压缩为例附实验说明)
热门文章
- boolean android.graphics.Bitmap.compress(android.graphics.Bitmap$CompressFormat, int, java.io.Output
- LeetCode.M62.不同路径
- 2018区块链顶尖论文及学者榜单:50个顶级学术团队,带你探索区块链学术研究最前沿...
- 百篇大计敬本年之系统篇《十》 —— 系统文件名长度限制
- 每个人的心里都有两头狼
- [WordPress] 隐藏 Featured Image 新手非程序方法
- AI+药物研发:人工智能赋能新药研发
- 软工网络15团队作业8——Beta阶段敏捷冲刺
- mirai 高效率 QQ 机器人框架
- wow服务器合并信息,《魔兽世界》台服合并部分服务器_网络游戏魔兽世界_新浪游戏_新浪网...