An Improved One millisecond Mobile Backbone 论文笔记
An Improved One millisecond Mobile Backbone 论文笔记
论文链接: https://arxiv.org/abs/2206.04040
一、Introduction
作者在本文中探索一个新的mobile backbone,能够使得在iPhone 12上面推理不到1 ms,且在ImageNet上达到75.9%的top-1精度。
- 作者认为FLOPs或者参数量通常与延迟性(latency)关系不大。
- sharing parameters leads to higher FLOPs,but smaller model size。
- parameter-less operations like skip-connections or branching, can incur significant memory access costs。
- 作者认为Optimization是另一个瓶颈。
- 作者将训练和推理的结构分开,训练的时候使用一个linearly over-parameterized 模型,然后在推理的时候re-parameterizing the linear structures。
- 使用dynamically relaxing regularization进行训练,使得小模型过参数化。
Direction
- 在训练的时候引入了linear branch(over-parameterization branch),然后在推理的时候re-parameterized。
- 训练的时候使用dynamic relaxation of regularization。
二、Method
1. FLOPs和参数量与延迟的关系
作者实验分析,FLOPs和延迟性相关性中等,与参数量相关性较弱。
2. 瓶颈
1. 激活函数
作者使用相同的网络结构,除了激活函数。对比了SE-ReLU, Dynamic Shift-Max和 DynamicReLUs等。延迟性如下:
DynamicReLU和Dynamic Shift-Max可以在极低FLOPs的模型,像MicroNet,上得到很大的提升,但在延迟性上面会影响挺大。因此作者在MobileOne上仅使用ReLU激活函数。
2. Architectural Blocks
有两个关键因素影响运行的性能:
- memory access cost
- degree of parallelism
memory access cost随着multi-branch的结构增加,因为每个分支的值都需要存储起来,来计算下一个tensor。这样的存储瓶颈可以通过减少分支数量来进行优化。其次,使用Squeeze-Excite block也是会影响整体的运行时间,因为它会带来同步的成本。
因此,作者在推理的时候不采用分支结构,减少memory access cost。但除此之外,也会使用Squeeze-Excite blocks在大模型上提高精度。
3. MobileOne模型结构
首先先引入MobileOne Block,它是由3x3的depthwise和1x1的pointwise卷积组成。其次,作者引入了over-parameterization branch。结构如下图所示:
其中kkk是over-parameterization参数,范围是1-5。在推理的时候,MobileOne并不存在任何分支,是个complain model。
其次,因为卷及和batchnorm在推理的时候是线性操作,因此它们可以组合在一起:
权重W′∈RCout×Cin×K×KW^{'} \in \R^{C_{out} \times C_{in} \times K \times K}W′∈RCout×Cin×K×K, bias为b′∈RDb^{'} \in \R^Db′∈RD。 batchnorm包括均值μ\muμ, 标准差σ\sigmaσ, 尺度γ\gammaγ和biasβ\betaβ。所以卷积和batchnorm合在一起为:
W^=W′∗γσb^=(b′−μ)∗γσ+β\hat{W} = W^{'} * \frac{\gamma}{\sigma} \\ \hat{b} = (b^{'} - \mu) * \frac{\gamma}{\sigma} + \beta W^=W′∗σγb^=(b′−μ)∗σγ+β
而re-parameterizable分支的影响如下:
对于较大的MobileOne模型,over-parameterization的提升就会变小。
4. 训练
小的模型需要较少的正则化来抵抗过拟合。 而且需要使用weight decay在早先训练阶段。作者发现使用annealing weight decay regularization会对小模型更有效。
三、Performance
四、Conclusion
MobileOne提供了轻量型backbone的设计,分析了FLOPs和参数量对延迟的影响,在iPhone12上运行低于1ms。re-parameterization这个技术以后需要深入去看看。 个人感觉创新点不是特别大,因为MobileOne Block基于depthwise和pointwise(MobileNet-v1+RepVgg)的感觉,然后激活函数也使用较原始的ReLU。但在工程上,也值得参考,去设计轻量型Backbone。
Reference
An Improved One millisecond Mobile Backbone 论文笔记相关推荐
- 【优化训练】RePr:Improved Training of Convolutional Filters论文笔记
论文题目 RePr:Improved Training of Convolutional Filters 这是2019年CVPR的一篇文章,主要针对卷积神经网络的训练方法,提出一种新的训练模式 ...
- 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记
<Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...
- 【论文笔记】Integrate Point-Cloud Segmentation with 3D LiDAR Scan-Matching for Mobile Robot Localization a
[论文笔记]Integrate Point-Cloud Segmentation with 3D LiDAR Scan-Matching for Mobile Robot Localization a ...
- NILM论文笔记:R.Reddy, et al: A feature fusion technique for improved NILM
目录 0. 前言 1. 论文概要 2. 混合特征生成 3. 数据合成 4. 对比实验 4.1 数据生成 4.2 事件检测 4.3 特征提取(Feature extraction) 0. 前言 本文是& ...
- 【论文笔记】Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability
Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability 创新性 本篇论文的贡献 ...
- 论文笔记【A Comprehensive Study of Deep Video Action Recognition】
论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...
- [论文总结] 深度学习在农业领域应用论文笔记5
深度学习在农业领域应用论文笔记5 1. Channel pruned YOLO V5s-based deep learning approach for rapid and accurate appl ...
- 经验 | 深度学习中从基础综述、论文笔记到工程经验、训练技巧
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:本文授权转自知乎作者跑者小越,https://zhuanla ...
- 最详细的SSD论文笔记
个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-90.html 文:Wei Liu, Dragomir Angu ...
- 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...
最新文章
- python 字符串内容
- 解读微软开源MMLSpark:统一的大规模机器学习生态系统
- rs232读取智能电表_【技术文章】蜂窝物联网PoC为智能电表连接指引路向
- Python异步编程Async/Await
- 21行代码AC——习题3-7 DNA序列(UVa-1368)_解题报告
- float型y取值在1.0c语言表达式,2011年全国计算机二级C语言模拟试题及答案(14)...
- vs 2015 oracle,VS2015连接oracle11g出现异常
- 洛谷-小书童——密码-简单字符串
- 在html中添加class,在HTML标识符的Class中加入Styles
- 编写有效用例_阅读笔记03
- 【优化覆盖】基于matlab粒子群算法求解传感器覆盖优化问题【含Matlab源码 598期】
- iphonex时间显示蓝色_iphonex时间显示蓝色
- oracle的档案软件,思源档案管理系统(WEB版)
- 单阶段目标检测算法YOLOv3
- 微信小程序Unhandled promise rejection TypeError
- CodeForces 858C Did you mean... 、 CodeForces 858D Polycarp's phone book!黑科技
- 安卓跳转应用市场评论
- selenium click点击无反应问题解析
- 数字藏品“秒杀风”背后的文博“新潮”
- 洛谷 P2325 王室联邦
热门文章
- android 自定义数字软键盘,(笔记)Android自定义数字键盘
- Elasticsearch:使用向量搜索来查询及比较文字 - NLP text embedding
- 查错集|No.1解决Undefined symbol xxx (referred from xxx.o)问题
- 麻省理工大学公开课学习笔记【1、算法分析】
- 1.27(Bomb Game)
- UE4天气效果加白天黑夜的平滑过度切换
- 史上最贵的merge代码,新浪程序员因加班错失年会77万大奖!
- handsome优化 - AMP/MIP阅读
- php 读取 eml,php如何读取解析eml文件以及生成网页的示例分享
- 德州达拉斯大学计算机录取要求,德克萨斯大学达拉斯分校申请条件(德克萨斯大...