An Improved One millisecond Mobile Backbone 论文笔记

论文链接: https://arxiv.org/abs/2206.04040

一、Introduction

作者在本文中探索一个新的mobile backbone,能够使得在iPhone 12上面推理不到1 ms,且在ImageNet上达到75.9%的top-1精度。

  1. 作者认为FLOPs或者参数量通常与延迟性(latency)关系不大。
  • sharing parameters leads to higher FLOPs,but smaller model size。
  • parameter-less operations like skip-connections or branching, can incur significant memory access costs。
  1. 作者认为Optimization是另一个瓶颈。
  • 作者将训练和推理的结构分开,训练的时候使用一个linearly over-parameterized 模型,然后在推理的时候re-parameterizing the linear structures。
  • 使用dynamically relaxing regularization进行训练,使得小模型过参数化。

Direction

  1. 在训练的时候引入了linear branch(over-parameterization branch),然后在推理的时候re-parameterized。
  2. 训练的时候使用dynamic relaxation of regularization。

二、Method

1. FLOPs和参数量与延迟的关系

作者实验分析,FLOPs和延迟性相关性中等,与参数量相关性较弱。

2. 瓶颈

1. 激活函数

作者使用相同的网络结构,除了激活函数。对比了SE-ReLU, Dynamic Shift-Max和 DynamicReLUs等。延迟性如下:

DynamicReLU和Dynamic Shift-Max可以在极低FLOPs的模型,像MicroNet,上得到很大的提升,但在延迟性上面会影响挺大。因此作者在MobileOne上仅使用ReLU激活函数。

2. Architectural Blocks

有两个关键因素影响运行的性能:

  • memory access cost
  • degree of parallelism

memory access cost随着multi-branch的结构增加,因为每个分支的值都需要存储起来,来计算下一个tensor。这样的存储瓶颈可以通过减少分支数量来进行优化。其次,使用Squeeze-Excite block也是会影响整体的运行时间,因为它会带来同步的成本。

因此,作者在推理的时候不采用分支结构,减少memory access cost。但除此之外,也会使用Squeeze-Excite blocks在大模型上提高精度。

3. MobileOne模型结构

首先先引入MobileOne Block,它是由3x3的depthwise和1x1的pointwise卷积组成。其次,作者引入了over-parameterization branch。结构如下图所示:

其中kkk是over-parameterization参数,范围是1-5。在推理的时候,MobileOne并不存在任何分支,是个complain model。

其次,因为卷及和batchnorm在推理的时候是线性操作,因此它们可以组合在一起:
权重W′∈RCout×Cin×K×KW^{'} \in \R^{C_{out} \times C_{in} \times K \times K}W′∈RCout​×Cin​×K×K, bias为b′∈RDb^{'} \in \R^Db′∈RD。 batchnorm包括均值μ\muμ, 标准差σ\sigmaσ, 尺度γ\gammaγ和biasβ\betaβ。所以卷积和batchnorm合在一起为:

W^=W′∗γσb^=(b′−μ)∗γσ+β\hat{W} = W^{'} * \frac{\gamma}{\sigma} \\ \hat{b} = (b^{'} - \mu) * \frac{\gamma}{\sigma} + \beta W^=W′∗σγ​b^=(b′−μ)∗σγ​+β

而re-parameterizable分支的影响如下:

对于较大的MobileOne模型,over-parameterization的提升就会变小。

4. 训练

小的模型需要较少的正则化来抵抗过拟合。 而且需要使用weight decay在早先训练阶段。作者发现使用annealing weight decay regularization会对小模型更有效。

三、Performance

四、Conclusion

MobileOne提供了轻量型backbone的设计,分析了FLOPs和参数量对延迟的影响,在iPhone12上运行低于1ms。re-parameterization这个技术以后需要深入去看看。 个人感觉创新点不是特别大,因为MobileOne Block基于depthwise和pointwise(MobileNet-v1+RepVgg)的感觉,然后激活函数也使用较原始的ReLU。但在工程上,也值得参考,去设计轻量型Backbone。

Reference

An Improved One millisecond Mobile Backbone 论文笔记相关推荐

  1. 【优化训练】RePr:Improved Training of Convolutional Filters论文笔记

    论文题目     RePr:Improved Training of Convolutional Filters 这是2019年CVPR的一篇文章,主要针对卷积神经网络的训练方法,提出一种新的训练模式 ...

  2. 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记

    <Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...

  3. 【论文笔记】Integrate Point-Cloud Segmentation with 3D LiDAR Scan-Matching for Mobile Robot Localization a

    [论文笔记]Integrate Point-Cloud Segmentation with 3D LiDAR Scan-Matching for Mobile Robot Localization a ...

  4. NILM论文笔记:R.Reddy, et al: A feature fusion technique for improved NILM

    目录 0. 前言 1. 论文概要 2. 混合特征生成 3. 数据合成 4. 对比实验 4.1 数据生成 4.2 事件检测 4.3 特征提取(Feature extraction) 0. 前言 本文是& ...

  5. 【论文笔记】Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability

    Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability 创新性 本篇论文的贡献 ...

  6. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  7. [论文总结] 深度学习在农业领域应用论文笔记5

    深度学习在农业领域应用论文笔记5 1. Channel pruned YOLO V5s-based deep learning approach for rapid and accurate appl ...

  8. 经验 | 深度学习中从基础综述、论文笔记到工程经验、训练技巧

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:本文授权转自知乎作者跑者小越,https://zhuanla ...

  9. 最详细的SSD论文笔记

    个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-90.html 文:Wei Liu, Dragomir Angu ...

  10. 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...

最新文章

  1. python 字符串内容
  2. 解读微软开源MMLSpark:统一的大规模机器学习生态系统
  3. rs232读取智能电表_【技术文章】蜂窝物联网PoC为智能电表连接指引路向
  4. Python异步编程Async/Await
  5. 21行代码AC——习题3-7 DNA序列(UVa-1368)_解题报告
  6. float型y取值在1.0c语言表达式,2011年全国计算机二级C语言模拟试题及答案(14)...
  7. vs 2015 oracle,VS2015连接oracle11g出现异常
  8. 洛谷-小书童——密码-简单字符串
  9. 在html中添加class,在HTML标识符的Class中加入Styles
  10. 编写有效用例_阅读笔记03
  11. 【优化覆盖】基于matlab粒子群算法求解传感器覆盖优化问题【含Matlab源码 598期】
  12. iphonex时间显示蓝色_iphonex时间显示蓝色
  13. oracle的档案软件,思源档案管理系统(WEB版)
  14. 单阶段目标检测算法YOLOv3
  15. 微信小程序Unhandled promise rejection TypeError
  16. CodeForces 858C Did you mean... 、 CodeForces 858D Polycarp's phone book!黑科技
  17. 安卓跳转应用市场评论
  18. selenium click点击无反应问题解析
  19. 数字藏品“秒杀风”背后的文博“新潮”
  20. 洛谷 P2325 王室联邦

热门文章

  1. android 自定义数字软键盘,(笔记)Android自定义数字键盘
  2. Elasticsearch:使用向量搜索来查询及比较文字 - NLP text embedding
  3. 查错集|No.1解决Undefined symbol xxx (referred from xxx.o)问题
  4. 麻省理工大学公开课学习笔记【1、算法分析】
  5. 1.27(Bomb Game)
  6. UE4天气效果加白天黑夜的平滑过度切换
  7. 史上最贵的merge代码,新浪程序员因加班错失年会77万大奖!
  8. handsome优化 - AMP/MIP阅读
  9. php 读取 eml,php如何读取解析eml文件以及生成网页的示例分享
  10. 德州达拉斯大学计算机录取要求,德克萨斯大学达拉斯分校申请条件(德克萨斯大...