深度学习论文: An Improved One millisecond Mobile Backbone及其PyTorch实现
An Improved One millisecond Mobile Backbone
PDF: https://arxiv.org/pdf/2206.04040.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

1 概述

MobileOne(≈MobileNetV1+RepVGG+训练Trick)是由Apple公司提出的一种基于iPhone12优化的超轻量型架构,在ImageNet数据集上以<1ms的速度取得了75.9%的Top1精度。

2 MobileOne

高效率网络具有更强的实用价值,但学术界的研究往往聚焦于FLOPs或者参数量的降低,而这两者与推理效率之间并不存在严格的一致性。比如,FLOPs并未考虑访存消耗与计算并行度,像无参操作(如跳过连接导致的Add、Concat等)会带来显著的访存消耗,导致更长推理耗时。

2-1 Metric Correlations


从上图可以看出,延迟的快慢与模型的参数量或者FLOPs的相关性较弱,在CPU端相关性更弱。

2-2 Key Bottlenecks

本文对影响模型性能的两个"瓶颈"进行分析,并提出相应方案;
Activation Functions: 从下表可以看出,尽管具有相同的架构,但不同激活函数导致的延迟差异极大。本文默认选择ReLU激活函数。

Architectural Blocks: 从下表可以看出,当采用单分支结构时,模型具有更快的速度。为改善效率,本文在大模型配置方面有限的采用了SE模块。

2-3 MobileOne Block

MobileOne的核心模块基于MobileNetV1而设计,同时吸收了重参数思想,得到下图所示的结构。

2-4 Architecture

在Model Scaling方面类似MobileNetV2,下表给出了MobileOne不同配置的参数信息。

3 Experiments

深度学习论文: An Improved One millisecond Mobile Backbone及其PyTorch实现相关推荐

  1. 深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head 及其PyTorch实现

    深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Dro ...

  2. 深度学习论文: An Energy and GPU-Computation Efficient Backbone Network for Object Detection及其PyTorch

    An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection PDF:https:// ...

  3. 深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现

    深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现 YOLOv6 v3.0: A Full-Scale Reloading PDF: http ...

  4. 深度学习论文: Task-Specific Context Decoupling for Object Detection及其PyTorch实现

    深度学习论文: Task-Specific Context Decoupling for Object Detection及其PyTorch实现 Task-Specific Context Decou ...

  5. 深度学习论文: EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers及其PyTorch实现

    深度学习论文: EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers及其PyTorch实现 ...

  6. 【更新于12.29】深度学习论文汇总

    本博客用于记录自己平时收集的一些不错的深度学习论文,近9成的文章都是引用量3位数以上的论文,剩下少部分来自个人喜好,本博客将伴随着我的研究生涯长期更新,如有错误或者推荐文章烦请私信. 深度学习书籍和入 ...

  7. 深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》

    深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4<Optimal Speed and Accuracy of Object Detection> Abstract 摘要 1. In ...

  8. 深度学习论文阅读(四):GoogLeNet《Going Deeper with Convolutions》

    深度学习论文阅读(四):GoogLeNet<Going Deeper with Convolutions> Abstract 摘要 1.Introduction 引言 2. Related ...

  9. 深度学习论文阅读图像分类篇(三):VGGNet《Very Deep Convolutional Networks for Large-Scale Image Recognition》

    深度学习论文阅读图像分类篇(三):VGGNet<Very Deep Convolutional Networks for Large-Scale Image Recognition> Ab ...

  10. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

最新文章

  1. 技术管理规划-设定团队的职能
  2. canvas填充规则
  3. Maven的下载与安装
  4. 医疗信息化 医学信息 医院管理 资料下载
  5. Windows8下设置VS默认启动方式为管理员启动
  6. Android App拥有system权限
  7. 易语言超文本浏览框支持html5,易语言 修改ie版本:使超文本浏览框或互联网浏览器变成IE9 IE10 IE11等版本...
  8. 会计计算机论文,关于计算机论文格式模板,关于电算化会计相关论文范文资料...
  9. 汽车CAN总线-基础
  10. White Sheet(面积法)
  11. 树莓派刷系统(mac)
  12. DOM是什么意思-前端入门
  13. Carla+ROS1联合仿真环境搭建
  14. python 英语分词_用几十行代码实现python中英文分词
  15. 星力+手游运营版本完整版打包下载 代理+服务端+后台+更新+APP
  16. 解决matlab中文乱码问题
  17. 计算机设备管理主要内容,计算机设备管理方案范本.doc
  18. C语言数据结构,哪本书比较好用,配有完整代码
  19. 【雕刻机】Grbl程序使用入门
  20. 报错:cannot import name ‘imread‘ from ‘scipy.misc‘

热门文章

  1. 精美的手机WEB网页欣赏
  2. cocos2dx[2.x](9)--编辑框之一CCTextFieldTTF
  3. 什么是IMS(IP多媒体子系统)
  4. 信息爆炸,物质丰富,你不得不知的奥卡姆剃刀原则
  5. android 360开机启动,手机360设置开机启动项
  6. python3d动画控制_3D旋转玫瑰花:python-matplotlib实现
  7. 双稳态(bistable)与单稳态
  8. 3d游戏设计读书笔记三
  9. Android视频播放器开发
  10. AWS​捅大篓子了,近1G敏感数据Github裸奔5小时