深度学习论文: An Improved One millisecond Mobile Backbone及其PyTorch实现
深度学习论文: An Improved One millisecond Mobile Backbone及其PyTorch实现
An Improved One millisecond Mobile Backbone
PDF: https://arxiv.org/pdf/2206.04040.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
1 概述
MobileOne(≈MobileNetV1+RepVGG+训练Trick)是由Apple公司提出的一种基于iPhone12优化的超轻量型架构,在ImageNet数据集上以<1ms的速度取得了75.9%的Top1精度。
2 MobileOne
高效率网络具有更强的实用价值,但学术界的研究往往聚焦于FLOPs或者参数量的降低,而这两者与推理效率之间并不存在严格的一致性。比如,FLOPs并未考虑访存消耗与计算并行度,像无参操作(如跳过连接导致的Add、Concat等)会带来显著的访存消耗,导致更长推理耗时。
2-1 Metric Correlations
从上图可以看出,延迟的快慢与模型的参数量或者FLOPs的相关性较弱,在CPU端相关性更弱。
2-2 Key Bottlenecks
本文对影响模型性能的两个"瓶颈"进行分析,并提出相应方案;
Activation Functions: 从下表可以看出,尽管具有相同的架构,但不同激活函数导致的延迟差异极大。本文默认选择ReLU激活函数。
Architectural Blocks: 从下表可以看出,当采用单分支结构时,模型具有更快的速度。为改善效率,本文在大模型配置方面有限的采用了SE模块。
2-3 MobileOne Block
MobileOne的核心模块基于MobileNetV1而设计,同时吸收了重参数思想,得到下图所示的结构。
2-4 Architecture
在Model Scaling方面类似MobileNetV2,下表给出了MobileOne不同配置的参数信息。
3 Experiments
深度学习论文: An Improved One millisecond Mobile Backbone及其PyTorch实现相关推荐
- 深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head 及其PyTorch实现
深度学习论文: TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Dro ...
- 深度学习论文: An Energy and GPU-Computation Efficient Backbone Network for Object Detection及其PyTorch
An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection PDF:https:// ...
- 深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现
深度学习论文: YOLOv6 v3.0: A Full-Scale Reloading及其PyTorch实现 YOLOv6 v3.0: A Full-Scale Reloading PDF: http ...
- 深度学习论文: Task-Specific Context Decoupling for Object Detection及其PyTorch实现
深度学习论文: Task-Specific Context Decoupling for Object Detection及其PyTorch实现 Task-Specific Context Decou ...
- 深度学习论文: EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers及其PyTorch实现
深度学习论文: EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers及其PyTorch实现 ...
- 【更新于12.29】深度学习论文汇总
本博客用于记录自己平时收集的一些不错的深度学习论文,近9成的文章都是引用量3位数以上的论文,剩下少部分来自个人喜好,本博客将伴随着我的研究生涯长期更新,如有错误或者推荐文章烦请私信. 深度学习书籍和入 ...
- 深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》
深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4<Optimal Speed and Accuracy of Object Detection> Abstract 摘要 1. In ...
- 深度学习论文阅读(四):GoogLeNet《Going Deeper with Convolutions》
深度学习论文阅读(四):GoogLeNet<Going Deeper with Convolutions> Abstract 摘要 1.Introduction 引言 2. Related ...
- 深度学习论文阅读图像分类篇(三):VGGNet《Very Deep Convolutional Networks for Large-Scale Image Recognition》
深度学习论文阅读图像分类篇(三):VGGNet<Very Deep Convolutional Networks for Large-Scale Image Recognition> Ab ...
- 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》
深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...
最新文章
- 技术管理规划-设定团队的职能
- canvas填充规则
- Maven的下载与安装
- 医疗信息化 医学信息 医院管理 资料下载
- Windows8下设置VS默认启动方式为管理员启动
- Android App拥有system权限
- 易语言超文本浏览框支持html5,易语言 修改ie版本:使超文本浏览框或互联网浏览器变成IE9 IE10 IE11等版本...
- 会计计算机论文,关于计算机论文格式模板,关于电算化会计相关论文范文资料...
- 汽车CAN总线-基础
- White Sheet(面积法)
- 树莓派刷系统(mac)
- DOM是什么意思-前端入门
- Carla+ROS1联合仿真环境搭建
- python 英语分词_用几十行代码实现python中英文分词
- 星力+手游运营版本完整版打包下载 代理+服务端+后台+更新+APP
- 解决matlab中文乱码问题
- 计算机设备管理主要内容,计算机设备管理方案范本.doc
- C语言数据结构,哪本书比较好用,配有完整代码
- 【雕刻机】Grbl程序使用入门
- 报错:cannot import name ‘imread‘ from ‘scipy.misc‘
热门文章
- 精美的手机WEB网页欣赏
- cocos2dx[2.x](9)--编辑框之一CCTextFieldTTF
- 什么是IMS(IP多媒体子系统)
- 信息爆炸,物质丰富,你不得不知的奥卡姆剃刀原则
- android 360开机启动,手机360设置开机启动项
- python3d动画控制_3D旋转玫瑰花:python-matplotlib实现
- 双稳态(bistable)与单稳态
- 3d游戏设计读书笔记三
- Android视频播放器开发
- AWS​捅大篓子了,近1G敏感数据Github裸奔5小时