MobileNet论文阅读笔记
目录
论文链接:
摘要:
网络结构
MobileNet架构
MobileNet的两个超参数
实验结果
论文链接:
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
发表时间:2017年
作者: Menglong Zhu
摘要:
本文提出的MobileNets基于流线型架构,使用深度可分离卷积来构建轻量级深度神经网络。介绍了两个简单的全局超参数(宽度乘法器和分辨率乘法器),它们可以在延迟和准确性之间进行有效的折衷。这些超参数允许模型构建者根据问题的约束为其应用程序选择合适大小的模型。
网络结构
- 深度可分离卷积
(a)中的标准卷积滤波器被两层代替:(b)中的深度卷积和(c)中的逐点卷积以构建深度可分离的滤波器
- 计算量
假定输入特征图大小是:
输出特征图大小是:
对于标准的卷积:
计算量将是:
depthwise convolution计算量为:
pointwise convolution计算量是:
depthwise separable convolution总计算量是
可以比较depthwise separable convolution和标准卷积如下:
MobileNet架构
MobileNet基础结构中,依然在Depthwise和Pointwise中间和后面使用bn+ReLU来优化模型。
MobileNet的两个超参数
- 宽度乘数:稀疏模型
为了构造这些更小,计算量更小的模型,我们引入了一个非常简单的参数α,称为宽度乘法器。宽度乘数α的作用是通过按比例减少通道数在每层均匀地减薄网络。对于给定的层和宽度乘数α,输入通道M的数量变为αM,输出通道数量N变为αN。
具有宽度乘法器α的深度可分离卷积的计算成本为:
α范围为(0,1],通常设置为1,0.75,0.5和0.25
- 分辨率乘数:简化表示
分辨率乘数ρ用来改变输入数据层的分辨率,其中ρ范围为(0,1]通常隐式设置,以便网络的输入分辨率为224,192,160或128。ρ=1是MobileNet的基线,ρ<1是计算MobileNets的缩减。我们现在可以将网络核心层的计算成本表示为深度可分卷积,其中宽度乘法器α和分辨率乘法器ρ:
实验结果
(1)同样是MobileNets的架构,使用可分离卷积,精度值下降1%,而参数仅为1/7;
(2)深且瘦(Narrow)的网络比浅且胖(Shallow)的网络准确率高3%;
(3)α 超参数减小的时候,模型准确率随着模型的变瘦而下降;
(4)ρ 超参数减小的时候,模型准确率随着模型的分辨率下降而下降;
(5)引入两个参数会给肯定会降低MobileNet的性能,总结来看是在accuracy和computation,以及accuracy和model size之间做折中。
MobileNet论文阅读笔记相关推荐
- YOLOv4论文阅读笔记(一)
YOLOv4论文阅读笔记 Introduction Related work Bag of freebies Bag of Specials 近日发表的YOLOv4无疑是2020年目前最轰动的重磅炸弹 ...
- 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation
论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...
- DnCNN论文阅读笔记【MATLAB】
DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...
- Learning Multiview 3D point Cloud Registration论文阅读笔记
Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...
- FCGF论文阅读笔记
FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...
- PointConv论文阅读笔记
PointConv论文阅读笔记 Abstract 本文发表于CVPR. 其主要内容正如标题,是提出了一个对点云进行卷积的Module,称为PointConv.由于点云的无序性和不规则性,因此应用卷积比 ...
- DCP(Deep Closest Point)论文阅读笔记以及详析
DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...
- 2019 sample-free(样本不平衡)目标检测论文阅读笔记
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者同意转载,请勿二次转载 (原文地址:https://zhuanlan.zhihu.com/p/100052168) 背景 < ...
- keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记
背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...
最新文章
- R语言绘制火山图(volcano plot)实战:为差异表达基因(DEGs)添加颜色、基于显著性阈值进行点的颜色美化、为选定基因添加标签
- SpringBoot_日志-日志框架分类和选择
- java委托机制教程_通过反射实现Java下的委托机制代码详解
- 轻松监听Azure service health 状态
- 牛客题霸 转圈打印矩阵 C++题解/答案
- servlet中文乱码处理
- 代码大全 MSIL语言程序设计
- e4a服务器文件,e4a链接网站服务器
- 通过Github创建Android库供其他项目依赖引用
- 【开发者成长】喧哗的背后:Serverless 的挑战
- vs怎么调试php程序,vscode如何调试运行c#程序
- 微型计算机一般只具有定点运算功能对吗,大学计算机基础模拟卷2及答案剖析.doc...
- csu 1812: 三角形和矩形 凸包
- Read Asia Embedded fell
- filezilla检查新版本mac_filezilla中文版mac下载
- 秒读小说app带源码,开源阅读软件app,开源小说阅读app源码
- nodejs+mp2+mbtiles+实现google底图服务(centos7)
- 技术期刊 · 白日照耀开鸿蒙 | 深入鸿蒙 ACE UI 框架解析;无限循环的 useEffect 类型;用 Three.js 实现 3D 房间;图神经网络入门;超基础的机器学习入门-原理篇
- 微信浏览器调起微信登录
- 技术解析 | 云游戏在未来如何实现?
热门文章
- java高级知识点_JAVA高级阶段知识点汇总
- H5 获取手机GPS坐标
- Notes on language modeling-COMS W4705: Natural Language Processing-学习笔记
- 使用事件委托降低重复的事件绑定,从而降低dom操作的对性能的消耗[兼容IE版]
- java设计模式之设计原则④接口隔离原则
- QT显示框架嵌入Vs控制台工程
- DI 之 3.4 Bean的作用域(捌)
- jquery 插件闭包
- 【Visual C++】游戏开发笔记四十 浅墨DirectX教程之八 绘制真实质感的三维世界:光照与材质专场...
- Red hat linux 下装mysql5问题总结