点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

本文提出Micro-Factorized卷积,将点和深度卷积分解为低秩矩阵,并提出新的激活函数,称为Dynamic Shift-Max,表现SOTA!性能优于GhostNet、MobileNetV3等网络;
作者单位加州大学圣迭戈分校, 微软

1 简介

在本文中介绍了MicroNet,它是一种高效的卷积神经网络具有极低的计算成本。在边缘设备上非常需要这样的低成本网络,但是通常会遭受明显的性能下降。

MicroNet基于2个设计原则来处理极低的FLOPs:

  • 1、通过降低节点连接性来避免网络宽度的减小;

  • 2、通过在每层引入更复杂的非线性来补偿网络深度的减小。

首先,提出Micro-Factorized卷积,将点和深度卷积分解为低秩矩阵,以便在通道数量和输入/输出连接性之间取得良好的平衡。其次,提出了一个新的激活函数,称为Dynamic Shift-Max,以通过最大化输入特征图与其圆形通道移位之间的多次动态融合来改善非线性。融合是动态的,因为它们的参数适用于输入。

基于Micro-Factorized卷积和动态Shift-Max,MicroNet系列在低FLOPs情况下比现有技术具有显著的性能提升。

2 相关工作

2.1、高效卷积

MobileNets将卷积分解为深度卷积和点态卷积;ShuffleNets采用Group卷积和Channels随机简化PointWise Convolution;也有学者利用Butterfly transform逼近Pointwise Convolution;EfficientNet找到输入分辨率和网络宽度/深度之间的适当关系;MixNet在一个卷积中将多个内核大小混合在一起;AdderNet用加法代替了大量的乘法;GhostNet应用线性变换来生成ghost feature maps;Sandglass翻转反向残块结构,减少信息损失,并训练一个网络支持多个子网络。

2.2、高效推理

高效推理为每个输入自适应定制合适的子网络。并使用强化学习来学习控制器,以跳过现有模型的一部分。MSDNet允许基于预测可信度的简单样本提前退出。搜索最佳的MSDNet。采用图像分辨率实现有效的推理。

2.3、动态神经网络

动态网络通过对输入参数的自适应调整来提高模型的表达能力。HyperNet使用另一个网络为主网络生成参数。SENet通过压缩全局上下文重新衡量Channel。SKNet适应关注不同大小的卷积核。Dynamic 卷积是根据多个卷积核的关注程度对它们进行聚合的结果。Dynamic ReLU适应ReLU中两个线性函数的斜率和截距,使用分组全连接层直接生成卷积权值。将动态卷积从空间不可知扩展到空间特定。提出了一种动态群卷积算法,可对输入通道进行自适应分组。将动态卷积应用于实例分割。学习跨尺度的语义分割的动态路由。

3 MicroNet

3.1、设计原理

极低延迟同时限制了网络宽度和深度。如果把卷积层看作一个图,输入和输出之间的连接由核参数的加权。这里将连接性定义为每个输出节点的连接数。因此,连接的数量等于输出通道的数量和连接的乘积。当计算成本固定时,通道数便与连接数发生冲突。作者认为,两者之间的良好平衡可以有效地避免通道缩减,提高层的表达能力。因此,第1个设计原则是通过降低节点连通性来规避网络宽度的降低。我们通过在更小的尺度上分解点态和深度卷积来实现这一点。

当一个网络的深度显著降低时,它的非线性便会受到约束,导致性能下降。于是作者提出了第2个设计原则通过提高每层的非线性度来补偿网络深度的减小,这里通过设计一个新的激活函数(动态Shift-Max激活函数)来实现这一点。

3.2、 Micro-Factorized卷积

为了平衡通道数量和输入/输出的连接性。作者在一个更小的尺度上对PointWise和DepthWise的卷积进行因式分解。

1)、Micro-Factorized Pointwise卷积

文中提出Group自适应卷积来分解PointWise卷积。假设卷积核W具有相同数量的输入和输出通道。将核矩阵W分解为两个Group自适应卷积,其中群数G依赖于通道数C,从数学上可以表示为:

式中,是的矩阵;的shape为,channel压缩率为R;的shape为,扩展返回到C作为输出的通道数量。

注意,Group数量不是固定的,它与通道数C和减少比R相适应:

这种平方根关系是通过平衡通道C和输入/输出连接性得到的。

如图3所示。随着group数G的增加C增加E减少。当G=R时,两条曲线相交(C=E),此时每个输出通道与所有输入通道连接一次。将得到的卷积矩阵W在数学上划分为块,每个块的秩为1。

2)、Micro-Factorized Depthwise卷积

如图所示,将一个的深度卷积核分解成一个的核和一个的核。每个通道W的核矩阵的形状为,它被分解为向量P和向量。是一个标量值1。这种低秩近似将计算复杂度从降低到。

3)、结合Micro-Factorized Pointwise and Depthwise卷积

作者以2种不同的方式组合了微因数分解的Pointwise和Depthwise卷积:(a)规则组合和(b)lite组合。前者只是将两个卷积连接起来。lite组合使用微因子分解的Depthwise卷积通过对每个通道应用多个Spatial卷积核来扩展通道的数量。然后应用1组自适应卷积来融合和压缩通道的数量。lite组合更有效,因为它节省了来自通道融合的计算,以弥补学习更多的Spatial卷积核。

3.3、动态Shift-Max激活函数

本文还提出了一种新的增强非线性的激活函数。它能够动态地将输入特征图与其循环组移位融合,其中的一组通道移位。动态Shift-Max也加强了Group之间的联系。这是对专注于组内连接的微因数分解Pointwise卷积的补充。

设表示一个输入向量(或张量),它有C个通道,被分成G个Groups。每个Group都有个通道。其中N通道的循环移位可以表示为。通过定义Group循环函数将通道移位扩展为Group移位:

其中,对应于将第个通道平移个Group。动态Shift-Max将多个(J)Group移位组合如下:

其中参数可以通过平均池化后的两个FC层轻松实现,,类似于SENet的实现方式。

4 MicroNet架构

文中总共描述了4种MicroNet模型的结构,FLOPs在6M到44M之间。它们由3种类型的Block组成,它们以不同的方式结合了Micro-Factorized pointwise和depthwise卷积。它们都使用dynamic ShiftMax作为激活函数。

4.1、Micro-Block-A

Micro-Block-A使用了微分解点态和深度卷积的精简组合。它在分辨率较高的低电平上是有效的。请注意,信道的数量是通过深度上的微分解卷积来扩展的,而通过组自适应卷积来压缩的。

4.2、Micro-Block-B

Micro-Block-B用于连接MicroBlock-A和Micro-Block-C。与Micro-Block-A不同的是,它使用了完全Micro-Factorized pointwise卷积,其中包括两个Group自适应卷积。前者压缩了通道数量,而后者则增加了通道数量。

4.3、Micro-Block-C

Micro-Block-C使用常规组合,将深度上的Micro-Factorized pointwise卷积连接起来。它被用于更深处的位置,因为它在通道融合(pointwise)上比lite组合花费更多的计算。当维度匹配时使用跳接。

每个微块有四个超参数:核大小k、输出通道数C、Micro-Factorized pointwise瓶颈处的缩减比R、2个Group自适应卷积的Group数对(G1,G2)。

4.4、Stem Layer

作者重新设计了Stem层,以满足低FLOPs的约束。它包括一个的卷积和一个的群卷积,然后是一个ReLU。第2次卷积将通道的数量增加了R倍。这大大节省了计算成本。

5 实验

5.1、ImageNet分类结果

下表2比较了4种不同的计算代价下最先进的ImgageNet分类。在这4个结果中MicroNet性能优于以前的工作。

5.2、激活函数实验

5.3、Pixel-Level分类

5.3.1 COCO keypoint detection

5.3.2 Semantic segmentation

参考

[1] MicroNet: Towards Image Recognition with Extremely Low FLOPs

原文地址:https://pan.baidu.com/s/1ZrBIptCMGT6-ku78-HSqnw 提取码:wt6y

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)相关推荐

  1. MicroNet论文复现:用极低的FLOPs改进图像识别

    摘要 MicroNet旨在解决在极低的计算成本下(例如在ImageNet分类上的5M FLOPs)性能大幅下降的问题.研究发现,稀疏连接和动态激活函数这两个因素可以有效地提高准确性.前者避免了网络宽度 ...

  2. 【第42篇】MicroNet:以极低的 FLOP 实现图像识别

    摘要 在本文中,我们介绍了 MicroNet,它是一种高效的卷积神经网络,使用极低的计算成本(例如 ImageNet 分类上的 6 个 MFLOP).这种低成本网络在边缘设备上是非常需要的,但通常会遭 ...

  3. ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别

    前言:这篇论文旨在以极低的计算成本解决性能大幅下降的问题.提出了微分解卷积,将卷积矩阵分解为低秩矩阵,将稀疏连接整合到卷积中.提出了一个新的动态激活函数-- Dynamic Shift Max,通过最 ...

  4. 微软提出极低资源下语音合成与识别新方法,小语种不怕没数据!| ICML 2019

    作者 | 谭旭 转载自微软研究院AI头条(ID: MSRAsia) 编者按:目前,人类使用的语言种类有近7000种,然而由于缺乏足够的语音-文本监督数据,绝大多数语言并没有对应的语音合成与识别功能.为 ...

  5. 如何使用标准稳压器输出几百毫伏极低直流电压?

    在过去的几年里,由于微控制器.CPU.DSP等数字电路的几何结构尺寸不断缩小,电子元器件的电源电压一直持续下降.在测量领域也有一些需要低电源电压的应用. 多年以来,线性稳压器和开关稳压器一直采用约1. ...

  6. 效率极低人群的七大习惯你占了几项?

    效率极低人群的七大习惯你占了几项? 就像寻找对你有益的习惯一样,寻找妨碍你的习惯同样重要.这7种习惯中大多数都可能会轻易成为你日常生活的一部分,使你难以察觉它的存在(或者它如何影响到你).我曾经略微尝 ...

  7. 台湾ICPlus IP175GHI, 85nm /极低功率,5接口10/100以太网集成交换机芯片

    台湾ICPlus IP175GHI 5接口10/100以太网集成交换机 , 85nm /极低功率 功能一般描述 z 5端口嵌入式10/100 PHY开关控制器 IP175G支持5 100BaseTX ...

  8. 细思极恐,第三方跟踪器正在获取你的数据,如何防范?

    细思极恐,第三方跟踪器正在获取你的数据,如何防范? 当下,许多网站都存在一些Web表单,比如登录.注册.评论等操作需要表单.我们都知道,我们在冲浪时在网站上键入的数据会被第三方跟踪器收集.但是,你知道 ...

  9. 惠普136w耗材贵吗_惠普136w更换硒鼓之后磨粉极低 惠普136w原装硒鼓能加碳粉吗...

    广州打印机出租,广州复印机出租,广州打印机租赁,广州复印机租赁,打印机出租,打印机租赁,复印机出租,复印机租赁,租打印机,租复印机,广州打印机,广州复印机,彩色打印机租赁,柯美复印机出租,找广州市柯镁 ...

最新文章

  1. virtualBox linux操作系统centos 挂载光盘
  2. java飞鸽传书_feige 飞鸽传书源代码java 实现不错的联系网络编程的资料飞鸽传书的GUI(java实现) - 下载 - 搜珍网...
  3. 【转载】4412开发板、PC、ubuntu通过网线连接
  4. MATLAB 设置文件的相对路径
  5. oracle11数据库导入,Oracle11g数据库之数据导入导出与事物
  6. 思想交锋:证券业数字化转型实践
  7. 妨碍编译器优化的因素
  8. java textarea滚动条,textarea添加滚动条 textarea 如何设置滚动条
  9. graphpad做折线图_GraphPad 折线图要这样玩
  10. 1222-周一开盘红红火火大涨的一天。EG,PVC,沪铜,国际铜,纯碱涨停
  11. Excel表格常用函数-VLOOKUP|IFERROR|IF
  12. 做外链的六个有效技巧
  13. 关于SQLServer关键词“union all”与“order by”的矛盾
  14. BZOJ4771七彩树——可持久化线段树+set+树链的并+LCA
  15. 【pyqt5】自定义控件 实现能够保持长宽比地缩放子控件
  16. 链路聚合|静态,动态配置|华为,思科配置|聚盒~
  17. TC275can总结
  18. 诚之和:首个俄罗斯太空电影摄制组准备返回地球
  19. cerebro简单的搭建
  20. 数字平原制作美丽林间小屋风景

热门文章

  1. flask中使用Flask-SQLALCHEMY-------一个简单的例子
  2. 抽象工廠與工廠方法的區別
  3. 从头开始 Struts 2 入门
  4. 易宝典文章——如何将PST文件导入到Exchange 2010 的邮箱
  5. 回头再学Asp.net系列--基础篇(一)
  6. php soap模块的安装
  7. 从0到1:千万级美团端侧CDN容灾解决方案
  8. Logback也爆漏洞了,总结下最近log相关的几个漏洞
  9. 关于MySQL的酸与MVCC和面试官小战三十回合
  10. 干货!用大白话告诉你什么是Mock测试