Xception: Deep Learning with Depthwise Separable Convolutions 是2017年 google的文章

Xception不是模型压缩技术,而是 “design strategies for CNN architectures with few parameters”

Xception 是对Inception v3的改进,是一种 Extreme Inception,因而得名 Xception,其主要是借鉴(非采用)depthwise separable convolution来替换原来Inception v3中的卷积操作。

(为什么是Extreme呢?因为Xception做了一个加强的假设,这个假设就是:
we make the following hypothesis: that the mapping of cross-channels correlations and spatial correlations in the feature maps of convolutional neural networks can be entirely decoupled)

创新点 :
1. 借鉴(非采用)depthwise separable convolution 改进Inception V3

(PS:就是改变了卷积方式,MobileNet的创新点也是这个)

既然是改进了Inception v3,那就得提一提关于inception的一下假设(思想)了。
“the fundamental hypothesis behind Inception is that cross-channel correlations and spatial correlations are sufficiently decoupled that it is preferable not to map them jointly”
简单理解就是说,卷积的时候要将通道的卷积与空间的卷积进行分离,这样会比较好。(没有理论证明,只有实验证明,就当它是定理,接受就好了,现在大多数神经网络的论文都这样(笑哭脸))

图1 是Inception module,图2是作者简化了的 inception module(就是只保留1*1的那条“路”,如果带着avg pool,后面怎么进一步假设嘛~~~)
假设出一个简化版inception module之后,再进一步假设,把第一部分的3个1*1卷积核统一起来,变成一个1*1的,后面的3个3*3的分别“处理”几个通道;如图3所示;
最后Xception登场,提出“extreme” version of an Inception module, 先用1*1卷积核对各通道之间(cross-channel)进行卷积,如图4所示。作者说了,这种卷积方式和depth-wise convolution 几乎一样。Depth-wise convolution 较早用于网络设计是来自:Rigid-Motion Scatteringfor Image Classification,但是具体是哪一年提出,不得而知;至少2012年就有相关研究,再比如说AlexNet,由于内存原因,AlexNet分成两组卷积 ;想深入了解Depth-wise convolution的可以查阅本论文2.Prior work,里面有详细介绍,和论文引用。



前面说了,Xception是借鉴Rigid-Motion Scatteringfor Image Classification 的Depth-wise convolution,是因为Xception与原版的Depth-wise convolution有两个不同之处
第一个:原版Depth-wise convolution,先逐通道卷积(逐通道卷积可参考文章:MobileNet),再1*1卷积;而Xception是反过来,先1*1卷积,再逐通道卷积;
第二个:原版Depth-wise convolution的两个卷积之间是不带激活函数的,而Xception在经过1*1卷积之后会带上一个Relu的非线性激活函数;

Xception 结构如下图所示,共计36层分为Entry flow; Middle flow; Exit flow;
Entry flow 包含 8个conv;Middle flow 包含 3*8 =24个conv;Exit flow包含4个conv,所以Xception共计36层

实验:
在Imagenet上对比了 VGG-16,ResNet-152,Inception V3, Xception,结果如下图

胡思乱想:
Xception的idea主要来自depth-wise convolution这个操作,本质是假设并承认:the fundamental hypothesis behind Inception is that cross-channel correlations and spatial correlations are sufficiently decoupled that it is preferable not to map them jointly”卷积的时候要将通道的卷积与空间的卷积进行分离,这样会比较好。

不仅是Xception,MobileNet也仅仅是借鉴了depthwise convolution的思想来设计网络,并且主要讨论的是图像分类任务;

既然卷积神经网络在图像别的领域大有作为,是否可以抓着depthwise convolution去“修改”例如检测、跟踪、超分辨率等等一些列任务的对应卷积网络,然后。。。你懂的

轻量化网络:Xception相关推荐

  1. 轻量化网络—ShuffleNet V1 V2理解

    轻量化网络-ShuffleNetV2理解 ShuffleNetV2原始论文:https://openaccess.thecvf.com/content_ECCV_2018/html/Ningning_ ...

  2. 旷世轻量化网络ShuffulNetV2学习笔记

    旷世轻量化网络ShuffulNetV2学习笔记 ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design Ab ...

  3. 【神经网络】(11) 轻量化网络MobileNetV1代码复现、解析,附Tensorflow完整代码

    各位同学好,今天和大家分享一下如何使用 Tensorflow 复现轻量化神经网络模型 MobileNetV1.为了能将神经网络模型用于移动端(手机)和终端(安防监控.无人驾驶)的实时计算,通常这些设备 ...

  4. 突破置换模块计算瓶颈,MSRA开源轻量版HRNet,超越主流轻量化网络!|CVPR2021...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨happy 审稿丨邓富城 编辑丨极市平台 极市导读 本文从HRNet与轻量化网络ShuffleN ...

  5. 【论文解读】突破置换模块计算瓶颈,MSRA开源轻量版HRNet,超越主流轻量化网络!|CVPR2021...

    作者丨happy 审稿丨邓富城 编辑丨极市平台 极市导读 本文从HRNet与轻量化网络ShuffleNet的组合出发,针对置换模块存在的计算瓶颈问题,提出了一种高效条件通道加权单元替换1x1卷积,并得 ...

  6. 轻量化网络MobileNet解析

    论文题目:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 论文链接:https:/ ...

  7. 轻量化网络:ShuffleNet V2

    Guideline 1-4: ShuffleNet V2 疑问: ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture ...

  8. 轻量化网络:SqueezeNext

    <SqueezeNext: Hardware-Aware Neural Network Design> 于2018年3月公开在arXiv(美[ˈɑ:rkaɪv]) :https://arx ...

  9. YOLOv5改进之十三:主干网络C3替换为轻量化网络EfficientNetv2

     ​前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法.此后的系列文章,将重点对YOLOv ...

  10. 浅析轻量化网络mobilenet

    论文地址:https://arxiv.org/abs/1704.04861:https://arxiv.org/abs/1704.04861 1.背景 MobileNet是轻量化网络的代表之作,与VG ...

最新文章

  1. 打开 hyper-v 批处理_如何控制批处理服务器
  2. java程序设计输入输出实验_20145320《Java程序设计》第五次实验报告
  3. Spring+hibernate里使用jdbc connection
  4. CentOs7下lnmp环境安装
  5. ajax设置自定义请求头信息
  6. security center启动类型更改不了_Word 启动缓慢解决方法
  7. minimumsnap(1)微分平坦特性(Differential Flatness)
  8. 梨花带雨html音乐播放器源码,梨花带雨 - 雨陌文化传媒 - 5SING中国原创音乐基地...
  9. 树莓派中文环境的配置
  10. 《孙子兵法与经理人统帅之道》读后感
  11. 三点共线判断方法分析
  12. HTML|颜色的设置方法
  13. 信息安全三要素CIA
  14. html新建框架网页,html怎么做网页框架
  15. Excel如何批量删除工作表全部图片?
  16. 如何通过网易云的分享链接,找到相关人的网易云账号
  17. 没有网络电脑计算机还能用吗,电脑连不上公用网络怎么办
  18. Excel_VBA开发2048游戏教程——Einsphoton
  19. 初次联系导师短信模板_复试消息汇总!复试资料到位,联系导师模板到位,只等你!...
  20. 2019CCPC网络赛部分题解

热门文章

  1. JMeter(五)--检查点
  2. 结对项目-使用计算器的设计和介绍
  3. 《html5 从入门到精通》读书笔记(三)
  4. 用JavaScript修改Canvas图片的分辨率(DPI)
  5. 两本好书可能改变的我一生——致出版社的一封信!
  6. redis使用lua脚本
  7. codeforces - 1216F WIFI(单调队列+DP)
  8. laravel配置加解密
  9. RPM包制作及yum仓库搭建
  10. 高性能mysql 第5章 创建高可用的索引