《Xception: Deep Learning with Depthwise Separable Convolutions》

  • – Google

1.Xception 并不是真正意义上的轻量化模型,是Google继Inception后提出的对Inception v3的另一种改进,主要是采用depthwise separable convolution来替代原来的Inception v3中的卷积操作,这种性能的提升是来自于更有效的使用模型参数而不是提高容量。
一个卷积层尝试去学习特征在3维空间–(高、宽、通道),包含了空间的相关性和跨通道的相关性。
Xception做了一个加强的假设,就是卷积的时候要将通道的卷积与空间的卷积进行分离,这样会不会更合理?

2.Xception结构演变
既然是在Inception v3上进行改进的,那么Xception是如何一步一步的从Inception v3演变而来。
Inception v3结构如下图1,当时提出Inception的初衷可以认为是:特征的提取和传递可以通过1x1卷积,3x3卷积,5x5卷积,pooling等,到底哪种才是最好的特征提取方式呢?Inception结构将这个疑问留给网络自己训练,也就是将一个输入同时给这几种提取特征方式,然后做concat。 Inception v3和Inception v1(GoogLeNet)对比主要是将5x5卷积换成两个3x3卷积层的叠加

注:1x1卷积的作用: 1)降维:较少计算量 2)升维:小型网络,通道越多,效果会更好 3)1x1是有一个参数学习的卷积层,可以增加跨通道的相关性。

图2 简化了的inception module(就只考虑1x1的那条支路,不包含Avg pool)


再进一步延伸,就有了图3,把第一部分的3个1x1卷积核统一起来,变成1个1x1的卷积核,然后连接3个3x3的卷积,这3个卷积操作只将前面1x1卷积结果中的一部分作为自己的输入(只负责一部分通道)。

图4 An“extreme” version of Inception module,先用1x1卷积核对各通道之间(cross-channel)进行卷积,之后使用3x3的卷积对每个输出通道进行卷积操作,也就是3x3卷积的个数和1x1卷积的输出channel个数相同。

在Xception中主要采用depthwise separable convolution,和原版的相比有两个不同之处:
(1)原版的Depthwise convolution,先是逐通道卷积,再1x1卷积;而Xception是反过来,先1x1卷积,再逐通道卷积。
(2)原版Depthwise convolution的两个卷积之间是不带激活函数的,而Xception再经过1x1卷积之后会带上一个Relu的非线性激活函数。

3.Xception的网络结构

完全基于深度可分离卷积的卷积神经网络结构:

Xception结构由36层卷积层组成网络的特征提取基础,分为Entry flow,Middle flow,Exit flow;被分成了14个模块,除了第一个和最后一个外,其余模块间均有线性残差连接。

4.实验结果
Table1表示几种网络结构在ImageNet上的对比。

Table2表示在JFT数据集上的进行比较。大数据集上的提升会更好一点。

Table3表示参数量和速度的比较。

可以看到参数量和速度上,Xception相比于Inception v3只是略微的小点,但效果却好,说明网络结构对参数有更有效的使用,之前的假设将通道的卷积和空间的卷积进行分离,这样会比较好。

Xception小结:

Xception作为Inception v3的改进,主要是在Inception v3的基础上引入了depthwise separable convolution,在基本不增加网络复杂度的前提下提高了模型的效果。有些人会好奇为什么引入depthwise separable convolution没有大大降低网络的复杂度,因为depthwise separable convolution在mobileNet中主要就是为了降低网络的复杂度而设计的。原因是作者加宽了网络,使得参数数量和Inception v3差不多,然后在这前提下比较性能。因此Xception目的不在于模型压缩,而是提高性能。


注:博众家之所长,集群英之荟萃。

轻量化网络结构——Xception相关推荐

  1. 轻量化网络结构——MobileNetV2

    <Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Seg ...

  2. 轻量化网络结构——MobileNet

    <MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications> Google Go ...

  3. arduino 勘智k210_嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化

    原标题:嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化 AIoT正重塑人们的生活场景.无论是客厅里的智能音箱.自动驾驶系统,还是机场安检口的人脸识别闸机,终端设备越来越聪明, ...

  4. 纵览轻量化卷积神经网络:SqueezeNet、MobileNet、ShuffleNet、Xception

    https://zhuanlan.zhihu.com/p/32746221 https://zhuanlan.zhihu.com/p/35405071 一.简介 虽然网络性能得到了提高,但随之而来的就 ...

  5. 轻量化卷积神经网络:SqueezeNet、MobileNet、ShuffleNet、Xception

    一 引言 二 轻量化模型 2.1 SqueezeNet 2.2 MobileNet 2.3 ShuffleNet 2.4 Xception 三 网络对比 一 引言 自2012年AlexNet以来,卷积 ...

  6. 轻量化神经网络模型总结:SqueezeNet、Xception、MobileNet、ShuffleNet

    总结今年来的几个轻量化模型:SqueezeNet.Xception.MobileNet.ShuffleNet 下面给出时间轴: 2016.02 伯克利&斯坦福提出 SqueezeNet 201 ...

  7. 轻量化神经网络总结:SqueezeNet、Xception、MobileNet v1、MobileNet v2、ShuffleNet v1、ShuffleNet v2

    2016.02 伯克利&斯坦福提出 SqueezeNet 在ImageNet上实现了与Alexnet相似的效果,参数只有其1/50 核心点: 1x1卷积核代替3x3卷积核 Squeeze La ...

  8. 轻量化神经网络篇(SqueezeNet、Xception、MobileNet、ShuffleNet)

    写在前面:此文只记录了下本人感觉需要注意的地方,不全且不一定准确.详细内容可以参考文中帖的链接,比较好!!! 最近看的轻量化神经网络:SqueezeNet.Xception.MobileNet.Shu ...

  9. 经典网络结构 (八):轻量化网络 (SqueezeNet, MobileNet, ShuffleNet)

    目录 SqueezeNet Fire Module: Squeeze and Expand SqueezeNet SqueezeNet 总结 MobileNet 深度可分离卷积 (Depthwise ...

最新文章

  1. 多线程、并发及线程的基础问题
  2. mysql删除原则_MySQL数据库的增删选查
  3. 微信小程序组件 日历
  4. webpack - 收藏集 - 掘金
  5. Docker 使用Dockerfile构建Docker(三)
  6. ASP.NET Core Web 项目文件介绍
  7. ajax 与route的区别,如何在Ajax.RouteLink中使用片段?
  8. RTX5 | STM32H743+CubeMX+RTX5+两路FDCAN驱动+CANopen协议
  9. RHEL124第一天
  10. 程序员遇到bug时常见的30种反应
  11. spring aop实例讲解_Spring核心技术详解(一)
  12. 5.1linux_ubuntu常见安装问题
  13. opengl 教程(15) 摄像机控制(2)
  14. [转载] 使用 Python 实现鼠标键盘自动化
  15. Android聊天软件开发(基于网易云IM即时通讯)——发送图片消息(五)
  16. MySQL 检索昵称字段合法中文/日文字符对于 5.7/5.6 版本失败的解决方案
  17. ezuikit-js萤石云
  18. NinePatch图片
  19. VCS+Verdi 安装及破解过程(Ubuntu)【1】
  20. linux操作系统. 80188,Materials-Studio5.5在Linux服务器上安装与测算讨论 - 第一原理 - 小木虫 - 学术 科研 互动社区...

热门文章

  1. 面向网络转型的编排管理系统和ONAP自研产品介绍
  2. T4M插件放入unity后怎么找不到_Unity制作人专场 | 闪耀暖暖从2D到3D的创作与进化之路...
  3. 前向传播、反向传播与感知器
  4. 计算机显示屏原理6,计算机之父 冯诺依曼_非冯诺依曼计算机_冯诺依曼提出的原理(6)...
  5. 考研必备数学公式大全(数学二)(基础回顾篇)
  6. “英文简历常用词汇”大全
  7. 游戏架构 游戏架构设计(12)
  8. c语言课程设计进制转换结构图,C语言课程设计————写下流程图! 谢谢
  9. 要想在云领域和IT领域成为成功人士,需要掌握的十种方法
  10. 使图片变成灰色CSS