GoogLeNet

这篇文章打算简单总结一下GoogLeNet网络,其网络结构如下图所示。

我放上面这张图只是为了方便我们大致了解一下它的结构。我知道这样肯定不太能看清每一层具体细节,因为可以发现,GoogLeNet看起来有非常多且复杂的结构,要是清晰地放在这篇文章里恐怕会占很多篇幅,所以具体、清晰的GoogleNet图可以看这里。

与VGG、AlexNet等卷积神经网络相比,GoogLeNet绝对是我们见过的层数最多的网络了,它的网络层数有超过100层。

Inception

我们说GoogLeNet足有100多层,然而从图中可以发现,从左到右,似乎深度并没有到100层。这并不矛盾,我们说神经网络的层数并不一定等同于深度,那么这个网络是如何达到100多层的呢?是通过并行的方式。

这就在于GoogLeNet中的inception块。我们通过GoogLeNet的网络图,可以发现里面有很多并行的结构。在整理ResNet网络的时候,我们发现网络除了直接送入卷积层之外,还可以额外进行残差边的额外送入,也就是说,同一个数据可以并行地分两条路去走。而GoogLeNet中的inception块就更加“放肆”了:有的进行卷积,有的进行池化,卷积核的大小也有不同,这样开设四条路径(一般来说),然后在输出通道维合并。

如上图,是早期inception块的基本思路。我们对于某一层的输出,进行四条路径下不同的处理,有1*1卷积、3*3卷积、5*5卷积以及3*3池化等操作,再最终将结果合并到一起。这就是最早期inception块的思路了,理解起来并不难。

然而,深度神经网络需要耗费大量计算资源,我们虽然采取了多种方式进行融合,但必然会大大增加计算量。还记得1*1卷积的作用吗  ?后面inception块为了减少计算量,在不同通道下都引入了1*1的卷积来减少通道数,从而减少参数量。这就有了下面更加常见的inception块:

如上图,为了降低算力成本,我们在3*3和 5x5 卷积前都增加了1*1卷积来减少输入卷积层的通道数。这样就可以减少卷积层的参数量了。因为卷积层的参数量为:输入层通道数*输出层通道数*卷积核大小。(这里一定要理解哈,因为输入层通道数决定了卷积核的通道数,输出通道数决定了卷积核的个数)

因此,虽然我们看似是额外增加了几个1*1的卷积层,然而因为卷积层参数以及各个地方通道数的减少(得益于1*1卷积的大量使用),我们整体的参数量和复杂度是有减少的。整个inception块,也就是四条道路相融合的参数量甚至要少于单纯进行3*3或5*5的卷积!inception的优点之一也就是模型参数小,计算复杂度低。

值得注意的是,对于卷积层,1*1卷积会出现在卷积层之前来及时减少输入的通道数;而对于池化层,1*1卷积是出现在最大池化层之后的。

Inception的通道数和尺寸

因为inception有一个非常重要的性质:虽然输出通道数会因为四个路径相加而比输入通道数多,但是输出尺寸大小和输入尺寸是一样的。即:通过一个inception,高宽不变,通道数改变。

上图中我还额外标记了padding的大小,一个pad=1,另一个pad=2,这两处padding是本来就有的只不过原图中没显示。因为如果这两处卷积如果不设padding的话,是不可能使尺寸不变的。

之前在这篇文章(https://blog.csdn.net/weixin_44492824/article/details/123080291)中有过结论:

卷积核尺寸为3*3,padding=1,步长为1,卷积后尺寸不变
  卷积核尺寸为5*5,padding=2,步长为1,卷积后尺寸不变

所以图中其实3*3卷积padding是1,5*5卷积padding是2,才可以保持尺寸大小不变,才符合inception块的性质。

  通道数的保留和占比也是有一些说法的,比如对于3*3的卷积,我们认为它更加重要,所以第二条路线我们给他更多的通道数,而5*5的卷积与池化层相对来说不是那么重要,所以第三、四条路线我们分别通过5*5和1*1的卷积来将它压缩至较小的通道数。

关于其他inception变种等

其实inception块在我理解看来就是开启多个不同的“并行路线”,每个路线采用不同的方式进行特征提取和学习,我们当然也可以让某一个路线直接变成残差边,或者是改变一些卷积核的大小、个数,或者加入BN层等,因此后面对于inception的变种也都是在这些思路上进行了改变。目前inceptionv3以及v4就是做了以上相关的改进,效果还是不错的。

关于inception我感觉就了解即可,不同版本其实也就是inception模块的一些改变和调整。要想复现GoogLeNet的话,模型构建以及训练起来还是很麻烦很慢的。一方面,是因为GooLeNet不同stage使用inception块的方式也都比较“无厘头”,并且很多通道数的设定也比较玄学;另一方面,虽然我们说inception块可以减少一些参数量,但是架不住它数目太多,因此整体结构还是复杂的。

Inception模块 GooLeNet网络相关推荐

  1. 论文解析:理论分析Inception模块和GoogLeNet

    Inception-V1 目的  自从卷积神经网络诞生以来,其标准范式就是堆叠的卷积层夹杂着池化层或者是归一化层,发展方向主要是在网络的大小上做文章,无论是增加网络的层数或者说是增加每层网络中神经元的 ...

  2. 王权富贵:GoogLeNet的Inception模块变化。

    GooLeNet的详细理解可以参考这篇文章,文章详细的说明了V1-V4之间的变化. GooLeNetV1提出了InceptionV1模块,1*1,3*3,5*5这些卷积最后的合并是深度相加.大卷积如3 ...

  3. 深度神经网络中的Inception模块介绍

    深度神经网络(Deep Neural Networks, DNN)或深度卷积网络中的Inception模块是由Google的Christian Szegedy等人提出,包括Inception-v1.I ...

  4. Inception模块

    Inception网络或Inception层的作用是代替人工来确定卷积层中的卷积核类型,或者是否需要创建卷积层和池化层,可以代替你来做决定,虽然网络架构比较复杂,但网络表现却非常好.下图是Incept ...

  5. python网络协议编辑器_python模块:网络协议和支持

    python模块:网络协议和支持 webbrowser 调用浏览器显示html文件 webbrowser.open('map.html') uuid/hmac/hashlib生成唯一ID 在有些情况下 ...

  6. metasploit中用shodan模块进行网络摄像头查找

    metasploit中用shodan模块进行网络摄像头查找 在kali中使用 msfconsole use auxiliary/gather/shodan_search 登录 https://expl ...

  7. 趣谈网络协议-第二模块-底层网络知识详解:4陌生的数据中心2CDN和数据中心

    趣谈网络协议-第二模块-底层网络知识详解:4陌生的数据中心2CDN和数据中心 1:CDN:你去小卖部取过快递么? 使用"中间仓库"来优化 网络中的"就近配送" ...

  8. 域格模块移动网络信号指标介绍

       域格模块移动网络信号指标介绍 如今,移动通信已成为我们生活不可或缺的一部分,我们享受着他带给我们的便利,也不时遭遇到因网络通信质量差造成的窘境.而带给我们这冰火两重天的,就是我们今天的主角&qu ...

  9. 【STM32训练—WiFi模块】第一篇、STM32驱动ESP8266WiFi模块获取网络时间

    目录 第一部分.写在前面 1.硬件准备 2.相关的AT指令 3.参考博客 第二部分.电脑串口助手调试ESP8266模块获取网络时间 1.ESP8266获取时间的流程 2.具体实现步骤 第三部分.STM ...

  10. 第三模块 面向对象网络并发编程 | day17 面向对象基础

    第三模块 面向对象&网络&并发编程 从今天开始,我们将进入系列课程第3个模块的的学习,此模块包含如下三大部分知识: 面向对象,Python中支持两种编程方式来写代码,分别是:函数式编程 ...

最新文章

  1. dll文件是什么语言编写的_Win7系统当中libeay32.dll文件丢失的解决方法是什么?...
  2. 机器学习算法加强——回归实践
  3. 简单理解Tomasulo算法与重加载缓冲区
  4. c++中的deque容器
  5. python自动寻路模板_Python实现的简单模板引擎功能示例
  6. 格力干的?顾客京东上买到二手奥克斯空调 京东、奥克斯回应...
  7. 机器学习--k均值聚类(K-means)
  8. 大工计算机基础在线作业答案,大工1209《计算机应用基础》在线作业123.doc
  9. Redis--五种基础数据结构及应用场景
  10. php当前页面删除处理,php删除记录同时刷新当前页面的实现代码
  11. C++中的指针和-操作符
  12. 数电educoder的verilog参考答案
  13. 自用推荐【浏览器网页监控插件 Distill Web Monitor】
  14. 屏幕录像专家 - 视频压缩教程
  15. 游戏数据库 TcaplusDB
  16. 深入理解微信二维码扫码登录的原理
  17. 用python画小仓鼠教程_小仓鼠简笔画教程
  18. CCNP13:QOS【分类、队列、标记、丢弃】技术
  19. 华尔街见闻-2016年2月
  20. Multi-Objective Computation Sharing in Energy and Delay Constrained Mobile Edge Computing

热门文章

  1. lua invalid pattern capture
  2. 马科维兹+matlab,“马科维茨”投资组合模型实践——第三章 投资组合优化:最小方差与最大夏普比率...
  3. 基于FPGA的超声波测距(verilog)
  4. 手游传奇架设教程_传奇手游战神引擎架设教程
  5. 手机H5-调用百度地图导航
  6. 《蔡康永的说话之道》-[中]蔡康永
  7. boost noncopyable实现与ADL
  8. php linux 一键部署工具,Linux一键配置工具ezhttp介绍
  9. 费马大定理四分之一解决
  10. 智能家居生活之视频监控