来源:人工智能AI技术本文约2600字,建议阅读8分钟
本文介绍了十五种经典的CNN网络结构。

CNN基本部件介绍

1. 局部感受野

在图像中局部像素之间的联系较为紧密,而距离较远的像素联系相对较弱。因此,其实每个神经元没必要对图像全局进行感知,只需要感知局部信息,然后在更高层局部信息综合起来即可得到全局信息。卷积操作即是局部感受野的实现,并且卷积操作因为能够权值共享,所以也减少了参数量。

2. 池化

池化是将输入图像进行缩小,减少像素信息,只保留重要信息,主要是为了减少计算量。主要包括最大池化和均值池化。

3. 激活函数

激活函数用来加入非线性。常见的激活函数有sigmod, tanh, relu,前两者常用在全连接层,relu常见于卷积层。

4. 全连接层

全连接层在整个卷积神经网络中起分类器的作用。在全连接层之前需要将之前的输出展平。

经典网络结构

1. LeNet5

由两个卷积层,两个池化层,两个全连接层组成。卷积核都是5×5,stride=1,池化层使用maxpooling。

2. AlexNet

模型共八层(不算input层),包含五个卷积层、三个全连接层。最后一层使用softmax做分类输出。

AlexNet使用了ReLU做激活函数;防止过拟合使用dropout和数据增强;双GPU实现;使用LRN。

3. VGG

全部使用3×3卷积核的堆叠,来模拟更大的感受野,并且网络层数更深。VGG有五段卷积,每段卷积后接一层最大池化。卷积核数目逐渐增加。

总结:LRN作用不大;越深的网络效果越好;1×1的卷积也很有效但是没有3×3好。

4. GoogLeNet

  • Inception v1

从VGG中我们了解到,网络层数越深效果越好。但是随着模型越深参数越来越多,这就导致网络比较容易过拟合,需要提供更多的训练数据;另外,复杂的网络意味更多的计算量,更大的模型存储,需要更多的资源,且速度不够快。GoogLeNet就是从减少参数的角度来设计网络结构的。

GoogLeNet通过增加网络宽度的方式来增加网络复杂度,让网络可以自己去应该如何选择卷积核。这种设计减少了参数 ,同时提高了网络对多种尺度的适应性。使用了1×1卷积可以使网络在不增加参数的情况下增加网络复杂度。

  • Inception-v2

在v1的基础上加入batch normalization技术,在tensorflow中,使用BN在激活函数之前效果更好;将5×5卷积替换成两个连续的3×3卷积,使网络更深,参数更少。

  • Inception-v3

核心思想是将卷积核分解成更小的卷积,如将7×7分解成1×7和7×1两个卷积核,使网络参数减少,深度加深。

  • Inception-v4

引入了ResNet,使训练加速,性能提升。但是当滤波器的数目过大(>1000)时,训练很不稳定,可以加入activate scaling因子来缓解。

5. Xception

在Inception-v3的基础上提出,基本思想是通道分离式卷积,但是又有区别。模型参数稍微减少,但是精度更高。Xception先做1×1卷积再做3×3卷积,即先将通道合并,再进行空间卷积。depthwise正好相反,先进行空间3×3卷积,再进行通道1×1卷积。核心思想是遵循一个假设:卷积的时候要将通道的卷积与空间的卷积进行分离。而MobileNet-v1用的就是depthwise的顺序,并且加了BN和ReLU。Xception的参数量与Inception-v3相差不大,其增加了网络宽度,旨在提升网络准确率,而MobileNet-v1旨在减少网络参数,提高效率。

6. MobileNet系列

  • V1

使用depthwise separable convolutions;放弃pooling层,而使用stride=2的卷积。标准卷积的卷积核的通道数等于输入特征图的通道数;而depthwise卷积核通道数是1;还有两个参数可以控制,a控制输入输出通道数;p控制图像(特征图)分辨率。

  • V2

相比v1有三点不同:1.引入了残差结构;2.在dw之前先进行1×1卷积增加feature map通道数,与一般的residual block是不同的;3.pointwise结束之后弃用ReLU,改为linear激活函数,来防止ReLU对特征的破环。这样做是因为dw层提取的特征受限于输入的通道数,若采用传统的residual block,先压缩那dw可提取的特征就更少了,因此一开始不压缩,反而先扩张。但是当采用扩张-卷积-压缩时,在压缩之后会碰到一个问题,ReLU会破环特征,而特征本来就已经被压缩,再经过ReLU还会损失一部分特征,应该采用linear。

  • V3

互补搜索技术组合:由资源受限的NAS执行模块集搜索,NetAdapt执行局部搜索;网络结构改进:将最后一步的平均池化层前移并移除最后一个卷积层,引入h-swish激活函数,修改了开始的滤波器组。

V3综合了v1的深度可分离卷积,v2的具有线性瓶颈的反残差结构,SE结构的轻量级注意力模型。

7. EffNet

EffNet是对MobileNet-v1的改进,主要思想是:将MobileNet-1的dw层分解层两个3×1和1×3的dw层,这样 第一层之后就采用pooling,从而减少第二层的计算量。EffNet比MobileNet-v1和ShuffleNet-v1模型更小,进度更高。

8. EfficientNet

研究网络设计时在depth, width, resolution上进行扩展的方式,以及之间的相互关系。可以取得更高的效率和准确率。

9. ResNet

VGG证明更深的网络层数是提高精度的有效手段,但是更深的网络极易导致梯度弥散,从而导致网络无法收敛。经测试,20层以上会随着层数增加收敛效果越来越差。ResNet可以很好的解决梯度消失的问题(其实是缓解,并不能真正解决),ResNet增加了shortcut连边。

10. ResNeXt

基于ResNet和Inception的split+transform+concate结合。但效果却比ResNet、Inception、Inception-ResNet效果都要好。可以使用group convolution。一般来说增加网络表达能力的途径有三种:

  • 增加网络深度,如从AlexNet到ResNet,但是实验结果表明由网络深度带来的提升越来越小;

  • 增加网络模块的宽度,但是宽度的增加必然带来指数级的参数规模提升,也非主流CNN设计;

  • 改善CNN网络结构设计,如Inception系列和ResNeXt等。

且实验发现增加Cardinatity即一个block中所具有的相同分支的数目可以更好的提升模型表达能力。

11. DenseNet

DenseNet通过特征重用来大幅减少网络的参数量,又在一定程度上缓解了梯度消失问题。

12. SqueezeNet

提出了fire-module:squeeze层+expand层。Squeeze层就是1×1卷积,expand层用1×1和3×3分别卷积,然后concatenation。squeezeNet参数是alexnet的1/50,经过压缩之后是1/510,但是准确率和alexnet相当。

13. ShuffleNet系列

  • V1

通过分组卷积与1×1的逐点群卷积核来降低计算量,通过重组通道来丰富各个通道的信息。Xception和ResNeXt在小型网络模型中效率较低,因为大量的1×1卷积很耗资源,因此提出逐点群卷积来降低计算复杂度,但是使用逐点群卷积会有副作用,故在此基础上提出通道shuffle来帮助信息流通。虽然dw可以减少计算量和参数量,但是在低功耗设备上,与密集的操作相比,计算、存储访问的效率更差,故shufflenet上旨在bottleneck上使用深度卷积,尽可能减少开销。

  • V2

使神经网络更加高效的CNN网络结构设计准则:

  • 输入通道数与输出通道数保持相等可以最小化内存访问成本;

  • 分组卷积中使用过多的分组会增加内存访问成本;

  • 网络结构太复杂(分支和基本单元过多)会降低网络的并行程度;

  • element-wise的操作消耗也不可忽略。

14. SENet

15. SKNet

版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

作者丨zzq

来源丨https://zhuanlan.zhihu.com/p/68411179

编辑丨极市平台

编辑:黄继彦

校对:汪雨晴

收藏 | 一文遍览CNN网络结构的发展相关推荐

  1. CNN网络结构的发展:从LeNet到EfficientNet

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:zzq https://zhuanlan.zhihu.com/p/68411 ...

  2. CNN网络结构的发展

    经典网络结构 部分网络的pytorch实现github代码:CNN-nets 1. LeNet5 由两个卷积层,两个池化层,两个全连接层组成. 卷积核都是5×5,stride=1,池化层使用maxpo ...

  3. CNN网络结构发展演变:从LeNet到HRNet(一)

    个人经验总结博客,写的不好的地方还请各路大神指正,不喜勿喷.网络结构图基本都是引用的,如有雷同,实在抱歉,可在下方评论中留言是否删除. 我们知道CNN网络结构一直在更新迭代,卷积可以理解为:" ...

  4. 版本变迁_一本书遍览古今中外红楼梦版本变迁

    四百种版本,近千幅彩图,全景描绘<红楼梦>版本演化史 <红楼梦版本图说> 一本书遍览古今中外<红楼梦>版本变迁 <红楼梦>自乾隆年间成书以来影响巨大,是 ...

  5. CNN网络结构发展最全整理

    来源:人工智能AI技术 本文约2500字,建议阅读9分钟 本文为你整理CNN网络结构发展史. 作者丨zzq 来源丨https://zhuanlan.zhihu.com/p/68411179 CNN基本 ...

  6. html类选择器使用在什么场景,你需掌握的CSS知识都在这了(长文建议收藏,文末有福利)...

    1.CSS盒模型,在不同浏览器的差异 css 标准盒子模型 css盒子模型 又称为框模型(Box Model),包含了元素内容(content).内边距(padding).边框(border).外边距 ...

  7. css 商城 两列_你需掌握的CSS知识都在这了(长文建议收藏,文末有福利)

    1.CSS盒模型,在不同浏览器的差异 css 标准盒子模型 css盒子模型 又称为框模型(Box Model),包含了元素内容(content).内边距(padding).边框(border).外边距 ...

  8. 周金涛生前20篇雄文精华,一文尽览

    周金涛生前20篇雄文精华,一文尽览 前言 2016年12月27日,中信建投首席经济学家周金涛因病去世,享年44岁. 周金涛资料照片 周金涛,1972年7月出生于天津,毕业于南开大学.自2005年以来, ...

  9. CNN网络结构进化概述

    网络工程问题是深度学习中比较基础的问题,网络工程的难点在于,缺乏对深度神经网络的理论理解(即常说的黑盒模型),无法根据理论来设计网络结构,实际中更多的是不断的尝试,根据实验反馈出来的结果确定某一结构是 ...

最新文章

  1. 无法连接NVIDIA驱动:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver
  2. Windows系统调用学习笔记(四)—— 系统服务表SSDT
  3. [MATLAB学习笔记]matlab结构体A.B
  4. www.javaei.com网站建设手记——(15)h2p被开源中国收录为开源项目
  5. Linux修改hostname的几种方式,及遇到的问题
  6. vue 使用axios发送的请求使用md5加密
  7. vue style.css,vue * !!vue-style-loader!css-loader?
  8. 手电筒安卓_王思聪吃热狗数字时钟app安卓android苹果ios
  9. unity3d利用pano2VR实现全景视图效果
  10. html怎么引入字体库,CSS引入外部字体
  11. Android常用炫酷风格控件包含项目地址汇总
  12. 【Matlab学习手记】利用Matlab提取图片曲线数据
  13. java判断是否是英文_Java 判断输入是否为英文字符
  14. linux的命令名必须是小写英文字母,Linux常用命令及操作
  15. vcpu和cpu的关系
  16. 工具类 - 思维导图
  17. windows10安装配置vim
  18. multi-kernels、ALLOC与USE、Zero-Copy
  19. 03-MapStruct-基本的映射方法
  20. 深入讨论DECLARE_HANDLE(HINSTANCE)

热门文章

  1. 变量作用域与预处理命令习题
  2. 输入字符串,统计英文字符、大写小写字母,数字字符,空格和其他字符
  3. matlab数学实验 胡良剑,matlab数学实验习题全部答案(胡良剑)
  4. rhel6编译ssh的src.rpm包并修改spec参数
  5. (转)Properties Editor为你解除通过native2ascii进行Unicode转码的烦恼
  6. 10个方法让程序员更加优秀
  7. Xamarin.Android使用教程之Android开发所需的模拟器
  8. java.lang.OutOfMemoryError: Java heap space的解决办法
  9. CCNP路由实验---3、人工汇总EIGRP路由
  10. moment格式换时间_1个顶20个!这个格式转换神器到底有多神?今年最想给你分享的软件!...