前言

卷积和反卷积在CNN中经常被用到,想要彻底搞懂并不是那么容易。本文主要分三个部分来讲解卷积和反卷积,分别包括概念、工作过程、代码示例,其中代码实践部分主结合TensorFlow框架来进行实践。给大家介绍一个卷积过程的可视化工具,这个项目是github上面的一个开源项目。

卷积可视化github地址:https://github.com/vdumoulin/conv_arithmetic

卷积和反卷积

卷积(Convolutional):卷积在图像处理领域被广泛的应用,像滤波、边缘检测、图片锐化等,都是通过不同的卷积核来实现的。在卷积神经网络中通过卷积操作可以提取图片中的特征,低层的卷积层可以提取到图片的一些边缘、线条、角等特征,高层的卷积能够从低层的卷积层中学到更复杂的特征,从而实现到图片的分类和识别。

反卷积:反卷积也被称为转置卷积,反卷积其实就是卷积的逆过程。大家可能对于反卷积的认识有一个误区,以为通过反卷积就可以获取到经过卷积之前的图片,实际上通过反卷积操作并不能还原出卷积之前的图片,只能还原出卷积之前图片的尺寸。那么到底反卷积有什么作用呢?通过反卷积可以用来可视化卷积的过程,反卷积在GAN等领域中有着大量的应用。

工作过程

卷积

无padding无stride的卷积

上图展示了一个卷积的过程,其中蓝色的图片(4*4)表示的是进行卷积的图片阴影的图片(3*3)表示的是卷积核绿色的图片(2*2)表示是进行卷积计算之后的图片。在卷积操作中有几个比较重要的参数,输入图片的尺寸、步长、卷积核的大小、输出图片的尺寸、填充大小

下面用一个图来详细介绍这些参数:

输入图片的尺寸:上图中的蓝色图片(5*5),表示的是需要进行卷积操作的图片,在后面的公式中有i来表示输入图片的尺寸。

卷积核的大小:上图中的会移动阴影图片表示的是卷积核(4*4),通过不同参数不同大小的卷积核可以提取到图片的不同特征,后面用k表示卷积核的尺寸。

步长:是指卷积核移动的长度,通过上图可以发现卷积核水平方向移动的步长和垂直方向移动的步长是一样的都是1,后面用s表示步长。

填充大小:是指在输入图片周围填充的圈数,通常都是用0来进行填充的,上图中蓝色图片周围两圈虚线的矩形表示的是填充的值,所以padding是2,后面用p来表示填充大小。

输出图片的尺寸:经过卷积操作之后获取到的图片的大小,上图的绿色图片(6*6),后面用o来表示。

如果已知i、k、p、s,可以求得o,计算公式如下:

反卷积

无stride的反卷积

上图展示一个反卷积的工作过程,乍看一下好像反卷积和卷积的工作过程差不多,主要的区别在于反卷积输出图片的尺寸会大于输入图片的尺寸,通过增加padding来实现这一操作,上图展示的是一个strides(步长)为1的反卷积。下面看一个strides不为1的反卷积

上图中的反卷积的stride为2,通过间隔插入padding来实现的。同样,可以根据反卷积的o、s、k、p参数来计算反卷积的输出i,也就是卷积的输入。公式如下:i=(o−1)∗s+k−2∗p,其实就是根据上式推导出来的。

代码示例

为了便于大家理解卷积和反卷积工作过程,将会使用图示的方式来展示卷积和反卷积的工作过程,并利用tensorflow的卷积和反卷积函数来进行验证。

卷积

使用tensorflow来实现卷积的时候,主要利用tf.nn.conv2d函数来实现的,先介绍一下函数的参数

功能说明:通过4维的input和filter来计算2维卷积

  • input:4维的tensor,需要进行卷积的矩阵
  • filter:4维的tensor,卷积核的参数,需要和input具有相同的数据类型,[filter_height,filter_width,in_channels,out_channels],其中filter_height表示卷积核的高,filter_width表示卷积核的宽,in_channels表示需要进行卷积图片的通道数,out_channels卷积之后输出的通道数
  • strides:int类型的列表,设置卷积核滑动的步长
  • padding:填充类型有"SAME"和"VALID"两种模式,当步长为1时,padding为"SAME"可以保持输出与输入的尺寸具有相同的大小。
  • use_cudnn_on_gpu:使用cudnn来加速卷积,默认是True
  • data_format:输入数据的格式,有"NHWC"和"NCHW"两种模式,默认使用的是"NHWC",表示[batch,height,width,channels],"NCHW"数据格式[batch,channels,height,width]
  • dilations:一维的list,默认是[1,1,1,1],用来设置卷积核的扩展
  • name:操作的名称

TensorFlow提供的卷积函数padding只有"SAME""VALID"两种模式,所以输出矩阵的尺寸大小与之前的公式有所不同,下面介绍这两种模式下输出矩阵尺寸的计算公式:

padding为SAME时ceil(i/s)其中i表示输入矩阵的大小,s表示卷积核的步长,ceil函数表示向上取整。下图展示是一个padding为SAME的卷积,卷积开始的时候保证卷积核的中心位于输入矩阵角的顶点位置。

padding为VALID时:ceil((i−k+1)/s),k表示卷积核的尺寸。下图展示的是一个padding为VALID的卷积过程,卷积核始终都是位于输入矩阵内进行移动。

下面看一个卷积的计算例子

卷积核与输入矩阵对应的位置进行乘加计算即可,对于多维输入矩阵和多维卷积核的卷积计算,将卷积后的结果进行堆叠,作为最终卷积的输出结果

反卷积

tensorflow提供了tf.nn.conv2d_transpose函数来计算反卷积

功能说明:计算反卷积(转置卷积)

  • value:4维的tensor,float类型,需要进行反卷积的矩阵
  • filter:卷积核,参数格式[height,width,output_channels,in_channels],这里需要注意output_channels和in_channels的顺序
  • output_shape:一维的Tensor,设置反卷积输出矩阵的shape
  • strides:反卷积的步长
  • padding:"SAME"和"VALID"两种模式
  • data_format:和之前卷积参数一样
  • name:操作的名称

需要注意的是,通过反卷积并不能还原卷积之前的矩阵,只能从大小上进行还原,反卷积的本质还是卷积,只是在进行卷积之前,会进行一个自动的padding补0,从而使得输出的矩阵与指定输出矩阵的shape相同。框架本身,会根据你设定的反卷积值来计算输入矩阵的尺寸,如果shape不符合,则会报错。

错误提示:InvalidArgumentError (see above for traceback): Conv2DSlowBackpropInput,这时候需要检查反卷积的参数与输入矩阵之间的shape是否符合。计算规则可以根据padding为SAME还是VALID来计算输入和输出矩阵的shape是否相符合。如上例中,根据反卷积的参数来计算输入矩阵的shape:因为padding是VALID模式,所以我们套用ceil((i−k+1)/s)=ceil((4−3+1)/1)=2,而输入矩阵x1的shape刚好是2*2,所以符合。

上面介绍的反卷积的stride是1,接下来看一个stride不为1的例子

需要注意的是,在进行反卷积的时候设置的stride并不是指反卷积在进行卷积时候卷积核的移动步长,而是被卷积矩阵填充的padding,仔细观察红色框内可以发现之前输入矩阵之间有一行和一列0的填充.


最近开通了微信公众号,在微信公众号上,分享了一些资料,搜索"Python机器学习之路"关注我即可获取,有什么问题欢迎咨询,大家一起学习相互提高。

cnn stride and padding_彻底搞懂CNN中的卷积和反卷积相关推荐

  1. 彻底搞懂 JS 中 this 机制

    彻底搞懂 JS 中 this 机制 摘要:本文属于原创,欢迎转载,转载请保留出处:https://github.com/jasonGeng88/blog 目录 this 是什么 this 的四种绑定规 ...

  2. 15个示例让你搞懂Linux中的cd命令

    15个示例让你搞懂Linux中的cd命令 在Linux中,cd(更改目录)命令是新手和系统管理员最重要且使用最广泛的命令之一.对于没有头绪的管理员来说,cd是导航到其他目录以检查日志,执行程序/应用程 ...

  3. java 自旋锁_搞懂Java中的自旋锁

    轻松搞懂Java中的自旋锁 前言 在之前的文章<一文彻底搞懂面试中常问的各种"锁">中介绍了Java中的各种"锁",可能对于不是很了解这些概念的同学 ...

  4. 分分搞懂c#中的委托

    分分搞懂c#中的委托: 不说废话,不来虚的概念,不管代码是否有意义,看我的优化之路,你会理解委托了: 源代码1 public class test{//我们不管代码是否有意义,我们直接看代码重构和一步 ...

  5. 一文搞懂Qt中的颜色渐变(QGradient Class)

    一文搞懂Qt中的颜色渐变(QGradient Class) 1, 快速开始! Qt中与颜色渐变有关的类是QGradient 其中它又有三个子类:QLinearGradient.QRadialGradi ...

  6. 帮你彻底搞懂JS中的prototype、__proto__与constructor(图解)

    帮你彻底搞懂JS中的prototype.__proto__与constructor(图解) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文 ...

  7. 这一篇彻底搞懂JS中的prototype、__proto__与constructor真的很好

    文章目录 1. 前言 2. _ _ proto _ _ 属性 3. prototype属性 4. constructor属性 5. 总结 提示:不要排斥,静下心来,认真读完,你就搞懂了!(可以先看一下 ...

  8. (转)帮你彻底搞懂JS中的prototype、__proto__与constructor(图解)

    文章目录 1. 前言 2. _ _ proto _ _ 属性 3. prototype属性 4. constructor属性 5. 总结 提示:不要排斥,静下心来,认真读完,你就搞懂了!(可以先看一下 ...

  9. 彻底搞懂javascript中的replace函数

    javascript这门语言一直就像一位带着面纱的美女,总是看不清,摸不透,一直专注服务器端,也从来没有特别重视过,直到最近几年,javascript越来越重要,越来越通用.最近和前端走的比较近,借此 ...

最新文章

  1. RxJava2.x 萌新之路 操作符篇
  2. 学习Spring-Cloud –基础结构和配置
  3. e语言通用进销存源码_Go 语言设计哲学之五:代码风格的唯一标准
  4. C语言讲义——数组和指针
  5. GreenSock (TweenMax) 动画案例(一)
  6. 服务器端jQuery – phpQuery简要
  7. 医院预约挂号系统 ssm
  8. OpenCV-python显示图片时图片比窗口大的解决办法
  9. java 字符串4%3e=3,gson 生成的json字符串带\u003c,\u003d,\u003e的解决方案
  10. linux桌面lxde 安装_如何在Arch Linux上安装LXDE桌面
  11. 完美C Perfect C 丰胸胶囊
  12. 北京烤鸭+腊肉炒花菜+香椿炒蛋
  13. 618终极剁手攻略,收割全套数据分析师课程!
  14. python数据分析之《太平洋汽车》点评数据及论坛文本分析
  15. Golang操作阿里云OSS上传文件
  16. Nginx入门学习笔记
  17. 第二阶段--团队冲刺--第五天
  18. HTML制作简单课表
  19. MySQL查询总积分前十的用户信息和总分
  20. 【Unity3D】Unity3D开发《我的世界》之六、创建地形(视频 + 源码)

热门文章

  1. TensorFlow10-多层神经网络建模,存储和载入
  2. while循环在Python中的应用举例 及其break continue的使用
  3. [NOIP2003]传染病控制题解
  4. java基础英语---第一天
  5. 梯度下降和EM算法,kmeans的em推导
  6. a=a+b和a+=b的区别
  7. 4-数组、指针与字符串1.4-动态内存分配
  8. jQuery基本知识
  9. 第四课 脱壳必备知识要点及方法
  10. ExtJS 异步加载树节点