pytorch卷积层与池化层输出的尺寸的计算公式详解

要设计卷积神经网络的结构,必须匹配层与层之间的输入与输出的尺寸,这就需要较好的计算输出尺寸

先列出公式:

卷积后,池化后尺寸计算公式:
(图像尺寸-卷积核尺寸 + 2*填充值)/步长+1
(图像尺寸-池化窗尺寸 + 2*填充值)/步长+1

即:

卷积神将网络的计算公式为:
N=(W-F+2P)/S+1
其中
N:输出大小
W:输入大小
F:卷积核大小
P:填充值的大小
S:步长大小

例Conv2d(后面给出实例来讲解计算方法):


`

class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)
卷积一层的几个参数:
in_channels=3:表示的是输入的通道数,RGB型的通道数是3.
out_channels:表示的是输出的通道数,设定输出通道数(这个是可以根据自己的需要来设置的)
kernel_size=12:表示卷积核的大小是12x12的,也就是上面的 F=12
stride=4:表示的是步长为4,也就是上面的S=4
padding=2:表示的是填充值的大小为2,也就是上面的P=2

实例:

cove1d:用于文本数据,只对宽度进行卷积,对高度不进行卷积
cove2d:用于图像数据,对宽度和高度都进行卷积

import torch
from torch.autograd import Variable
#torch.autograd提供了类和函数用来对任意标量函数进行求导。
import torch.nn as nn
import torch.nn.functional as F
class MNISTConvNet(nn.Module):def __init__(self):super(MNISTConvNet, self).__init__()'''
这是对继承自父类的属性进行初始化。而且是用父类的初始化方法来初始化继承的属性。
也就是说,子类继承了父类的所有属性和方法,父类属性自然会用父类方法来进行初始化。'''
#定义网络结构self.conv1 = nn.Conv2d(1, 10, 5)self.pool1 = nn.MaxPool2d(2, 2)self.conv2 = nn.Conv2d(10, 20, 5)self.pool2 = nn.MaxPool2d(2, 2)self.fc1 = nn.Linear(320, 50)self.fc2 = nn.Linear(50, 10)def forward(self, input):x = self.pool1(F.relu(self.conv1(input)))x = self.pool2(F.relu(self.conv2(x))).view(320)x = self.fc2(self.fc1(x))return xnet = MNISTConvNet()
print(net)
input = Variable(torch.randn(1, 1, 28, 28))
out = net(input)
print(out.size())

我们在这个实例中抽出网络结构部分:

        self.conv1 = nn.Conv2d(1, 10, 5)self.pool1 = nn.MaxPool2d(2, 2)self.conv2 = nn.Conv2d(10, 20, 5)self.pool2 = nn.MaxPool2d(2, 2)self.fc1 = nn.Linear(320, 50)self.fc2 = nn.Linear(50, 10)def forward(self, input):x = self.pool1(F.relu(self.conv1(input)))x = self.pool2(F.relu(self.conv2(x))).view(320)x = self.fc2(self.fc1(x))

网络结构为:

conv2d--maxpool2d--conv2d--maxpool2d--fullyconnect--fullyconnect

输入图片大小为:input = Variable(torch.randn(1, 1, 28, 28))
28*28的单通道图片,即:1*28*28

接下来,我们分层解析每一层网络的输入和输出:

(1)conv2d(1,10,5)

N:输出大小
W:输入大小   28*28
F:卷积核大小  5*5
P:填充值的大小 0默认值
S:步长大小   1默认值
N=(W-F+2P)/S+1=(28-5 + 2*0)/1 + 1 = 24
输出为:10*24*24

Conv2d(输入通道数, 输出通道数, kernel_size(长和宽)),当卷积核为方形时,只写一个就可以,卷积核不是方形时,长和宽都要写,如下:

self.conv1 = nn.Conv2d(2, 4, (5,2))

(2)MaxPool2d(2, 2)
MaxPool 最大池化层,池化层在卷积神经网络中的作用在于特征融合和降维。池化也是一种类似的卷积操作,只是池化层的所有参数都是超参数,是学习不到的。maxpooling有局部不变性而且可以提取显著特征的同时降低模型的参数,从而降低模型的过拟合。只提取了显著特征,而舍弃了不显著的信息,是的模型的参数减少了,从而一定程度上可以缓解过拟合的产生。

class torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
N:输出大小
W:输入大小   24*24
F:卷积核大小  5*5
P:填充值的大小 0默认值
S:步长大小   1默认值
N=(W-F+2P)/S+1=(24-2 + 2*0)/2 + 1 = 12
输出为:10*12*12

(3)conv2d(10,20,5)

N:输出大小
W:输入大小   12*12
F:卷积核大小  5*5
P:填充值的大小 0默认值
S:步长大小   1默认值
N=(W-F+2P)/S+1=(12-5 + 2*0)/1 + 1 = 8
输出为:20*8*8

(4)MaxPool2d(2, 2)

N:输出大小
W:输入大小   8*8
F:卷积核大小  5*5
P:填充值的大小 0默认值
S:步长大小   1默认值
N=(W-F+2P)/S+1=(8-2 + 2*0)/2 + 1 = 4
输出为:20*4*4

(5)fully-connect Linear(320, 50)

输入:20*4*4=320
输出:50

(6)fully-connect Linear(50, 10)

输入:50
输出:10

所以,整个实例的训练过程数据流动为:

    def forward(self, input):x = self.pool1(F.relu(self.conv1(input)))x = self.pool2(F.relu(self.conv2(x))).view(320)x = self.fc2(self.fc1(x))

激活函数Relu,在神经网络中的作用是:通过加权的输入进行非线性组合产生非线性决策边界
简单的来说就是增加非线性作用。
在深层卷积神经网络中使用激活函数同样也是增加非线性,主要是为了解决sigmoid函数带来的梯度消失问题。

(pytorch-深度学习系列)pytorch卷积层与池化层输出的尺寸的计算公式详解相关推荐

  1. cnn池化层输入通道数_(pytorch-深度学习系列)CNN中的池化层-学习笔记

    CNN中的池化层 首先,池化(pooling)层的提出是为了缓解卷积层对位置的过度敏感性. 什么意思? 比如在图像边缘检测问题中,实际图像里,我们的目标物体不会总出现在固定位置,即使我们连续拍摄同一个 ...

  2. (pytorch-深度学习系列)CNN中的池化层-学习笔记

    CNN中的池化层 首先,池化(pooling)层的提出是为了缓解卷积层对位置的过度敏感性. 什么意思? 比如在图像边缘检测问题中,实际图像里,我们的目标物体不会总出现在固定位置,即使我们连续拍摄同一个 ...

  3. 【从零开始学习深度学习】22. 卷积神经网络(CNN)中填充(padding)与步幅(stride)详解,填充、步幅、输入及输出之间的关系

    目录 1 填充(padding) 2 步幅(stride) 总结 在上一篇文章中,我们使用高和宽为3的输入与高和宽为2的卷积核得到高和宽为2的输出.一般来说,假设输入形状是 n h × n w n_h ...

  4. PyTorch深度学习实战 | 典型卷积神经网络

    在深度学习的发展过程中,出现了很多经典的卷积神经网络,它们对深度学习的学术研究和工业生产都起到了巨大的促进作用,如VGG.ResNet.Inception和DenseNet等,很多投入实用的卷积神经都 ...

  5. 深度学习入门 (九):卷积层和池化层的实现

    目录 卷积神经网络 CNN 整体结构 卷积层 全连接层存在的问题 卷积运算 乘积累加运算 偏置 填充 (padding) 步幅 (stride) 小结:卷积层的输出特征图的大小 3 维数据的卷积运算 ...

  6. pytorch 入门:GPU加速,卷积层,池化层

    GPU 加速 深度学习设计很多向量和多矩阵运算,比如BP , CNN 等深层模型都可以写成矩阵运算的格式,不用写成循环运算.但是CPU 上矩阵的运算会被展成循环的形式,CPU 是串行执行的.而GPU ...

  7. 【深度学习系列】卷积神经网络CNN原理详解(一)——基本原理(1)

    上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...

  8. 吴恩达.深度学习系列-C4卷积神经网络-W2深度卷积模型案例

    吴恩达.深度学习系列-C4卷积神经网络-W2深度卷积模型案例 (本笔记部分内容直接引用redstone的笔记http://redstonewill.com/1240/.原文整理的非常好,引入并添加我自 ...

  9. 转:卷积神经网络_(1)卷积层和池化层学习

    博主总结的很好,学习中.转载:http://www.cnblogs.com/zf-blog/p/6075286.htm 卷积神经网络_(1)卷积层和池化层学习 卷积神经网络(CNN)由输入层.卷积层. ...

最新文章

  1. 使用intelliJ创建 spring boot + gradle + mybatis站点
  2. IQueryable和IEnumerable的区别
  3. exists hive中如何使用_HIVE使用基础
  4. SAP Spartacus visible-focus是如何施加到HTML element上的
  5. [渝粤教育] 西南科技大学 施工组织 在线考试复习资料
  6. Java笔记12-函数式接口
  7. python 交易日_Python判断某天是否为A股“交易日”?
  8. ensure函数_webpack的require.ensure()
  9. YOLOv2检测过程的Tensorflow实现
  10. Arista CloudVision软件部署
  11. 数字电视 星座图 matlab,数字电视 MER 及星座图剖析
  12. 使用keytool转换签名证书格式,keyStore、jks签名证书相互转换
  13. 【搬运】罗霸道网文写作经验分享
  14. java LPT1_com1/lpt1/prn/nul 木马后门处理方法集合
  15. javaFx实现直尺效果——可旋转、拖动、拉长
  16. 【渝粤题库】广东开放大学 标准化专题讲座1 形成性考核
  17. Spring Security Oauth2:授权模式、简单模式 、密码模式 和 客户端模式
  18. 人工智能学习路线(转载)
  19. electron-v8.2.1-win32-x64.zip 下载失败(npm install electron 安装失败)
  20. 龙格现象 图像对比及Python代码实现

热门文章

  1. python中类和对象的内容_python中的类和对象
  2. 算法训练 P0103
  3. latex 甘特图_[简004] 史上'最全最精简'Markdown语法-速览速用
  4. 鸿蒙系统方舟运行时,方舟编译器立功!第三方App已经落地,距离鸿蒙系统还会远吗?...
  5. 抽象类可以有构造函数吗
  6. 根据ip获取地理位置
  7. python-数据类型之列表
  8. 通信基站电池,再也不怕丢了
  9. 宿主如何访问虚拟机中的web服务器
  10. js 事件函数中的参数带换行符或换行标签都不能起作用的解决方法