1. 介绍

我们知道，在对图像执行卷积操作时，如果不对图像边缘进行填充，卷积核将无法到达图像边缘的像素，而且卷积前后图像的尺寸也会发生变化，这会造成许多麻烦。

因此现在各大深度学习框架的卷积层实现上基本都配备了padding操作，以保证图像输入输出前后的尺寸大小不变。例如，若卷积核大小为3x3，那么就应该设定padding=1，即填充1层边缘像素；若卷积核大小为7x7，那么就应该设定padding=3，填充3层边缘像素；也就是padding大小一般设定为核大小的一半。在pytorch的卷积层定义中，默认的padding为零填充。

self.conv = nn.Conv2d(in_channels=3, out_channels=3, kernel_size=7, padding=3)

2. padding的种类及其pytorch定义

padding，即边缘填充，可以分为四类：零填充，常数填充，镜像填充，重复填充。

2.1 零填充

对图像或者张量的边缘进行补零填充操作：

class ZeroPad2d(ConstantPad2d):# Pads the input tensor boundaries with zero.def __init__(self, padding):super(ZeroPad2d, self).__init__(padding, 0)

2.2 常数填充

定义一个常数来对图像或者张量的边缘进行填充，若该常数等于0则等价于零填充。

class ConstantPad2d(_ConstantPadNd):# Pads the input tensor boundaries with a constant value.def __init__(self, padding, value):super(ConstantPad2d, self).__init__(value)self.padding = _quadruple(padding)

2.3 镜像填充

对图像或者张量的边缘进行镜像对称的填充，示例如下：

>>> m = nn.ReflectionPad2d(2)
>>> input = torch.arange(9).reshape(1, 1, 3, 3).float()
>>> input(0 ,0 ,.,.) =0  1  23  4  56  7  8
[torch.FloatTensor of size (1,1,3,3)]>>> m(input)(0 ,0 ,.,.) =8   7   6   7   8   7   65   4   3   4   5   4   32   1   0   1   2   1   05   4   3   4   5   4   38   7   6   7   8   7   65   4   3   4   5   4   32   1   0   1   2   1   0

class ReflectionPad2d(_ReflectionPadNd):# Pads the input tensor using the reflection of the input boundary.def __init__(self, padding):super(ReflectionPad2d, self).__init__()self.padding = _quadruple(padding)

2.4 重复填充

对图像或者张量的边缘进行重复填充，就是说直接用边缘的像素值来填充。示例如下：

>>> m = nn.ReplicationPad2d(2)
>>> input = torch.arange(9).reshape(1, 1, 3, 3).float()
>>> input(0 ,0 ,.,.) =0  1  23  4  56  7  8
[torch.FloatTensor of size (1,1,3,3)]>>> m(input)(0 ,0 ,.,.) =0   0   0   1   2   2   20   0   0   1   2   2   20   0   0   1   2   2   23   3   3   4   5   5   56   6   6   7   8   8   86   6   6   7   8   8   86   6   6   7   8   8   8
[torch.FloatTensor of size (1,1,7,7)]

class ReplicationPad2d(_ReplicationPadNd):# Pads the input tensor using replication of the input boundary.def __init__(self, padding):super(ReplicationPad2d, self).__init__()self.padding = _quadruple(padding)

3. 实际应用

在许多计算机视觉任务中，例如图像分类，zero padding已经能够满足要求。但是不结合实际地乱用也是不行的。比方说，在图像增强/图像生成领域，zero padding可能会导致边缘出现伪影，如下所示：

这时候，可以改用镜像填充来代替零填充操作。我们定义一个新的padding层，然后把卷积层里的padding参数置为0.

具体写法如下：

class DEMO(nn.Module):def __init__(self):super(DEMO, self).__init__()self.pad = nn.ReflectionPad2d(1)self.conv = nn.Conv2d(in_channels=3, out_channels=3, kernel_size=3, padding=0)def forward(self, x):x = self.pad(x)x = self.conv(x)return F.relu(x)

以低光照增强任务为例，最终对比效果如下图。零填充会产生边缘伪影，而镜像填充很好地缓解了这一效应。

补充：图像处理之卷积模式及C++实现

4. 最后

PyTorch中的padding操作相关推荐

Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别
Tensorflow 和 Pytorch 中 Conv2d Padding的区别 Pytorch中Conv2d的Padding 可以是整数,二元组,字符串三种形式. 整数(int).如果输入的padd ...
pytorch中的卷积操作详解
首先说下pytorch中的Tensor通道排列顺序是:[batch, channel, height, width] 我们常用的卷积(Conv2d)在pytorch中对应的函数是: torch.nn. ...
opencv和pytorch中的warp操作函数：cv2.warpAffine, torch.nn.functional.grid_sample, cv2.warpPerspective
关于图像的warp操作是指利用一个旋转缩放矩阵对图像进行操作. 常见的操作有,平移,绕某个点旋转,缩放. opencv中有getRotationMatrix2D,warpAffine, getAffi ...
pytorch中的乘法操作
pytorch中提供了多种函数用于乘法操作,不同函数,功能有什么不一样呢? torch.mul multiply是mul的别名,与mul用法一致 torch.mul(input, other, *, ...
PyTorch中池化层的padding和ceil_mode参数设置
在池化操作的接口中,padding和ceil_mode这两个参数会影响到输出特征图的大小.padding即对特征图大小进行扩充的像素数量:ceil_mode指明,当剩余的像素不足滤波器大小,是否仍对这 ...
python中tolist_高效的张量操作 Pytorch中就占5种
PyTorch是一个基于Python的科学包,用于使用一种称为张量的特殊数据类型执行高级操作. 虽然也有其他方式可以实现相同的效果,但今天分享的这5个操作更加方便高效,值得一试. 什么是张量? 张量是 ...
pytorch中自加（+=）与普通加的区别，及原位操作
1 导论本文阅读时长约为3分钟. 在今年的三大顶会中,利用pytorch做研究的论文已经一枝独秀,这归功于它的易操作性.当然,pytorch中也有一些需要注意的点,如自加和普通加,在一般的语言中两者 ...
【小白学习PyTorch教程】十七、 PyTorch 中数据集torchvision和torchtext
@Author:Runsen 对于PyTorch加载和处理不同类型数据,官方提供了torchvision和torchtext. 之前使用 torchDataLoader类直接加载图像并将其转换为张量. ...
torch中的inplace操作问题解决方法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 torch中的inplace操作问题解决方法一.inplace操作是什么? 典型的inplace操作有哪些? 二.出错案例总结例 ...

PyTorch中的padding操作