池化

Contents

[hide]

  • 1 池化: 概述
  • 2 池化的不变性
  • 3 形式化描述
  • 4 中英文对照
  • 5 中文译者

池化: 概述

在通过卷积获得了特征 (features) 之后,下一步我们希望利用这些特征去做分类。理论上讲,人们可以用所有提取得到的特征去训练分类器,例如 softmax 分类器,但这样做面临计算量的挑战。例如:对于一个 96X96 像素的图像,假设我们已经学习得到了400个定义在8X8输入上的特征,每一个特征和图像卷积都会得到一个 (96 − 8 + 1) * (96 − 8 + 1) = 7921 维的卷积特征,由于有 400 个特征,所以每个样例 (example) 都会得到一个 892 * 400 = 3,168,400 维的卷积特征向量。学习一个拥有超过 3 百万特征输入的分类器十分不便,并且容易出现过拟合 (over-fitting)。

为了解决这个问题,首先回忆一下,我们之所以决定使用卷积后的特征是因为图像具有一种“静态性”的属性,这也就意味着在一个图像区域有用的特征极有可能在另一个区域同样适用。因此,为了描述大的图像,一个很自然的想法就是对不同位置的特征进行聚合统计,例如,人们可以计算图像一个区域上的某个特定特征的平均值 (或最大值)。这些概要统计特征不仅具有低得多的维度 (相比使用所有提取得到的特征),同时还会改善结果(不容易过拟合)。这种聚合的操作就叫做池化 (pooling),有时也称为平均池化或者最大池化 (取决于计算池化的方法)。

下图显示池化如何应用于一个图像的四块不重合区域。

池化的不变性

如果人们选择图像中的连续范围作为池化区域,并且只是池化相同(重复)的隐藏单元产生的特征,那么,这些池化单元就具有平移不变性 (translation invariant)。这就意味着即使图像经历了一个小的平移之后,依然会产生相同的 (池化的) 特征。在很多任务中 (例如物体检测、声音识别),我们都更希望得到具有平移不变性的特征,因为即使图像经过了平移,样例(图像)的标记仍然保持不变。例如,如果你处理一个MNIST数据集的数字,把它向左侧或右侧平移,那么不论最终的位置在哪里,你都会期望你的分类器仍然能够精确地将其分类为相同的数字。

(*MNIST 是一个手写数字库识别库: http://yann.lecun.com/exdb/mnist/)

形式化描述

形式上,在获取到我们前面讨论过的卷积特征后,我们要确定池化区域的大小(假定为),来池化我们的卷积特征。那么,我们把卷积特征划分到数个大小为 的不相交区域上,然后用这些区域的平均(或最大)特征来获取池化后的卷积特征。这些池化后的特征便可以用来做分类。

中英文对照

特征 features
样例 example
过拟合 over-fitting
平移不变性 translation invariant
池化 pooling
提取 extract
物体检测 object detection

Stanford UFLDL教程 池化Pooling相关推荐

  1. Stanford UFLDL教程 矢量化编程

    矢量化编程 当使用学习算法时,一段更快的代码通常意味着项目进展更快.例如,如果你的学习算法需要花费20分钟运行完成,这意味着你每个小时能"尝试"3个新主意.但是假如你的程序需要20 ...

  2. Stanford UFLDL教程 主成分分析(PCA)

    Stanford UFLDL教程 主成分分析 Contents [hide] 1 引言 2 实例和数学背景 3 旋转数据 4 数据降维 5 还原近似数据 6 选择主成分个数 7 对图像数据应用PCA算 ...

  3. 一文弄懂各大池化Pooling操作

    池化Pooling是卷积神经网络中常见的一种操作,Pooling层是模仿人的视觉系统对数据进行降维,其本质是降维.在卷积层之后,通过池化来降低卷积层输出的特征维度,减少网络参数和计算成本的同时,降低过 ...

  4. 卷积神经网络中的池化(Pooling)层

    文章目录 卷积神经网络中的池化(Pooling)层 ⚪ 通用的池化方法 1. 最大池化 Max Pooling 2. 平均池化 Average Pooling 3. 混合池化 Mix Pooling ...

  5. 卷积神经网络的卷积及池化(pooling)

    如何理解卷积神经网络中的卷积及池化(pooling) 1. 卷积 卷积层是用一个固定大小的矩形区去席卷原始数据,将原始数据分成一个个和卷积核大小相同的小块,然后将这些小块和卷积核相乘输出一个卷积值(注 ...

  6. Stanford UFLDL教程 卷积特征提取

    卷积特征提取 Contents [hide] 1概述 2全联通网络 3部分联通网络 4卷积 5中英文对照 6中文译者 概述 前面的练习中,解决了一些有关低分辨率图像的问题,比如:小块图像,手写数字小幅 ...

  7. 深度学习(二十七)可视化理解卷积神经网络(反池化 pooling unpooling)

    不明白pooling,unpooling以及upsampling的区别,所以查阅了一些资料 以下为转载原文 可视化理解卷积神经网络 原文地址:http://blog.csdn.net/hjimce/a ...

  8. 【深度学习】池化 (pooling)

    深度学习中,有两种实现非线性的算子.一个是激活函数,另一个就是池化(pooling): 在知乎上面看到一个关于池化的神解释,摘来: 池化=涨水 卷积的目的是为了得到物体的边缘形状可以想象水要了解山立体 ...

  9. 深度学习与神经网络(七)——卷积神经网络之池化pooling 上采样upsample与降采样downsample(下采样)(subsample)(nn.MaxPool2d)

    池化层pooling与采样 upsample与downsample upsample(interpolating)是上采样,是图片的放大 unpool是上采样的一种 downsample(subsam ...

最新文章

  1. ACM MM'21 | 超轻量8.5M!更高效的RGB-D显著性检测模型DFM-Net
  2. [My B.S paper draft]我的本科答辩论文草稿
  3. 【转】以操作系统的角度述说线程与进程
  4. 阿里二面:你来设计一下 Flink 性能调优?
  5. php制图汉字,PHP用imageTtfText函数在图片上写入汉字
  6. knn分类 knn_关于KNN的快速小课程
  7. Scala函数式对象-有理数
  8. Redis:16---常用功能之(慢查询日志)
  9. 容器编排技术 -- Kubernetes从零开始搭建自定义集群
  10. .Net 安装aliyun-oss
  11. [20160224]-bashELF command not found.txt
  12. 刘谦春晚再掀魔术热 网上木马趁火打劫
  13. [轉]javascript 的 location 各種用法
  14. 解决UBUNTU NVIDIA驱动安装后循环登录问题:关闭UEFI Secure Boot选项
  15. 快捷方式图标小箭头刷新慢?百度网盘的锅---附“解除“百度网盘限速技巧(这次是百度网盘先动手的啊)
  16. 短线交易秘诀---大小价格区间,开盘价,价格爆炸点
  17. 什么是开源网络情报?有什么特点?
  18. 成都可以打狂犬疫苗的地方
  19. JESD22-A103E.01:2021 High Temperature Storage Life, 高温贮存寿命规范标准 , 最新版2021年刚刚发行
  20. HoloLens2之路-配置文件(一)

热门文章

  1. tcl把文本产生html,TCL脚本数据文件格式(译文)
  2. ai怎样导出所选部分_Adobe Photoshop批量导出照片+模糊照片变清晰+火焰字体制作介绍...
  3. 用c语言做教学课程安排,C语言入门课程安排
  4. aes密钥扩展java实现,需要使用bouncycastle将AES 256密钥“扩展”为...
  5. java和C++的区别
  6. Ubuntu13.10下编译安装opencv2.4.9
  7. 【C++】44.使用xx.so动态链接库
  8. READING NOTE: R-FCN: Object Detection via Region-based Fully Convolutional Networks
  9. JDK Long源码
  10. 最实用的10个重构小技巧排行榜,您都用过哪些呢?