加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流点击文末“”立刻申请入群~

作者 | mileistone

来源 | https://zhuanlan.zhihu.com/p/46633171

已获作者授权,请勿二次转载

降采样指的是成比例缩小特征图宽和高的过程,比如从(W,H)变为(W/2,H/2)。深度卷积神经网络中降采样的方法主要有三种:

1、stride大于1的pooling

2、stride大于1的conv

3、stride大于1的reorg(在YOLOv2的论文里叫passthrough layer)

reorg: github.com/pjreddie/darknet/blob/master/cfg/yolov2.cfg

其中1和2在深度卷积神经网络中使用非常普遍,3比较小众,由Joseph Redmon在YOLOv2中首次提出。

1和2的对比在Striving for Simplicity: The All Convolutional Net中有详述,文末有这么一段总结:

With modern methods of training convolutional neural networks very simple architectures may perform very well: a network using nothing but convolutions and subsampling matches or even slightly outperforms the state of the art on CIFAR-10 and CIFAR-100. A similar architecture shows competitive results on ImageNet.
In particular, as opposed to previous observations, including explicit (max-)pooling operations in a network does not always improve performance of CNNs. This seems to be especially the case if the network is large enough for the dataset it is being trained on and can learn all necessary invariances just with convolutional layers.

大概意思就是,用stride=2的conv降采样的卷积神经网络效果与使用pooling降采样的卷积神经网络效果相当;卷积神经网络小的时候,使用pooling降采样效果可能更好,卷积神经网络大的时候,使用stride=2的conv降采样效果可能更好。

总体来说,pooling提供了一种非线性,这种非线性需要较深的conv叠加才能实现,因此当网络比较浅的时候,pooling有一定优势;但是当网络很深的时候,多层叠加的conv可以学到pooling所能提供的非线性,甚至能根据训练集学到比pooling更好的非线性,因此当网络比较深的时候,不使用pooling没多大关系,甚至更好。

pooling的非线性是固定的,不可学习的,这种非线性其实就是一种先验。

3中降采样的优势在于能够较好的保留低层次的信息。1和2的降采样方式,好处是抽取的特征具有更强的语义性,坏处是会丢失一些细节信息。而3这种降采样方式与1、2相反,它提取的特征语义性不强,但是能保留大量细节信息。所以当我们既需要降采样,又需要不丢失细节信息的时候,3是一个非常合适的选择。

*延伸阅读

  • 弱监督视觉理解笔记(VALSE2019)

  • 基于弱监督的视频时序动作检测的介绍


点击左下角”,即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群,更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流,一起来让思想之光照的更远吧~

觉得有用麻烦给个在看啦~  

深度卷积神经网络_深度卷积神经网络中的降采样相关推荐

  1. pcm 降采样_深度卷积神经网络中的降采样

    降采样指的是成比例缩小特征图宽和高的过程,比如从(W,H)变为(W/2,H/2).深度卷积神经网络中降采样的方法主要有三种: 1.stride大于1的pooling 2.stride大于1的conv ...

  2. ann人工神经网络_深度学习-人工神经网络(ANN)

    ann人工神经网络 Building your first neural network in less than 30 lines of code. 用不到30行代码构建您的第一个神经网络. 1.W ...

  3. 深度学习深度前馈网络_深度学习前馈网络中的讲义第4部分

    深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...

  4. 矩阵一维卷积c++_深度神经网络卷积层计算加速与优化

    01 传统卷积层计算 首先我们定义符号F()函数为卷积函数 一维卷积:F(n,m) n代表输出的维度,m代表滤波器的维度 二维卷积:F(n*m,r*s) n*m代表输出的维度,r*s代表滤波器的维度 ...

  5. xml文件 卷积神经网络_理解卷积神经网络中的输入与输出形状(Keras实现)

    即使我们从理论上理解了卷积神经网络,在实际进行将数据拟合到网络时,很多人仍然对其网络的输入和输出形状(shape)感到困惑.本文章将帮助你理解卷积神经网络的输入和输出形状. 让我们看看一个例子.CNN ...

  6. hopfileld神经网络_图卷积神经网络

    大概一个月前,老师给我分的方向是图神经网络.研一已经快过完了,我自己还没有确定好自己的研究方向.只知道自己想做技术,但是具体什么技术并没有想法,既然老师给分了这个方向,再加上自身也觉得图神经网络在推荐 ...

  7. 贝叶斯深度神经网络_深度学习为何胜过贝叶斯神经网络

    贝叶斯深度神经网络 Recently I came across an interesting Paper named, "Deep Ensembles: A Loss Landscape ...

  8. 前馈神经网络_深度学习基础理解:以前馈神经网络为例

    区别于传统统计机器学习的各类算法,我们从本篇开始探索深度学习模型.深度学习在应用上的重要性现如今已毋庸置疑,从2012年燃爆ImageNet,到2016年的AlphaGo战胜李世石,再到2018年的B ...

  9. 循环神经网络 递归神经网络_了解递归神经网络中的注意力

    循环神经网络 递归神经网络 I recently started a new newsletter focus on AI education. TheSequence is a no-BS( mea ...

最新文章

  1. ReactiveCocoa代码实践之-更多思考
  2. linux tao环境 安装_Linux安装jdk8及环境变量配置
  3. 《DeepLearning.ai 深度学习笔记》发布,黄海广博士整理
  4. appium定位元素java篇【转】
  5. 【李宏毅机器学习】Unsupervised Learning - Word Embedding 无监督学习 - 词嵌入(p22) 学习笔记
  6. 小米10pro使用说明书_30W有线无线快充,小米的这款立式无线充电宝表现不错
  7. js navigator platform
  8. 逼死强迫症?聊聊应用推送角标的那些事儿
  9. JSON的C代码示例
  10. Tomcat内存大小配置及查看内存情况
  11. java对接金蝶webapi
  12. RAID磁盘阵列详解
  13. upgrade-insecure-requests
  14. 台式电脑上为什么没有计算机,台式电脑怎么没有声音
  15. 一棵度为2的树和一棵二叉树有什么区别
  16. K8S学习之storageclass
  17. 解密seata全局锁(一)
  18. linux切换独显,Ubuntu 16.04如何切换Intel集显与Nvidia独显
  19. 基于C#+WinForm+SQL Server2016+Visual Studion2019的仓库管理系统
  20. 流量兄弟和站群软件的较量

热门文章

  1. gui编写线性调频信号_是的,我编写了信号量,不,我不是OS开发人员。
  2. CSS单位之战:EM与。 REMs ...打架! ?
  3. javascript功能_最新版本JavaScript仅具有2个新功能。 这是他们的工作方式。
  4. 使用TA-Lib在vn.trader上开发CTA交易策略
  5. 考研数学三部曲之大话线性代数
  6. python实现单张图像拼接与批量图片拼接
  7. 推荐一条高效的Python爬虫学习路径!
  8. shell 文件 开头的格式
  9. Python deque的用法介绍
  10. 【opencv学习】【读取图像、视频、摄像头】