从CNN的发展过程看,卷积核(filters)的尺寸有越来越小的趋势,比如vgg网络中全部采用3*3的小卷积核,那么为什么要普遍使用小卷积核而非大卷积核呢?

大尺寸的卷积核可以带来更大的感受野,但也意味着更多的参数,并且《Rethinking the Inception Architecture for Computer Vision》的作者提出可以用 2 个连续的 3×3 卷积层( stride=1)组成的小网络来代替单个的5×5大卷积层,可以保持感受野范围的同时又减少了参数量:

由于参数个数仅与卷积核大小有关,所以 3×3 级联卷积核占优势,并且用 2 个级联的 3×3 卷积层( stride=1)组成的小网络来代替单个的 5×5 卷积层增加了非线性变换的操作使得模型的泛化能力进一步的提高。

1:两个 3×3 的堆叠卷基层的有限感受野是 5×5 ;三个 3×3 的堆叠卷基层的感受野是 7×7 ,故可以通过小尺寸卷积层的堆叠替代大尺寸卷积层,并且感受野大小不变。

2:多个小尺寸的卷基层比一个大尺寸卷积层有更多的非线性(更多层的非线性函数),使得判决函数更加具有判决性,并且起到隐式正则化的作用。

3:1×1卷积核除了具有降低参数量和增加非线性的作用外,还可以起到对通道数的升降进行控制的作用 (达到特征降维和升维的作用)。

如果不理解感受野或者无法理解两个 3×3 的卷积核级联同单个 5×5 的卷积核具有相同的感受野,可以参考下面这边博客:
卷积神经网络中感受野的理解和计算

CNN中为什么普遍使用小卷积核相关推荐

  1. 为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢?

    为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢? (1)3x3是最小的能够捕获像素八邻域信息的尺寸. (2)两个3x3的堆叠卷基层的有限感受野是5x5:三个3x3的堆叠卷基 ...

  2. 【深度学习】真正的即插即用!盘点11种CNN网络设计中精巧通用的“小”插件...

    作者丨皮特潘 编辑丨极市平台 导读 所谓"插件",就是要能锦上添花,又容易植入.落地,即真正的即插即用.本文盘点的"插件"能够提升CNN平移.旋转.scale等 ...

  3. CNN中的权重维度解析以及卷积核中的数值是怎么确定的

    以<python深度学习>第五章第一个实验为例,神经网络结构如下: 首先最上面一个池化层max_pooling2d_1:MaxPooling2D 的结果是:(32,) 也就是说相对于下一个 ...

  4. CNN中的卷积核及TensorFlow中卷积的各种实现

    声明: 1. 我和每一个应该看这篇博文的人一样,都是初学者,都是小菜鸟,我发布博文只是希望加深学习印象并与大家讨论. 2. 我不确定的地方用了"应该"二字 首先,通俗说一下,CNN ...

  5. CNN中各类卷积总结:残差、shuffle、空洞卷积、变形卷积核、可分离卷积等

    CNN从2012年的AlexNet发展至今,科学家们发明出各种各样的CNN模型,一个比一个深,一个比一个准确,一个比一个轻量.我下面会对近几年一些具有变革性的工作进行简单盘点,从这些充满革新性的工作中 ...

  6. 为什么CNN中的卷积核一般都是奇数?

    本博客只用于自身学习,如有错误,虚心求教!!! 为什么CNN中的卷积核一般都是奇奇数*奇数,没有偶数*偶数的? 咱们经常见到的多为 3 * 3.5*5;怎么从来没有见过 4*4,6*6 之类的卷积核? ...

  7. 为什么CNN中的卷积核一般都是奇数

    本博客只用于自身学习,如有错误,虚心求教!!! 为什么CNN中的卷积核一般都是奇奇数*奇数,没有偶数*偶数的? 咱们经常见到的多为 3 * 3.5*5;怎么从来没有见过 4*4,6*6 之类的卷积核? ...

  8. CNN中的即插即用小模块汇总

    文章目录 前言 1 STN 2. ASPP 3. Non-local 4. SE 5. CBAM 6 DCN v1&v2 7 CoordConv 8 Ghost 9 BlurPool 10 R ...

  9. 深度学习基础学习-1x1卷积核的作用(CNN中)

    前言 这里就不赘述卷积神经网络相关内容了,直接通过博主看的一些资料,自己进行了一些整合,大佬绕道. 对于1x1卷积核的作用主要可以归纳为以下几点 增加网络深度(增加非线性映射次数) 升维/降维 跨通道 ...

最新文章

  1. Session服务器配置指南与使用经验
  2. 期货与期权(part5)--期货市场机制
  3. Android QQ登录 程序奔溃的问题
  4. docker privileged作用_docker总结
  5. 【OpenCV】OpenCV访问像素点的三种方式
  6. 秋色园网站转移过程记录篇
  7. 基于DEAP库的python进化算法-2.进化算法各元素的DEAP实现
  8. Android版抢票神器使用指南及下载地址
  9. 毕设--基于51单片机数字电压表的设计
  10. 从阿里外包月薪5K到转岗正式员工月薪15K,这100多天的心酸只有自己知道...
  11. win10桌面显示计算机及网上邻居,Win10网上邻居在哪? Win10桌面显示网上邻居网络图标方法...
  12. 创建windows虚拟机详细教程
  13. 旅行好帮手:精准可靠的航班动态数据服务
  14. linux panic 和 bug_on
  15. templete_SPFA()
  16. 如何安装虚拟机的集成服务器,如何在虚拟机上安装Hyper-V集成服务?
  17. 网易、百度等公司面试题整理
  18. Android验证码输入框支持粘贴
  19. 一文读懂高速互联的阻抗及反射
  20. k8s containerd对接harbor私有仓库

热门文章

  1. Python中关于浮点数运算的不确定尾数的解释
  2. [大数据技术与应用省赛学习记录一]——软件准备
  3. 西电职称计算机报名,西安电子科技大学.PDF
  4. 985计算机学校,什么是985院校
  5. 国内首部“无限流”,热搜突破300+,《开端》能否创造国产剧新方向?
  6. java调银企互联接口_银企互联NC中间件(演示:.NET、Java、Php、Python)
  7. Cisco AP-胖瘦AP的转换
  8. HDU 1864 最大报销额 (dp 01背包)
  9. 32. 对c++中的smart pointer四个智能指针shared_ptr,unique_ptr,weak_ptr,auto_ptr的理解
  10. hbase hyperbase 区别_星环hyperbase和开源hbase的那些事