为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢?

(1)3x3是最小的能够捕获像素八邻域信息的尺寸。

(2)两个3x3的堆叠卷基层的有限感受野是5x5;三个3x3的堆叠卷基层的感受野是7x7,故可以通过小尺寸卷积层的堆叠替代大尺寸卷积层,并且感受野大小不变。所以可以把三个3x3的filter看成是一个7x7filter的分解中间层有非线性的分解, 并且起到隐式正则化的作用。

这一点在VGGNet论文中得到了很好的解释。有两个原因:首先,你可以使用几个较小的卷积核而不是几个较大的卷积核来获得相同的感受野并捕获更多的空间上下文,但是对于较小的卷积核,你使用的参数和计算更少。其次,因为使用了更小的卷积核,你会使用更多的过滤器,你将能够使用更多的激活函数,因此CNN将学习到更有区分度的映射函数。

为什么CNN模型要使用很多小的卷积核,比如3x3,而不是7x7或者9x9呢?相关推荐

  1. 【经典卷积神经网络CNN模型 之 VGG16Net】模型实验,强烈建议使用GPU来跑,经试验,若使用CPU,普通PC理论上需要超过100小时

    声明:仅学习使用~ 建议回顾基础知识: 包含但不限于 [模型实验]几个 经典卷积神经网络CNN模型 回顾:分组卷积–AlexNet,使用3x3卷积核----VGG,使用多种卷积核结构----Googl ...

  2. CNN模型之SqueezeNet

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 01.引言 SqueezeNet是Han等提出的一种轻量且高效的C ...

  3. CNN模型之MobileNet

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 零 引言: 卷积神经网络(CNN)已经普遍应用在计算机视觉领域,并 ...

  4. CNN模型复杂度(FLOPs、MAC)、参数量与运行速度

    CNN模型复杂度(FLOPs.MAC).参数量与运行速度 先转载一下,有空再来整理 文章目录 0. 模型复杂度简介 1. 模型复杂度之一:模型参数量的计算方法 卷积层参数量计算 全连接层参数量计算 2 ...

  5. 为了压榨CNN模型,这几年大家都干了什么

    如果从2006年算,深度学习从产生到火爆已经十年了,在工业界已经产生了很多落地的应用.现在网络的深度已经可达1000层以上,下面我们关注一个问题: 这些年大家是怎么"压榨"CNN模 ...

  6. CNN 模型框架(转)

    转自:http://www.shuang0420.com/2017/04/25/%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%20CNN ...

  7. 凭什么相信你,我的CNN模型

    背景 学术界一直困惑的点是"如何让看似黑盒的CNN模型说话",即对它的分类结果给出解释. 这里的解释是指,让模型告诉我们它是通过图片的哪些像素做出判断的,并不是深度学习理论层面的解 ...

  8. python cnn模型_CNN系列模型发展简述(附github代码——已全部跑通)

    目录: 1 LeNet 2 AlexNet 3 VGG 4 GoogLeNet 5 ResNet 6 DenseNet 7 Non-Local Networks 8 Deformable Convol ...

  9. 深度学习CNN模型预测电影评论中的情感问题

    情感分析是一种自然语言处理问题,其中理解文本并预测潜在意图. 在这篇文章中,您将了解如何使用Keras深度学习库在Python中预测电影评论的积极或消极情绪. 阅读这篇文章后你会知道: 关于自然语言处 ...

最新文章

  1. 关于Python的一点学习总结(55-time的使用)
  2. Tiniux 3.0 / Memory.c / OSMemInit
  3. Java技术分享:NIO实战教程!
  4. wxWidgets:wxDir类用法
  5. qt 字体不随dpi_Windows – QT5字体渲染在各种平台上不同
  6. u-boot-2012.07 for FL2440
  7. Linux 常見的登錄檔檔名
  8. 【学习笔记】原根 / BSGS / 扩展BSGS证明及模板
  9. 网络抓包工具--网路岗
  10. java 拷贝替换文件夹_比较两个不同文件夹中的两个文件,并将其替换为较新的文件夹...
  11. Mac双系统中删除Windows系统教程
  12. 如何获取网卡硬件地址
  13. 微信小程序详细图文教程10分钟解决
  14. linux 查看策略路由,Linux下的策略路由。
  15. 近期有面试的必看!带你手撸红黑树,终获offer
  16. expert个人版 sqlite_SQLite Expert Personal
  17. 在2022年需要使用的25个最佳GOOGLE CHROME扩展
  18. java录入个人信息程序_Java:用键盘输入个人信息并输出
  19. 搭建go开发环境时,出现GoSublime error: MarGo build failed的问题
  20. word右顶格,word文档最右边怎么对齐

热门文章

  1. 2021-06-06
  2. 深度学习算法实践(基于Theano和TensorFlow)
  3. oracle一条sql的执行过程,请问执行一条sql的整个过程是怎样的,谢谢!
  4. 开放一些3D视觉相关职位!
  5. CVPR2021|基于分类深度分布网络的单目3D物体检测
  6. 目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral
  7. copper实现图片的裁剪和上传(1)
  8. 从信息时代到智力时代的药物发现
  9. 第三课.使用简单的NN模拟fizzbuzz
  10. java集合类讲解视频,关于java:实实在在面试List和Map集合面试合集含讲解视频