订正,本章内容仍使用keras框架进行分析,主要参考《Python深度学习(keras)》(Deep Learning with Python)。

关于深度学习和计算机视觉相结合的卷积操作,在很多博文中都有所介绍,对于其具体的操作方法也不仅相同,本文只介绍作者自己的看法

单通道卷积

在卷积操作中,单通道卷积是基础,理解单通道卷积后,我们再去讨论后续内容。

常见的图像一般为RGB颜色空间,为了方便处理,通常的处理方式是分为R(红色)G(绿色)与B(蓝色)3个通道。在下图中,以RGB3通道的其中一个通道为例,在单通道卷积中,卷积核以滑动的形式遍历整张图像,当然,卷积可以有多个卷积核,每一个卷积核对应一个feature map(卷积之后的特征图)

多通道卷积

多通道卷积可分为常规卷积深度可分离卷积,两者的区别在于参数数量,我们知道在深度卷积网络训练的过程中过多的参数会增大网络计算量,不利于网络模型泛化等缺点。深度可分离卷积在实现常规卷积的基础上减少了网络参数。

常规卷积

常规的多通道卷积和单通道卷积类似,区别在于在多通道卷积中,用于卷积图像的卷积和同样也是多通道的,以RGB图像为例,那么生成的卷积核同样是3个通道,具体步骤如下:

(1)在各自通道上进行单通道卷积;

(2)将各通道汇聚(通道相加)

这里要区分卷积核数目和通道数目以及最后输出的feature map的通道数量,在很多框架中,通常只需要指定卷积和的宽和高(例如3*3)和输出的feature map的通道数目,而不会去指定卷积核通道数目,如下图所示,导致在进行多通道卷积计算时会出现很多疑惑。

(1)流程1中为假设的RGB图像,具有3个通道;
(2)流程2中为生成的一个多通道卷积核,关于初始化卷积核的方法是另一个需要探讨的内容,后续在构建网络时会着重讨论;(a)可以指定卷积核的二维形状,W和H,卷积核的通道数量一般和输入图像的通道数量一致,此处为3;

(3)流程3中,为指定的卷积核数目,在流程3中,每一个小立方体均为具有3个通道的卷积核,此处假设数量为N

(4)对于每一个卷积核(具有3个通道),每一个通道卷积核和对应的图像通道进行单通道卷积,并相加得到流程4中的Feature map;

(5)Feature map中的通道数量,即为卷积核数量N;

关于深度可分离卷积的内容下篇内容继续讨论

动手学计算机视觉--第二章,关于单通道卷积,多通道卷积的讨论相关推荐

  1. 【TL第二期】动手学数据分析-第二章 数据预处理

    文章目录 第二章 第一节 数据清洗及特征处理 第二节 数据重构1 第三节 数据重构2 第四节 数据可视化 第二章 第一节 数据清洗及特征处理 数据清洗:对于原始数据中的缺失值.异常值进行处理.相当于数 ...

  2. 组队学习-动手学数据分析-第二章第2、3节

    复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力 ...

  3. 一阶微分算子锐化图像_【动手学计算机视觉】第三讲:图像预处理之图像分割...

    本讲完整代码>> 前言 图像分割是一种把图像分成若干个独立子区域的技术和过程.在图像的研究和应用中,很多时候我们关注的仅是图像中的目标或前景(其他部分称为背景),它们对应图像中特定的.具有 ...

  4. stm32之ADC应用实例(单通道、多通道、基于DMA)

    硬件:STM32F103VCT6 开发工具:Keil uVision4 下载调试工具:ARM仿真器 网上资料很多,这里做一个详细的整合.(也不是很详细,但很通俗). 所用的芯片内嵌3个12位的模拟/数 ...

  5. 动手学机器学习(第二版)-第四章训练模型

    第四章 训练模型 线性模型(Linear Regression) 线性模型的一般形式如下 y^=θ0+θ1x1+θ2x2+-+θnxn\hat{y} = \theta_0 + \theta_1 x_1 ...

  6. 简学Python第二章__巧学数据结构文件操作

    Python第二章__巧学数据结构文件操作 欢迎加入Linux_Python学习群  群号:478616847 目录: 列表 元祖 索引 字典 序列 文件操作 编码与文件方法 本站开始将引入一个新的概 ...

  7. 吴恩达机器学习(第二章)——单变量线性回归

    第二章-单变量线性回归 文章目录 第二章-单变量线性回归 模型描述 代价函数 梯度下降 梯度下降的思想 梯度下降算法的公式 梯度下降的运动方式 线性回归的梯度下降 模型描述 在监督学习中我们有一个数据 ...

  8. Datawhale---动手学数据分析---第二章:第二章:数据清洗及特征处理(泰坦尼克的任务)

    Datawhale---动手学数据分析---第一章:数据载入及初步观察(泰坦尼克的任务) [回顾&引言]前面一章的内容大家可以感觉到我们主要是对基础知识做一个梳理,让大家了解数 据分析的一些操 ...

  9. (连载)边喝咖啡边学Unity——第二章 预备知识体系

    第二章 预备知识体系 --本章涉及空间数学.解析几何.线性代数.计算机图形学.算法.数据结构等众多基础学科.同上一章相比,虽然枯燥,但是绝不能称为废话之章,即使粗略的看一遍,也比直接跳过来的好,详细地 ...

最新文章

  1. 深度解析 | 大数据面前,统计学的价值在哪里?
  2. [HAOI2018]染色
  3. R语言入门系列-软件下载,环境搭建,数据导入导出
  4. 微信小程序 - 实战小案例 - 简易记事本
  5. matlab找不到函数系统函数,求助,Matlab找不到ztrans函数
  6. scala学习手记28 - Execute Around模式
  7. 智能包装结构,提高可测性
  8. 规则2 使用内容发布网络
  9. Echarts定制一个地图
  10. 编程基本功:带着本子却不记录,你以为听懂了记住了,不可能的
  11. Webpack打包UMD的export要带default访问问题
  12. Flash闪存颗粒和SSD知识深度解析
  13. 一位10年 Java 工作经验的架构师聊 Java 和工作经验
  14. 机器学习Class 6:分类及描述
  15. 物联网芯片的协议之WLAN及其调制
  16. 301代码php代码在哪里加,301转向设置及代码及方法详解
  17. 信息架构的设计思路 .
  18. ARM CPU挂死和总线挂死的DS-5调试方法
  19. 阿里云开放平台微前端方案的沙箱实现
  20. 计算机毕业设计ssm农村老人管理系统的设计与实现36jlv系统+程序+源码+lw+远程部署

热门文章

  1. 【Android】 炫酷霓虹灯
  2. 秒杀设计 mysql_如何设计秒杀系统?
  3. 学会以下几个软件你就会3D游戏模型了
  4. Dispatcher has no subscribers for channel排坑指南
  5. C语言 基于结构体的程序设计(PTA)
  6. 四年级上册计算机知识点总结,四年级信息技术册主要知识点整理.doc
  7. [Ubuntu]vim中文乱码
  8. 软件测试工程师必读图书
  9. 奇瑞a3中控按键图解_奇瑞A3使用说明
  10. 大疆口袋相机美颜怎么设置_大疆(DJI)Pocket2 | 深度测评口袋相机:超多配件随心搭,自带美颜的拍摄助手!-极果...