理解3d卷积

  • 我的个人理解

我的个人理解

作分类时,对于不同类别的数据,无论是使用什么方法和分类器(仅限于线性回归和深度学习)去拟合数据,都首先要构建适合数据的多种特征(比如根据性别、年龄、身高来区分一个人是否喜欢打篮球).之后的处理过程是,权重参数都要和不同的特征分别相乘,然后再将不同的乘积加起来求和,处理过程就是不同特征和对应的权重相乘再相加,而不会是将不同的特征相乘.

对于图像数据,不同的通道表示不同种类的特征,比如RGB通道分别表示红、绿、蓝光谱特征.

而卷积就是分别对不同通道操作,再将这些不同通道的卷积结果相加,而不会将不同通道之间相互卷积.通道始终是独立的,每一个卷积核中的滤波器个数由输入图像的通道数来决定.

conv2d
输入数据是(H,W,band),即为(height,width,band),一个卷积核中的滤波器数量对应于通道数,每个滤波器都是随机生成,一般都是不同的.每个滤波器和对应的波段作卷积,最后不同波段的卷积结果相加输出一个包含一个波段的图像. 滤波器只在每个波段的长、宽方向上移动,滤波器形状为(h,w),是二维的.多个滤波器构成一个卷积核,即为(h,w,b).

conv3d
输入数据是(F,H,W,band),即为(frame,height,width,band).3维卷积滤波器要在每个波段的帧、长、宽方向上移动,滤波器形状为(f,h,w),是三维的.每个波段的数据都是(F,H,W),是三维的,每个滤波器和对应的波段作卷积,得到的结果也是三维数据,之后不同的波段卷积结果相加,得到的结果还是三维的.多个滤波器构成一个卷积核,即为(f,h,w,b).

无论是conv3d还是conv2d,不同的通道都表示不同的特征,都是独立于卷积核的构建的,也不会是卷积的方向;卷积都是分别在不同通道上进行的,最后将所有通道的卷积结果相加.通道数即为卷积核的个数.

注意:如果只是应用的话,理解到是怎么conv3d构建的,是怎么卷积的,就可以了,其中的具体实现不必深究。

注意: 为conv3d作数据准备时候,要再加上一个维度,用来表示帧数,而不是简单地将所有不同时间地影像叠加到通道尺度上.也就是conv2d的数据格式为(H,W,band),而conv3d的数据格式为(F,H,W,band).

参考
讲解最清楚的: https://blog.csdn.net/abbcdc/article/details/123332063?spm=1001.2014.3001.5506
可视化: https://blog.csdn.net/njuptalex/article/details/110124538
Conv1D、Conv2D、Conv3D 讲解: https://blog.csdn.net/bashendixie5/article/details/124189182
keras中实现3D卷积(Con3D)和如何准备3D卷积的输入数据: https://blog.csdn.net/C_chuxin/article/details/83422454
从2d卷积到3d卷积: https://blog.csdn.net/weixin_43026262/article/details/104821804
3d卷积的应用: https://zhuanlan.zhihu.com/p/55567098

理解3d卷积conv3d相关推荐

  1. 3D 池化(MaxPool3D) 和 3D(Conv3d) 卷积详解

    3D 池化(MaxPool3D) 和 3D(Conv3d) 卷积详解 池化和卷积的过程是类似的,只是池化没有权重,相比起来更容易说明计算的过程.这里从 3D 池化开始详细介绍 MaxPool3D 和 ...

  2. 深度学习:从2D卷积到3D卷积的简单理解

    很多人容易混淆2D卷积和3D卷积的概念,把多通道的2D卷积当成3D卷积,本文展示了一种直观理解2D卷积和3D卷积的方式. 2D卷积 单通道 首先了解什么是卷积核,卷积核(filter)是由一组参数构成 ...

  3. 卷积神经网络(2D卷积神经网络和3D卷积神经网络理解)

    前言 卷积神经⽹络(convolutional neural network,CNN)是⼀类强⼤的神经⽹络,正是为处理图像 数据而设计的.基于卷积神经⽹络结构的模型在计算机视觉领域中已经占主导地位,当 ...

  4. Conv3d 3D卷积

    3D卷积, 输入的shape是( N , C i n , D , H , W ) 输出shape ( N , C o u t , D o u t , H o u t , W o u t ) N是bat ...

  5. 理解3D CNN及3D卷积

    前言 这篇博客主要详细介绍3D CNN框架结构的计算过程,我们都知道3D CNN 在视频分类,动作识别等领域发挥着巨大的优势,前两个星期看了这篇文章:3D Convolutional Neural N ...

  6. 多通道和单通道3D卷积及其运算过程详解

    多通道和单通道3D卷积过程详解 前言 3D卷积作用 Pytorch中对应函数参数详解 单通道3D卷积详解 多通道3D卷积 前言 大家对1D卷积的介绍以及2D卷积中单通道和多通道的介绍已经十分完备了,我 ...

  7. 3DCNN,3D卷积神经网络,动作识别

    为了学习3d卷积,看了一篇相关的论文,参考博客论文复现将论文和代码理解一遍.源代码没有注释,在这篇文章中我按照自己的理解写好重要地方的注释,数据集请进入博客中获取,博主贴了数据的百度网盘 一.在这份代 ...

  8. Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行

    Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行 说明 Unet神经网络 网络结构 代码实现 模型训练 训练环境 数据加载处理 训练 训练结果 模型并行版本 模 ...

  9. 深度学习中常见卷积(普通卷积、1×1卷积、转置卷积、可分离卷积、膨胀(空洞)卷积、3D卷积)

      总是在网络上看到各种名词的卷积,但是有搞不懂是什么含义,于是结合网上查阅的资料,总结一下.目前比较常用的卷积主要有常规的卷积.1×1卷积.转置卷积.可分离卷积.膨胀卷积.3D卷积.   以下是一些 ...

最新文章

  1. 【青少年编程】【三级】躲避恐龙
  2. 西南大学网络教育计算机辅助设计,2017年秋西南大学继续教育9123《计算机辅助设计》.docx...
  3. python可以干什么工作-Python学完工作不好找?看看数据分析可视化都可以做什么...
  4. matlab与树莓派通信
  5. 003-JavaString数据类型
  6. NYOJ-14 会场安排问题(经典贪心,区间完全不覆盖模板)
  7. IDEA java出现无效的源发行版 9
  8. Java多线程研究(八)使用Exchange在多个线程间交换数据
  9. 一台mysql数据库服务器_在一台服务器安装多个MySQL数据库
  10. 用ODBC方式操作dbf文件
  11. 双系统在linux中修复引导文件,windows ubuntu双系统重装后修复grub引导
  12. gis核密度分析工具_Arcgis软件支持下的核密度估计
  13. 宏观经济指标分析与数据可视化——PMI
  14. Scratch小游戏《恐龙》
  15. Visual studio code 使用 Team Foundation Server - Windows
  16. 电脑如何同时安装JDK11和JDK1.8(适用于多个JDK)
  17. 高效团队建设与管理 学习心得
  18. android 图片字体涂鸦,android 涂鸦功能
  19. AUTOCAD——面域
  20. 如何在 CentOS Stream 8上安装 LibreNMS

热门文章

  1. MOS管驱动电路详解
  2. CSR86XX ROM版 操作EEPROM,FLASH的操作流程
  3. android 短信转发设置权限,用Tasker实现Android手机短信转发到钉钉
  4. 经营三类医疗器械不使用计算机,三类医疗器械计算机管理系统
  5. c4d安装没有出现语言文字,c4d中文教程大合集 HDT映速教程 C4D自学全攻略(四部全集)...
  6. 不同电脑之间共享键鼠:sharemouse
  7. qq空间 上传html,qq空间怎么上传本地视频两种上传方式(说说/日志)
  8. java毕业生设计一中体育馆管理系统计算机源码+系统+mysql+调试部署+lw
  9. 在阿里云ECS上安装流媒体服务器软件Ti Top Streamer
  10. 永远不可能学会的数论之基础数论(例题)