理解3d卷积conv3d
理解3d卷积
- 我的个人理解
我的个人理解
作分类时,对于不同类别的数据,无论是使用什么方法和分类器(仅限于线性回归和深度学习)去拟合数据,都首先要构建适合数据的多种特征(比如根据性别、年龄、身高来区分一个人是否喜欢打篮球).之后的处理过程是,权重参数都要和不同的特征分别相乘,然后再将不同的乘积加起来求和,处理过程就是不同特征和对应的权重相乘再相加,而不会是将不同的特征相乘.
对于图像数据,不同的通道表示不同种类的特征,比如RGB通道分别表示红、绿、蓝光谱特征.
而卷积就是分别对不同通道操作,再将这些不同通道的卷积结果相加,而不会将不同通道之间相互卷积.通道始终是独立的,每一个卷积核中的滤波器个数由输入图像的通道数来决定.
conv2d
输入数据是(H,W,band),即为(height,width,band),一个卷积核中的滤波器数量对应于通道数,每个滤波器都是随机生成,一般都是不同的.每个滤波器和对应的波段作卷积,最后不同波段的卷积结果相加输出一个包含一个波段的图像. 滤波器只在每个波段的长、宽方向上移动,滤波器形状为(h,w),是二维的.多个滤波器构成一个卷积核,即为(h,w,b).
conv3d
输入数据是(F,H,W,band),即为(frame,height,width,band).3维卷积滤波器要在每个波段的帧、长、宽方向上移动,滤波器形状为(f,h,w),是三维的.每个波段的数据都是(F,H,W),是三维的,每个滤波器和对应的波段作卷积,得到的结果也是三维数据,之后不同的波段卷积结果相加,得到的结果还是三维的.多个滤波器构成一个卷积核,即为(f,h,w,b).
无论是conv3d还是conv2d,不同的通道都表示不同的特征,都是独立于卷积核的构建的,也不会是卷积的方向;卷积都是分别在不同通道上进行的,最后将所有通道的卷积结果相加.通道数即为卷积核的个数.
注意:如果只是应用的话,理解到是怎么conv3d构建的,是怎么卷积的,就可以了,其中的具体实现不必深究。
注意: 为conv3d作数据准备时候,要再加上一个维度,用来表示帧数,而不是简单地将所有不同时间地影像叠加到通道尺度上.也就是conv2d的数据格式为(H,W,band),而conv3d的数据格式为(F,H,W,band).
参考
讲解最清楚的: https://blog.csdn.net/abbcdc/article/details/123332063?spm=1001.2014.3001.5506
可视化: https://blog.csdn.net/njuptalex/article/details/110124538
Conv1D、Conv2D、Conv3D 讲解: https://blog.csdn.net/bashendixie5/article/details/124189182
keras中实现3D卷积(Con3D)和如何准备3D卷积的输入数据: https://blog.csdn.net/C_chuxin/article/details/83422454
从2d卷积到3d卷积: https://blog.csdn.net/weixin_43026262/article/details/104821804
3d卷积的应用: https://zhuanlan.zhihu.com/p/55567098
理解3d卷积conv3d相关推荐
- 3D 池化(MaxPool3D) 和 3D(Conv3d) 卷积详解
3D 池化(MaxPool3D) 和 3D(Conv3d) 卷积详解 池化和卷积的过程是类似的,只是池化没有权重,相比起来更容易说明计算的过程.这里从 3D 池化开始详细介绍 MaxPool3D 和 ...
- 深度学习:从2D卷积到3D卷积的简单理解
很多人容易混淆2D卷积和3D卷积的概念,把多通道的2D卷积当成3D卷积,本文展示了一种直观理解2D卷积和3D卷积的方式. 2D卷积 单通道 首先了解什么是卷积核,卷积核(filter)是由一组参数构成 ...
- 卷积神经网络(2D卷积神经网络和3D卷积神经网络理解)
前言 卷积神经⽹络(convolutional neural network,CNN)是⼀类强⼤的神经⽹络,正是为处理图像 数据而设计的.基于卷积神经⽹络结构的模型在计算机视觉领域中已经占主导地位,当 ...
- Conv3d 3D卷积
3D卷积, 输入的shape是( N , C i n , D , H , W ) 输出shape ( N , C o u t , D o u t , H o u t , W o u t ) N是bat ...
- 理解3D CNN及3D卷积
前言 这篇博客主要详细介绍3D CNN框架结构的计算过程,我们都知道3D CNN 在视频分类,动作识别等领域发挥着巨大的优势,前两个星期看了这篇文章:3D Convolutional Neural N ...
- 多通道和单通道3D卷积及其运算过程详解
多通道和单通道3D卷积过程详解 前言 3D卷积作用 Pytorch中对应函数参数详解 单通道3D卷积详解 多通道3D卷积 前言 大家对1D卷积的介绍以及2D卷积中单通道和多通道的介绍已经十分完备了,我 ...
- 3DCNN,3D卷积神经网络,动作识别
为了学习3d卷积,看了一篇相关的论文,参考博客论文复现将论文和代码理解一遍.源代码没有注释,在这篇文章中我按照自己的理解写好重要地方的注释,数据集请进入博客中获取,博主贴了数据的百度网盘 一.在这份代 ...
- Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行
Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行 说明 Unet神经网络 网络结构 代码实现 模型训练 训练环境 数据加载处理 训练 训练结果 模型并行版本 模 ...
- 深度学习中常见卷积(普通卷积、1×1卷积、转置卷积、可分离卷积、膨胀(空洞)卷积、3D卷积)
总是在网络上看到各种名词的卷积,但是有搞不懂是什么含义,于是结合网上查阅的资料,总结一下.目前比较常用的卷积主要有常规的卷积.1×1卷积.转置卷积.可分离卷积.膨胀卷积.3D卷积. 以下是一些 ...
最新文章
- 【青少年编程】【三级】躲避恐龙
- 西南大学网络教育计算机辅助设计,2017年秋西南大学继续教育9123《计算机辅助设计》.docx...
- python可以干什么工作-Python学完工作不好找?看看数据分析可视化都可以做什么...
- matlab与树莓派通信
- 003-JavaString数据类型
- NYOJ-14 会场安排问题(经典贪心,区间完全不覆盖模板)
- IDEA java出现无效的源发行版 9
- Java多线程研究(八)使用Exchange在多个线程间交换数据
- 一台mysql数据库服务器_在一台服务器安装多个MySQL数据库
- 用ODBC方式操作dbf文件
- 双系统在linux中修复引导文件,windows ubuntu双系统重装后修复grub引导
- gis核密度分析工具_Arcgis软件支持下的核密度估计
- 宏观经济指标分析与数据可视化——PMI
- Scratch小游戏《恐龙》
- Visual studio code 使用 Team Foundation Server - Windows
- 电脑如何同时安装JDK11和JDK1.8(适用于多个JDK)
- 高效团队建设与管理 学习心得
- android 图片字体涂鸦,android 涂鸦功能
- AUTOCAD——面域
- 如何在 CentOS Stream 8上安装 LibreNMS
热门文章
- MOS管驱动电路详解
- CSR86XX ROM版 操作EEPROM,FLASH的操作流程
- android 短信转发设置权限,用Tasker实现Android手机短信转发到钉钉
- 经营三类医疗器械不使用计算机,三类医疗器械计算机管理系统
- c4d安装没有出现语言文字,c4d中文教程大合集 HDT映速教程 C4D自学全攻略(四部全集)...
- 不同电脑之间共享键鼠:sharemouse
- qq空间 上传html,qq空间怎么上传本地视频两种上传方式(说说/日志)
- java毕业生设计一中体育馆管理系统计算机源码+系统+mysql+调试部署+lw
- 在阿里云ECS上安装流媒体服务器软件Ti Top Streamer
- 永远不可能学会的数论之基础数论(例题)