3D卷积核相比于2D卷积核引入了时间尺度,并且在宽、高、深度(不是单张图像的通道数,这个深度可以理解为帧间)方向上进行滑窗。

nn.Conv3D(in_channels,out_channels,kernel_size=(FD,FH,FW),stride,padding)

在Pytorch中,输入数据的维数可以表示为(N,C,D,H,W),其中:N为batch_size,C为输入的通道数,D为深度(D这个维度上含有时序信息),H和W分别是输入图像的高和宽。3维卷积核的维数可以表示为(Cout,C,FD,FH,FW),其中:Cout为输出通道数,(FD,FH,FW)为3维滤波器的尺寸。特别的FD为深度方向的滤波器尺寸,它所关联的是时序信息,FD越大表示在一次滤波过程中考虑到的时序信息越长;FD越小表示在一次滤波过程中考虑到的时序信息越短。输出数据的维数为(N,Cout,Dout,Hout,Wout)

import torch
import torch.nn as nnx=torch.randn(5,3,10,224,224)
conv = nn.Conv3d(3, 64, kernel_size=(4,3,3), stride=1, padding=1)
print(conv.weight.size())#(64,3,4,3,3)
output=conv(x)
print(output.size())#(5,64,9,224,224)

output的结果为什么是9,是通过那个公式算出来的

10-4+2+1 = 9

Pytorch 3D卷积相关推荐

  1. 基于pytorch简单实现稀疏3d卷积(SECOND)

    卷积计算是深度学习模型的常见算子,在3D项目中,比如点云分割,由于点云数据是稀疏的,使用常规的卷积计算,将会加大卷积计算时间,不利于模型推理加速.由此SECOND网络提出了稀疏卷积的概念. 稀疏卷积的 ...

  2. 用 Pytorch 理解卷积网络

    点击上方"视学算法",选择"星标"公众号 重磅干货,第一时间送达 原标题 | CONVOLUTIONAL NEURAL NETWORKS EXPLAINED: ...

  3. 时序图如何表现分支_【Video Recognition】在视频分类任务中如何高效使用3D卷积...

    这是我发布的第1篇文章,在这个专栏里,我会持续写一些最近看的文章,希望能够与大家有所交流. 知乎对Markdown不是非常支持,排版上总是不够漂亮,可以访问我的简书主页阅读对应的文章. 欢迎访问我的知 ...

  4. 【深度学习】非常详细 | 用 Pytorch 理解卷积网络

    在当今时代,机器在理解和识别图像中的特征和目标方面已经成功实现了99%的精度.我们每天都会看到这种情况-智能手机可以识别相机中的面部:使用Google图片搜索特定照片的能力:从条形码或书籍中扫描文本. ...

  5. 3D卷积的GEMM+IM2COL实现

    由于pytorch官方的API torch.nn.unfold仅支持二维图像(四维输入张量)的im2col操作,因此,使用GEMM+IM2COL来高效的计算3D卷积并非易事,经过搜索,找到了githu ...

  6. 多通道和单通道3D卷积及其运算过程详解

    多通道和单通道3D卷积过程详解 前言 3D卷积作用 Pytorch中对应函数参数详解 单通道3D卷积详解 多通道3D卷积 前言 大家对1D卷积的介绍以及2D卷积中单通道和多通道的介绍已经十分完备了,我 ...

  7. 一文教你搞懂2D卷积和3D卷积

    前言     本人最近在搞毕设时发现自己一直会搞混2D卷积和3D卷积,于是在网上查阅了大量资料,终于明白了其中的原理.希望刷到这篇博客的小伙伴能够停下来静心阅读10分钟,相信你读完之后一定会有所收获. ...

  8. pytorch之卷积模块、池化、激活函数(可视化)

    pytorch之卷积模块 卷积 卷积在 pytorch 中有两种方式,一种是 torch.nn.Conv2d(),一种是torch.nn.functional.conv2d(),这两种形式本质都是使用 ...

  9. 「模型解读」从2D卷积到3D卷积,都有什么不一样

    https://www.toutiao.com/a6711317983035130371/ 接着模型解读系列,在中国科幻作家刘慈欣的科幻小说<三体Ⅲ·死神永生>中,首次提出了降维打击这个概 ...

最新文章

  1. 动画产业基础学习教程 Rad How to Class – Animation Industry Fundamentals
  2. R语言使用vtreat包的designTreatmentsC函数构建数据预处理计划、vetreat包的score frame(新生成数据变量的指南)、以及score frame字段说明
  3. 【转载】表单中 Readonly 和 Disabled 的区别
  4. android 使用wps打开的xls没有刷新_Excel文件打开都变成了WPS,如何改回微软Excel
  5. 不再遥不可及!盘点独角兽自动驾驶战略
  6. vue ---- 生命周期
  7. python和c先学哪个-python和c先学哪个
  8. python输入的字符串转换为对应的数字类型_Psychopy | 第1期:数据类型及运算符
  9. 数字信号处理(matlab)——FFT对信号频谱分析
  10. 双二极管(BAT54S)在电路中起什么作用? 钳位和保护
  11. OpenV$P$N配置后启动服务发生错误排错
  12. median filter
  13. 英国告急!无油可售!加油站大排长龙 | 经济学人早报精选
  14. 微信机器人API开发
  15. android短信过滤关键词,iOS 11的垃圾短信按关键词过滤功能使用介绍
  16. 线性表--顺序表--单向链表(四)
  17. C语言 计算BMI值,建议体重
  18. 一个TCP连接总是以1KB的最大段发送TCP段,发送方有足够多的数据要发送。当拥塞窗口为16KB时发生了超时,如果接下来的4个RTT(往返时间)时间内的TCP段的传输都是成功的,那么当第4个RTT时间
  19. contract forward_future contract 和 forward contract是什么意思?
  20. 详解C语言中sizeof的使用

热门文章

  1. 系统对接方案_报销费控SaaS对接财务系统解决方案
  2. 文献阅读 - Combining Sketch and Tone for Pencil Drawing Production
  3. 硬核讲解 Jetpack 之 LifeCycle 使用篇
  4. java成神之路——网络编程
  5. 计算机网络原理 笔记整理
  6. 畅捷通T+密码清除后,空密码无法登录账套解决办法
  7. 娱乐弹弹弹——程序猿眼中的女人
  8. SpringCloud概括
  9. android 7.1内存泄漏,android - Android 7.1和7本机崩溃:libc.so tgkill + 12 - 堆栈内存溢出...
  10. php程序员学什么语言好就业_中高级PHP程序员应该掌握哪些技术?