接着模型解读系列,在中国科幻作家刘慈欣的科幻小说《三体Ⅲ·死神永生》中,首次提出了降维打击这个概念,这是本质上区别于同一维度的攻击,破坏性也更大。

而现在我们要说的是从二维卷积升级到三维卷积,它相比2D卷积是否会有不一样呢?

作者 | 言有三

编辑 | 言有三

01

3D卷积

首先看一下二维卷积,一个3*3的卷积核,在单通道图像上进行卷积,得到输出。

然后我们再看一下3维卷积,一个3*3*3的卷积核在立方体上进行卷积,得到输出。

就是这样,没什么其他花样了。

可能有人会问,这跟多通道卷积有什么区别呢?

有。

多通道卷积不同的通道上的卷积核的参数是不同的,而3D卷积则由于卷积核本身是3D的,所以这个由于“深度”造成的看似不同通道上用的就是同一个卷积,权重共享嘛。

总之,多了一个深度通道,这个深度可能是视频上的连续帧,也可能是立体图像中的不同切片

02

3D卷积的应用

上面也说了,3D卷积就是多了一个深度通道,而这个深度通道可能是视频上的连续帧,也可能是立体图像中的不同切片,所以从应用上来说,主要就是两大主要方向。

2.1 视频分类

相比于2D图像,什么数据多了一个维度呢?当然就是视频了,视频的帧数,就是完美的另一个深度维度,将3D卷积用于视频的分类,再自然不过,关键就是看谁先来干。

据我所知,文【1】是最早的,看看他们使用的网络结构。

网络很浅,只有3个卷积层和1个全连接层,2个池化层,这样的网络规模和LeNet5可以称兄道弟了。不过3D多了一个维度,计算量自然是多了很多。

这里有两个3D卷积层,卷积核大小分别是7x7x3,7x6x3,前两维是空间的卷积,后一维是时间的卷积,看得出来,不需要保持一致,而且通常空间的卷积核大小和时间就不会一致,毕竟处理的“分辨率”不同。

这个网络结构在视频分类数据集UCF-101上的top-1精度为63.3%,别看这个指标不高,其他的比如LSTM,双流网络等也差不太多,而普通的2D卷积或者传统方法则要低于这个指标。

更细致的三维卷积在视频分类中应用的网络结构的探索在文【2】中,感兴趣读者可以自取。

2.2 图像分割

既然可以用于分类,自然也可以用于分割。不过对视频使用3D卷积似乎优势并不大,而在医学领域的应用前景更大一些。

医学数据通常都是3D的,比如CT扫描的数据,虽然我们看的片子是2D的,但其实那只是一个切片,真正的扫描数据是3D的。

而如果要分割出一些病变组织,比如肿瘤,也必须是3D的。

具体的网络结构就是将U-Net改为3D的形式。

就讲这么多,未完待续。

【1】Ji S, Xu W, Yang M, et al. 3D convolutional neural networks for human action recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(1): 221-231.

【2】Tran D, Bourdev L, Fergus R, et al. Learning spatiotemporal features with 3d convolutional networks[C]//Proceedings of the IEEE international conference on computer vision. 2015: 4489-4497.

【3】Casamitjana A, Puch S, Aduriz A, et al. 3D Convolutional Neural Networks for Brain Tumor Segmentation: a comparison of multi-resolution architectures[C]//International Workshop on Brainlesion: Glioma, Multiple Sclerosis, Stroke and Traumatic Brain Injuries. Springer, Cham, 2016: 150-161.

总结

我们面临的很多的数据都是高维的,比如街景地图,比如视频,比如医学图像,比如点云,将二维拓展至更高维的卷积也是很自然的想法,总之多尝试吧。

转载文章请后台联系

侵权必究

更多请关注知乎专栏《有三AI学院》

往期精选

  • 【模型解读】“不正经”的卷积神经网络

  • 【模型解读】resnet中的残差连接,你确定真的看懂了?

  • 【模型解读】pooling去哪儿了?

  • 【模型解读】说说移动端基准模型MobileNets

  • 【模型解读】GoogLeNet中的inception结构,你看懂了吗

  • 【模型解读】network in network中的1*1卷积,你懂了吗

  • 【模型解读】从“局部连接”回到“全连接”的神经网络

  • 【模型解读】深度学习网络只能有一个输入吗

想要变身”AI专家“,就戳戳手指关注我们吧

别忘了点“好看”支持作者噢  ???

【模型解读】从2D卷积到3D卷积,都有什么不一样相关推荐

  1. 一文教你搞懂2D卷积和3D卷积

    前言     本人最近在搞毕设时发现自己一直会搞混2D卷积和3D卷积,于是在网上查阅了大量资料,终于明白了其中的原理.希望刷到这篇博客的小伙伴能够停下来静心阅读10分钟,相信你读完之后一定会有所收获. ...

  2. 深度学习:从2D卷积到3D卷积的简单理解

    很多人容易混淆2D卷积和3D卷积的概念,把多通道的2D卷积当成3D卷积,本文展示了一种直观理解2D卷积和3D卷积的方式. 2D卷积 单通道 首先了解什么是卷积核,卷积核(filter)是由一组参数构成 ...

  3. 深度学习中常见卷积(普通卷积、1×1卷积、转置卷积、可分离卷积、膨胀(空洞)卷积、3D卷积)

      总是在网络上看到各种名词的卷积,但是有搞不懂是什么含义,于是结合网上查阅的资料,总结一下.目前比较常用的卷积主要有常规的卷积.1×1卷积.转置卷积.可分离卷积.膨胀卷积.3D卷积.   以下是一些 ...

  4. 「模型解读」从2D卷积到3D卷积,都有什么不一样

    https://www.toutiao.com/a6711317983035130371/ 接着模型解读系列,在中国科幻作家刘慈欣的科幻小说<三体Ⅲ·死神永生>中,首次提出了降维打击这个概 ...

  5. 2D卷积与3D卷积的区别

    内容来自:C3D的论文 应用于一个图像的2D卷积将输出一个图像,施加在多个图像上的2D卷积(将它们视为不同的通道)也输出一个图像.因此,2D ConvNets在每次卷积运算之后就会丢失输入信号的时间信 ...

  6. 【模型解读】“不正经”的卷积神经网络

    文章首发于微信公众号<与有三学AI> [模型解读]"不正经"的卷积神经网络 这是深度学习模型解读第7篇,本篇我们将介绍不规则形状的卷积. 作者&编辑 | 言有三 ...

  7. 【模型解读】“全连接”的卷积网络,有什么好?

    [模型解读]"全连接"的卷积网络,有什么好? 这是深度学习模型解读第8篇,本篇我们简单介绍Densenet. 作者&编辑 | 言有三 1 从skip connect到den ...

  8. 【模型解读】network in network中的1*1卷积,你懂了吗

    文章首发于微信公众号<与有三学AI> [模型解读]network in network中的1*1卷积,你懂了吗 这是深度学习模型解读第二篇,本篇我们将介绍Network InNetwork ...

  9. 【模型解读】从LeNet到VGG,看卷积+池化串联的网络结构

    文章首发于微信公众号<与有三学AI> [模型解读]从LeNet到VGG,看卷积+池化串联的网络结构 从本篇开始,我们将带领大家解读深度学习中的网络的发展 这是深度学习模型解读第一篇,本篇我 ...

最新文章

  1. python 常量_大疆机甲大师Python开发: 两只老虎
  2. JavaScript随笔一篇
  3. 【VBS】总结 Visual Basic 的分支结构和循环结构
  4. python中的参数函数_python中函数与参数的简介
  5. 云+AI+5G时代,华为云已准备好多元化云服务架构
  6. 新iPhone又被各个品牌玩坏了,这里的人个个都是人才,说话又好听…
  7. angular解决跨域问题
  8. Open XML应用安全(3)隐藏数据
  9. 毕业生的商业软件开发之路 ---- 商业软件开发基础
  10. 收藏:通俗讲解计算机工作原理
  11. 程序闪退崩溃的几种原因
  12. 一文带你看懂自然语言处理——word表示技术的变迁(从bool模型到BERT)
  13. matlab求解scara运动空间,SCARA机器人直线运动下的极限点求解算法
  14. 专家解析:程序员到软件架构师培训与认证之路
  15. Stadia云游戏平台
  16. 杰力科创七彩灯雾化器芯片--DLT8P60SC
  17. 使用 Ghidra 分析 phpStudy 后门
  18. MATLAB实现智能计算方法实验:实验三 BP神经网络
  19. 单片机与PC机串口通信编程
  20. 算法导论学习笔记1_循环不变式

热门文章

  1. chrome 插件精选之 github 篇
  2. SpringMVC控制器接收不了PUT提交的参数的解决方案
  3. 蓝桥杯-拿糖果(java)
  4. php高性能sqllite,简洁的PHP操作SQLite类
  5. python费用结算系统_python 全栈开发,Day104(DRF用户认证,结算中心,django-redis)
  6. scihub只能用doi查吗_同步带轮齿形加工只能用滚齿机吗?
  7. Dijkstra模板(java)
  8. Android从普通发送和接收短信到对短信进行拦截
  9. SpringBoot-切面AOP实现统一逻辑处理
  10. python最简单的架构_Python实现简单状态框架的方法