https://www.toutiao.com/a6711317983035130371/

接着模型解读系列,在中国科幻作家刘慈欣的科幻小说《三体Ⅲ·死神永生》中,首次提出了降维打击这个概念,这是本质上区别于同一维度的攻击,破坏性也更大。

而现在我们要说的是从二维卷积升级到三维卷积,它相比2D卷积是否会有不一样呢?

作者 | 言有三

编辑 | 言有三

1 3D卷积

首先看一下二维卷积,一个3*3的卷积核,在单通道图像上进行卷积,得到输出。

然后我们再看一下3维卷积,一个3*3*3的卷积核在立方体上进行卷积,得到输出。

就是这样,没什么其他花样了。

可能有人会问,这跟多通道卷积有什么区别呢?

有。

多通道卷积不同的通道上的卷积核的参数是不同的,而3D卷积则由于卷积核本身是3D的,所以这个由于“深度”造成的看似不同通道上用的就是同一个卷积,权重共享嘛。

总之,多了一个深度通道,这个深度可能是视频上的连续帧,也可能是立体图像中的不同切片。

2 3D卷积的应用

上面也说了,3D卷积就是多了一个深度通道,而这个深度通道可能是视频上的连续帧,也可能是立体图像中的不同切片,所以从应用上来说,主要就是两大主要方向。

2.1 视频分类

相比于2D图像,什么数据多了一个维度呢?当然就是视频了,视频的帧数,就是完美的另一个深度维度,将3D卷积用于视频的分类,再自然不过,关键就是看谁先来干。

据我所知,文【1】是最早的,看看他们使用的网络结构。

网络很浅,只有3个卷积层和1个全连接层,2个池化层,这样的网络规模和LeNet5可以称兄道弟了。不过3D多了一个维度,计算量自然是多了很多。

这里有两个3D卷积层,卷积核大小分别是7x7x3,7x6x3,前两维是空间的卷积,后一维是时间的卷积,看得出来,不需要保持一致,而且通常空间的卷积核大小和时间就不会一致,毕竟处理的“分辨率”不同。

这个网络结构在视频分类数据集UCF-101上的top-1精度为63.3%,别看这个指标不高,其他的比如LSTM,双流网络等也差不太多,而普通的2D卷积或者传统方法则要低于这个指标。

更细致的三维卷积在视频分类中应用的网络结构的探索在文【2】中,感兴趣读者可以自取。

2.2 图像分割

既然可以用于分类,自然也可以用于分割。不过对视频使用3D卷积似乎优势并不大,而在医学领域的应用前景更大一些。

医学数据通常都是3D的,比如CT扫描的数据,虽然我们看的片子是2D的,但其实那只是一个切片,真正的扫描数据是3D的。

而如果要分割出一些病变组织,比如肿瘤,也必须是3D的。

具体的网络结构就是将U-Net改为3D的形式。

就讲这么多,未完待续。

【1】Ji S, Xu W, Yang M, et al. 3D convolutional neural networks for human action recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(1): 221-231.

【2】Tran D, Bourdev L, Fergus R, et al. Learning spatiotemporal features with 3d convolutional networks[C]//Proceedings of the IEEE international conference on computer vision. 2015: 4489-4497.

【3】Casamitjana A, Puch S, Aduriz A, et al. 3D Convolutional Neural Networks for Brain Tumor Segmentation: a comparison of multi-resolution architectures[C]//International Workshop on Brainlesion: Glioma, Multiple Sclerosis, Stroke and Traumatic Brain Injuries. Springer, Cham, 2016: 150-161.

「模型解读」从2D卷积到3D卷积,都有什么不一样相关推荐

  1. 「模型解读」深度学习网络只能有一个输入吗

    https://www.toutiao.com/a6711317479001424395/ 平常我们所见的深度学习模型,都是输入一个图像或者视频序列,输出分类,分割,目标检测等结果,但是还有一种模型需 ...

  2. 「模型解读」“不正经”的卷积神经网络

    https://www.toutiao.com/a6709293693758620172/ 1 卷积中的不变性 图像任务,都需要识别出图像中的主体,用于分类,检测,分割,比如下面的验证码识别. 但是同 ...

  3. 「模型解读」浅析RNN到LSTM

    https://www.toutiao.com/a6711704602531594764/ 卷积神经网络使用固定大小的矩阵作为输入(比如一张图片),然后输出一个固定大小的向量(比如不同分类的概率),适 ...

  4. 「模型解读」GoogLeNet中的inception结构,你看懂了吗

    https://www.toutiao.com/a6706860769624982020/ 1 Inception V1[1] GoogLeNet首次出现在2014年ILSVRC 比赛中获得冠军.这次 ...

  5. 全局稳定性收敛平衡点为0吗_「模型解读」GoogLeNet中的inception结构,你看懂了吗...

    作者 | 李健(微信号:lijian05170517) 编辑 | 言有三 1 Inception V1[1] GoogLeNet首次出现在2014年ILSVRC 比赛中获得冠军.这次的版本通常称其为I ...

  6. 「模型解读」从“局部连接”回到“全连接”的神经网络

    https://www.toutiao.com/a6710967708617277960/ 作者 | 言有三(微信号:Longlongtogo) 编辑 | 言有三 与全连接神经网络相比,卷积神经网络在 ...

  7. 「模型解读」resnet中的残差连接,你确定真的看懂了?

    https://www.toutiao.com/a6708715626782786061/ 1 残差连接 想必做深度学习的都知道skip connect,也就是残差连接,那什么是skip connec ...

  8. 谷歌「模型汤」靠微调屠了ImageNet的榜!方法竟然只有半页纸

      视学算法报道   编辑:LRS 好困 [新智元导读]ImageNet排行榜又双叒叕被刷新啦!不过这回,新霸主谷歌没有提出新模型,只靠微调「几个」模型就做到了第一,论文通篇都是实验分析,这也引起了网 ...

  9. 一文教你搞懂2D卷积和3D卷积

    前言     本人最近在搞毕设时发现自己一直会搞混2D卷积和3D卷积,于是在网上查阅了大量资料,终于明白了其中的原理.希望刷到这篇博客的小伙伴能够停下来静心阅读10分钟,相信你读完之后一定会有所收获. ...

最新文章

  1. MySQL之单表查询
  2. 可扩展且侵入性最小的脑机接口平台
  3. 【Android 逆向】selinux 进程保护 ( selinux 进程保护 | 宽容模式 Permissive | 强制模式 Enforcing )
  4. JPA的entityManager的find方法与getReference方法的区别
  5. android中到webservice用法
  6. oryx-editor 客户端的加载过程
  7. 共轭梯度法(Conjugate Gradient)
  8. 二叉树的四种遍历算法
  9. AIR移动平台打开图片文件
  10. jQuery Validate插件验证
  11. 2020年全新Java学习路线图,含配套视频,学完即为中级Java程序员!!(转载)
  12. Linux多开微信,在Deepin V20/15.11系统下实现微信多开的方法
  13. 中国科学院计算机博士范,范可(中科院研究员)_百度百科
  14. c语言给bmp图片加滤镜,图片编辑器PixelStyle: 图像处理,滤镜特效
  15. 计算机运算器发展趋势,2020计算器市场发展现状及及前景分析
  16. 在线CAD图纸批注功能方案比较与实现
  17. 超分算法小合集之SRCNN、DCSCN、SRDenseNet、SRGAN
  18. 【马仔创业记】一只猴子的创业独白(5)心理咨询行业痛点分析
  19. 古风仙鹤语文课件封面PPT模板
  20. EDI在物流行业中的应用

热门文章

  1. Pytorch使用CPU运行“Torch not compiled with CUDA enabled”
  2. scikit-learn朴素贝叶斯各种用法总结真正讲明白的,为作者建平点赞
  3. android文件的读取方法,Android读取写入文件的方法
  4. 清华刘洋:论文写作,信息为表,逻辑为骨,思想为心
  5. python 复现 Unet 论文中的 Weight Map
  6. 谷歌开放语音命令数据集,助力初学者利用深度学习解决音频识别问题
  7. CVPR2017-最新目标检测相关
  8. 人脸识别经典算法一:特征脸方法(Eigenface)
  9. Intel SGX Remote Attestation实例代码安装和执行,笔记
  10. 独家 | 115个A/B测试的分析结果︰平均提升为4%,大部分缺乏统计检定力