上周在某大厂医疗AI组的一面刚被问到这个问题。我开门见山,先上结论:3D UNet不一定优于2D UNet。科学里面没有绝对的结论,但凡说A一定好于B,需要说明的是在什么样的情况下好于,也就是需要控制住变量。我在回答结尾会引用一篇论文,来支持3D UNet不一定优于2D UNet。下面我将先从三个角度,谈谈3D和2D的区别。

1.从数据格式角度,3D数据和2D数据的不同是,多了一个方向的信息。2D数据的表达为(x,y),3D数据的表达为(x,y,z)。医疗影像的大部分数据都是3D的,也就是多层slice叠加而成的。但是由于z轴上的像素间距(pixel spacing)不同,3D的数据也被为薄层数据和厚层数据。薄层数据层厚较薄,所以z轴slice数比较多,比如眼底OCT图片的z轴slice数为128层(可视化效果);厚层数据的层厚比较厚,z轴slice数就相对较少,比如脑平扫CT一般层厚为5mm,z轴slice数在20-40层不等。这样显而易见,薄层的数据相较于厚层数据,在z轴方向的信息更加丰富。

2.从模型角度,3D卷积可以对3D数据从(x,y,z)三个方向上进行编码,而2D卷积只能对3D数据从(x,y)两个方向进行编码,这是3D卷积的优点。一般来讲,3D卷积的参数量更大,所以我们常用的3D-UNet都不是像2D-UNet那样降采样16倍,而是降采样8倍。但是由于数据量和模型参数量的匹配问题,3DUNet可能需要更多的数据去训练,否则可能会导致过拟合(over-fitting)。

3D卷积和2D卷积的演示图(图片来源)

3.从问题背景角度,考虑临床影像特征。举两个例子:有些病理在2D上没有明显征象。比如动脉瘤的检测,由于血管和动脉瘤在CTA上都是高信号,无法根据灰度值去判断动脉瘤。而是根据3D上血管的走向,发现3D形状上的一些异常,从而进行动脉瘤的诊断。这个病症的特点决定了,从任务背景上2D网络大概率不如3D网络。

有些病理在三维上是稀疏的。如果是在3维上比较稀疏的影像,可能2D网络就要更好。

动脉瘤示意图(图片来源)

总结一下,首先需要根据实际问题(临床病理和数据特点),去设计2D或者3D的网络。其次general的结论是,数据量比较小,3维数据的z轴slice数比较少时,2D网络可能更好。数据量比较大,3维数据的z轴slice数比较多时,3D网络可能更好。

One more thing,前面提了2D模型和3D模型的特点,那如何结合两种网络的优点呢?

我提供两种思路:在2D网络中引入时序(LSTM,RNN)等。

2. 2D卷积和3D卷积相结合。

在医疗影像领域,研究2D和3D如何做融合,个人觉得是一个非常好的方向。

附:The 3D networks performed poorly. We observed that their increased number of parameters resulted in more overfitting. Additionally, they were unable to take full advantage of the third image dimension, due to the large number of scans with only 2 axial slices. For the two best models, the 2D U-Net and pre-trained PSPNet, we observe the focal loss improved model performance. We demonstrate in Fig. 4 that the focal loss predicted more fine details in the lesions that were missed by cross entropy in the pre-trained PSPNet. The cross entropy loss network often over-predicted larger lesions than the focal loss network, and the focal loss network was able to more closely predict the fine appearance features of the lesions, and predict areas that cross entropy completely missed.

个人观点,欢迎交流~

segnet和unet区别_图像分割:3D Unet网络性能一定优于2D Unet吗,如果优于,为什么优于?...相关推荐

  1. unet论文_图像分割之RefineNet 论文笔记

    RefineNet: Multi-Path Refinement Networks forHigh-Resolution Semantic Segmentation (2017) 论文笔记 文章的创新 ...

  2. vpc经典网络区别_阿里云经典网络与VPC网络互通的实现

    众所周知,阿里云在目前的网络条件下,具有两套类型的网络,即经典网络和 VPC网络:对于申请阿里云较早的用户,大多环境下使用的是经典网络,而后 期一般申请的vps主机都是VPC网络的: 于是乎这里就出现 ...

  3. tl494c封装区别_详解TL494的性能特点参数 TL494引脚图与功能

    TL494是一个固定频率的脉冲宽度调制电路,内置了线性锯齿波振荡器,振荡频率可以通过外部的一个电阻和一个电容进行调节.主要为开关电源控制器而设计. TL494器件集成了在单个芯片上构建脉冲宽度调制(P ...

  4. [深度学习论文笔记]医学图像分割U型网络大合集

    [深度学习论文笔记]医学图像分割U型网络大合集 2015 U-Net: Convolutional Networks for Biomedical Image Segmentation (MICCAI ...

  5. 基于SegNet和UNet的遥感图像分割代码解读

    基于SegNet和UNet的遥感图像分割代码解读 目录 基于SegNet和UNet的遥感图像分割代码解读 前言 概述 代码框架 代码细节分析 划分数据集gen_dataset.py UNet模型训练u ...

  6. 教程: UNet/UNet++多类别图像分割,含数据集制作

    向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习  公众号:datayx 运行demo 下载数据集 https://pan.baidu.com/s/1PK3VoarN ...

  7. 【图像处理】经营您的第一个U-Net以进行图像分割

    一.说明 AI厨师们,今天您将学习如何准备计算机视觉中最重要的食谱之一:U-Net.本文将叙述:1语义与实例分割,2 图像分割中还使用了其他损失,例如Jaccard损失,焦点损失:3 如果2D图像分割 ...

  8. 【论文笔记】基于U-Net的医学图像分割模型nnU-Net(no-new U-Net)

    本文是 nnU-Net 论文的笔记,稍微做了整合了一下,可能有些地方有所遗漏,等以后看完代码之后再补充. 1. 摘要 nnU-Net(no-new-Net)是基于 U-Net 的一种模型,它在达到很好 ...

  9. Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行

    Tensorflow2.6实现Unet结构神经网络(3D卷积)识别脑部肿瘤并实现模型并行 说明 Unet神经网络 网络结构 代码实现 模型训练 训练环境 数据加载处理 训练 训练结果 模型并行版本 模 ...

最新文章

  1. 各种AJAX方法的使用比较
  2. 【OpenGL】二十四、OpenGL 纹理贴图 ( 读取文件内容 | 桌面程序添加控制台窗口 | ‘fopen‘: This function may be unsafe 错误处理 )
  3. xss攻击突破转义_WEB安全之XSS攻击方式与防御方式
  4. Codechef REBXOR HYSBZ - 4260(01字典树+区间异或最大)
  5. sqlserver2008r2安装
  6. C# 8 的新提案:new 关键字类型推断
  7. 扩展Java EE应用程序的基础
  8. 【转】10.Qt编程涉及的术语和名词
  9. Pyqt 中__init__(self,parent==None) parent理解
  10. Bootstrap -- 初见 Bootstrap
  11. ElasticSearch6.8.1集群搭建及Java客户端编写
  12. c语言 键盘输入结构体,C语言结构体问题
  13. 态度决定一切细节决定成败_字体设计可以决定设计的成败:选择字体的过程
  14. 更多:Racket系统编程
  15. CHM文件打不开或者提示的解决办法
  16. 热启动计算机的快捷键,电脑怎么设置U盘启动 各品牌电脑热启动快捷键大全-电脑教程...
  17. oracle角色(role)和权限(privilege)
  18. 全国计算机等级考试二级c语言程序设计,全国计算机等级考试二级教程:C语言程序设计(2016年版) pdf epub mobi txt 下载...
  19. 【UI设计】产品设计之UI设计规范
  20. JVM 上篇(12):垃圾回收相关概念

热门文章

  1. webRTC 实现两端通信
  2. 帮我选五组符合中国福彩双色球规则的号码
  3. 酷派d518支持java吗,酷派 D518:整体外观图
  4. c语言围棋ai算法代码,晒晒围棋代码
  5. 景联文科技:争创中国自动驾驶点云数据标注第一服务商
  6. 【现代机器人学——螺旋理论】UR5机器人正运动学求解
  7. CNopendata·PPP项目数据简介
  8. Latex设计表格字体大小
  9. 软件测试职业规划的思考
  10. Unity音游插件——Koreographer基础学习