Robust Medical Instrument Segmentation Challenge 2019拜读

  • 0. 摘要
  • 1. 介绍
  • 2. 方法
    • 2.1 挑战的任务
    • 2.2 挑战的数据集
      • 2.2.1 数据Recording
      • 2.2.2 数据提取
      • 2.2.3 标签生成
    • 2.3 评价方法
      • 2.3.1 Metrics指标
      • 2.3.2 Ranking评分
  • 3. 结果
    • 3.1. Method descriptions of participating algorithms

0. 摘要

腹腔镜器械的术中跟踪通常是计算机和机器人辅助干预的先决条件。 虽然文献中已经提出了许多基于内窥镜视频图像检测、分割和跟踪医疗器械的方法,但仍有待解决的关键限制:
首先,鲁棒性。即最先进方法的可靠性能 在具有挑战性的图像上运行时(例如在存在血液、烟雾或运动伪影的情况下)。
其次,泛化能力。为特定医院的特定干预训练的算法应该推广到其他干预或机构。
为了促进这些限制的解决方案,我们组织了强大的医疗器械分割 (ROBUST-MIS) 挑战赛,作为一项国际基准竞赛,特别关注算法的稳健性和泛化能力。在内窥镜图像处理领域,我们的挑战首次包括二进制分割任务,还涉及多实例检测和分割。该挑战基于一个手术数据集,该数据集包含 10,040 个带注释的图像,这些图像是从三种不同类型的手术的总共 30 个手术过程中获取的。三个任务(二进制分割、多实例检测和多实例分割)的竞争方法的验证在三个不同的阶段进行,训练和测试数据之间的域差距越来越大。结果证实了最初的假设,即算法性能随着域间隙的增加而下降。虽然性能最佳的算法的平均检测和分割质量很高,但未来的研究应该集中在小型、交叉、移动和透明仪器(零件)的检测和分割上。

1. 介绍

2. 方法

2.1 挑战的任务

  • 确定用于仪器检测和分割的鲁棒性方法
  • 评估所提出方法的泛化能力
  • 识别使图像特别具有挑战性的图像属性(例如烟雾、出血、运动伪影)

二进制分割任务,参与者必须使用二进制掩码提供精确的器械轮廓,“1”表示给定像素中存在手术器械,“0”表示不存在。
多实例分割任务,参与者必须通过分配代表不同医疗器械实例的数字“1”、“2”等来提供图像掩码。
多实例检测任务仅要求参与者检测和粗略定位视频帧中的仪器实例,其中位置可以用任意形式表示,例如边界框。
所有参与算法的泛化性和性能均分三个阶段进行评估,难度增加:
• 第 1 阶段:测试数据取自从中提取训练数据的程序(患者)。
• 第 2 阶段:测试数据取自与训练数据完全相同的手术类型,但取自训练中未包括的程序(患者)
• 第 3 阶段:与训练数据相比,测试数据取自不同但相似的手术类型(以及不同的患者)。
在算法提交给挑战赛之前,参与者只被告知第 1 阶段和第 2 阶段的手术类型;对于第三阶段,手术类型(乙状结肠切除术)被称为未知手术,以便测试算法泛化能力。

2.2 挑战的数据集

2.2.1 数据Recording

1) 数据来源
Storz内窥镜(All data was recorded with a Karl Storz Image 1 laparoscopic camera (Karl Storz SE & Co. KG, Tuttlingen, Germany), with a 30◦ optic lens. The Karl Storz Xenon 300 was used as a light source.)
2) 数据采集
海德堡大学医院外科综合手术室(Data acquisition was executed during daily routine procedures at the Heidelberg University Hospital, Department of Surgery in the integrated operating room (Karl Storz OR1 FUSION R ).)
3) 图像特殊设置
a) 分辨率:从主视频中的 1920×1080 像素 (HD) 降低到 960×540
4) 数据种类
三种不同类型手术(即 10 种直肠切除术、10 种直肠结肠切除术和 10 种乙状结肠切除术)的 30种微创外科手术视频。

2.2.2 数据提取

图像数据提取的步骤:
1) 删除相机在腹部以外的帧,保证隐私安全;
2) 所有视频以1帧/秒的速率进行采样,提取4,456个帧;加上手术阶段转换期间提取额外帧,总10040帧。
标签: 手术阶段的标签,可用EndVisSub Surgical Workflow Analysis in the SensorOR

2.2.3 标签生成

如下步骤生成Label:
1) 首先,公司Understand AI对提取的帧进行初始分割。
2) 挑战组织者分析注释,确定不一致并就注释协议达成一致。
3) 由 14 名工程师和 4 名医学生组成的团队审查所有注释,并在必要时根据注释协议对其进行改进。
4) 在模棱两可或不清楚的情况下,由两名工程师和一名医学生组成的团队生成共识注释。
5) 质量控制,一位医学专家检查所有精细的分割掩码并报告潜在的错误。
6) 标签的最终决定是由一个由医学专家和工程师组成的团队做出。

2.3 评价方法

2.3.1 Metrics指标

1) Binary Segmentation
Dice Similarity Coefficient (DSC) 、Normalized Surface Dice (NSD)

  • Dice Similarity Coefficient (DSC)


Y 和 Y^\hat{Y}Y^ 分别是一帧图像的真实分割图和预测分割图。这里简单介绍一下Dice系数:
Dice系数通常用来评价语义分割的指标,Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,取值范围在[0,1]:

其中 |X∩Y| 是X和Y之间的交集,|X|和|Y|分表表示X和Y的元素的个数,其中,分子的系数为2,是因为分母存在重复计算X和Y之间的共同元素的原因。

  • Normalized Surface Dice (NSD)
    待续
  • 2) Multi-instance Detection
    Mean Average Precision (mAP)。细节待续
  • 3) Multiple Instance Segmentation
    Multiple Instance Dice Similarity Coefficient (MI_DSC)、Multiple Instance Normalized Surface Dice (MI_NSD)。细节待续

2.3.2 Ranking评分

3. 结果

3.1. Method descriptions of participating algorithms

  1. Team caresyntax: Single network fits all
     多实例分割的核心思想:应用基于单个网络的 Mask R-CNN,两个分支共享卷积层。
     泛化:仅提供有限的训练数据,帮助网络更好地泛化。
     细节:使用经过预训练的 Mask R-CNN 版本,不包括视频中的任何时间信息。
     优势:方法大大优于基于 U-Net 的模型。

  2. Team CASIA_SRL: Dense pyramid attention network for robust medical instrument segmentation
     网络:Dense Pyramid Attention Network for multi-instance segmentation
     问题:光照变化、手术器械尺寸变化
     注意力模块:获取二阶统计数据,为提取像素间的语义关系和全局上下文

  3. Team Djh: A RASNet-based deep learning approach for the binary segmentation task
     网络:Refined Attention Segmentation Network
     预处理:数据增强。超参数调优
     特点:capture low-level and higher-level features

  4. Team fisensee: OR-UNet
     网络:optimized robust residual 2D U-Net (OR-UNet)
     模型细节:sum of DSC and cross-entropy loss and a multi-scale loss

Robust Medical Instrument Segmentation Challenge 2019拜读相关推荐

  1. 【论文】医学影像 | Elastic Boundary Projection for 3D Medical Image Segmentation 论文汇报 (CVPR 2019)

    医学影像 | Elastic Boundary Projection for 3D Medical Image Segmentation 论文汇报 (CVPR 2019) 原创 联系邮箱:xiangc ...

  2. 【文献阅读】医学图像分割中的loss函数选择-Loss odyssey in medical image segmentation loss

    参考文献:Loss odyssey in medical image segmentation loss 函数代码库 github-SegLoss 本文在四个典型的三维分割任务上对20个一般的损失函数 ...

  3. CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and Dual Norm

    CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and Dual Norm ...

  4. 《nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation》2018 未完待续(导师给了别的方向)

    这里写目录标题 一.Abstract 二.Methods 一.Abstract The U-Net was presented in 2015. With its straight-forward a ...

  5. 【论文阅读】WMH Segmentation Challenge 2017 及第一名解决方案

    文章目录 相关医学常识 白质高信号 Fazekas量表 [STandards for ReportIng Vascular changes on nEuroimaging (STRIVE)](http ...

  6. [深度学习论文笔记]TransBTSV2: Wider Instead of Deeper Transformer for Medical Image Segmentation

    TransBTSV2: Wider Instead of Deeper Transformer for Medical Image Segmentation TransBTSV2:用于医学图像分割的宽 ...

  7. [论文翻译]V-Net:Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation

    论文下载: 地址 V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation V-Net: ...

  8. 论文解析[3] U-Net and its variants for Medical Image Segmentation : A short review

    发表年份:2022 论文地址:https://arxiv.org/abs/2204.08470v1 文章目录 论文概要 1. 介绍 2. 方法 2.1 传统分割 2.2 U-Net 2015 2.3 ...

  9. 学习 TransFuse: Fusing Transformers and CNNs for Medical Image Segmentation 医学分割

    Fusing Transformers and CNNs for Medical Image Segmentation 文章目录 Fusing Transformers and CNNs for Me ...

  10. 深度学习论文: U-Net and its variants for Medical Image Segmentation : A short review

    深度学习论文: U-Net and its variants for Medical Image Segmentation : A short review U-Net and its variant ...

最新文章

  1. 网页解析:如何获得网页源码中嵌套的标签。
  2. 测试一下你对IP地址的掌握水平(网管面试时会用到)
  3. php怎样传数据到html代码,传递数据到PHP文件与HTML模板
  4. redux-thunk使用_Redux Thunk用示例解释
  5. 从0开始架构一个IOS程序——03 — -分包用添加pch全局引用文件
  6. 泛型系列3:获取泛型的类型
  7. csv to mysql_CSV to array
  8. Java中如何将以byte数组给出的数据转换为double数组形式
  9. STUCTS LABLE ‘S BENEFIT
  10. poj 2485 Highways 超级大水题 kruscal
  11. NBA历史上50大巨星2
  12. 《HTML5和JavaScript Web应用开发》——2.6 QA和设备测试
  13. Android Studio汉化版教程
  14. 根据身份证号匹配对应的城市编码
  15. PythonOperator、BashOperator以及Xcom使用
  16. openjudge7939_膨胀的木棍
  17. 笔记本电脑无法进入睡眠状态_电脑进入睡眠模式后无法唤醒的原因解析
  18. 2020少儿编程教育政策大汇总!
  19. 46个不得不知的生活小常识
  20. 男程序员怎么过妇女节

热门文章

  1. 硬件设计18之什么是VGA?
  2. 高速公路5G智能网联技术、方案和应用
  3. MIMO技术(一)分集与复用
  4. Effective Java目录
  5. ie8不支持transform: translateY,ie9支持不友好
  6. 大数据背景下网络舆情监督机制的研究(非原创)
  7. acwing 848 有向图的拓扑序列 拓扑序列
  8. windows10如何让图片打开方式为照片查看器
  9. phpnow开启mysqli扩展
  10. ARM7-LPC213x(五)UART0 和 UART1