目录

一、背景

二、问题

三、解决问题

四、Attention U-Net网络结构


简单总结Attention U-Net的操作:增强目标区域的特征值,抑制背景区域的目标值。抑制也就是设为了0。

一、背景

为了捕获到足够大的、可接受的范围和语义上下文信息,在标准的CNN结构中,特征图被逐步下采样,以获得粗粒度的特征图,扩大感受野范围。粗粒度特征图能反应空间信息。虽然粗粒度特征图能在全局尺度上进行模型定位,反应组织间的关系,但是当目标是不同形状的小目标时,减少错正率保持着困难。所以要提高分割精度。

二、问题

  1. 为提升精度,当前的分割框架依赖额外的预先定位模型,将任务分为目标定位和后续分割。
  2. 全卷机网络FCNs和U-Net是常见的网络架构。尽管他们有很好的表征性能,但是他们的结构是多级级联CNN,级联框架提取ROI,对特定的ROI进行稠密预测。这种方式会导致计算资源和模型参数的冗余使用。使用级联的所有模型都会重复提取相似的低级特征。

三、解决问题

为解决以上两个现状问题,本文提出了注意力门Attention Gate(AG)。本文将AG加入到U-Net的跳跃连接中,通过较粗粒度的特征图,获得语义上下文信息,进而对来自同层的encoder的特征图中不相关的特征进行抑制,提高模型对目标区域的灵敏度和准确性。(没有提取ROI,也实现了目标定位)

四、Attention U-Net网络结构

图1 AG的简图

图2 AttentionU-Net网络结构

Attention U-Net网络结构,即在U-Net的跳跃连接上加入了Attention Gate模块,通过跳跃连接提高显示特征。从粗粒度尺度上提取信息用在门控中,以消除跳跃连接中的无关的和噪声响应。AGs在前向过程和反向过程期间过滤神经元激活。背景区域的梯度在反向过程中向下加权,较浅区域的模型参数被更新。为减少AGs的训练参数量和计算复杂度,执行了线性变换。在较粗尺度上,AG提供器官的粗略轮廓。

编码层和U-Net的编码层操作一样,此处不再过多讲解。详情见另一篇U-Net博客。

解码层:拿D3举例子,来介绍每层的具体实现:

  1. (对D4上采样,达到E3的分辨率)先D4上采样,得到de4,此时de4的特征数量由512至256;
  2. (将D4、E3输入到AG中,即跳跃连接处的操作)然后将de4与E3输入到AG中,通过卷积操作,将de4的特征数量256降至128,E3的特征数量由256降至128,然后将de4与E3相加,得到psi,相加是为了对目标区域做增强操作,即将目标区域的特征值变大;然后对psi做relu操作,特征数量变为256,此时还称为psi。然后对psi通过卷积操作实现线性变换,特征数量由256变为1,做sigmoid操作,sigmoid的操作即结果非0即1,也就是将背景设为0,目标区域设为1, 即实现了背景抑制的目的,消除跳跃连接中无关的和噪声干扰,此时也实现了减少AG的训练参数量和计算复杂度,进一步得到psi。然后将最初的E3与此时的psi相乘,就得到了对最初的E3做了背景抑制的处理,此时的结果称为en3。(此步骤为AG的操作)
  3. (此时是D3出的操作)将通过AG处理的en3与上采样后的de4进行拼接操作,此时特征数量由256变为512;之后做两次conv3*3,特征通道变为256,完成D3部分的操作。

D1的最后,还有一个conv1*1,用来实现将特征数量由64变为需要的数量num_classes。

Attention U-Net的优势:

没有多模型训练和大量的额外模型参数。

医学图像分割之Attention U-Net相关推荐

  1. 基于深度学习的自然图像和医学图像分割:网络结构设计

    来源:知乎.极市平台.深度学习爱好者作者丨李慕清@知乎 https://zhuanlan.zhihu.com/p/104854615 本文约5100字,建议阅读10分钟 本文首先介绍一些经典的语义分割 ...

  2. tensorflow图像分割unet_AAAI2020 | 医学图像分割的Nonlocal UNets

    点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者: 街道口扛把子 https://zhuanlan.zhihu. ...

  3. UNETR 医学图像分割架构 2D版 (Tensorflow2 Keras 实现UNETR)

    文章目录 前言 一.UNETR网络结构 二.代码 1.引入库 2.辅助函数和自定义keras层 3.构建Vision Transformer 4.构建完整UNETR 5.简单测试 前言   现在在尝试 ...

  4. 【深度学习】ICPR 2022|3DUNet:卷积+胶囊强强联手,医学图像分割的新良方

    作者丨Ziyang Li 编辑丨极市平台 导读 卷积神经网络(CNN)目前在医学图像分割领域应用广泛.本文基于胶囊网络,设计了一种包含卷积与胶囊编码器的3DUNet架构并应用于医学图像分割,在减少推理 ...

  5. [医学图像分割综述] Medical Image Segmentation Using Deep Learning: A Survey

    使用深度学习的医学图像分割:一项调查 论文地址 本综述有两个独创之处,首先,与传统的调查方法直接将医学图像分割的文献划分为多个组,并对每个组详细介绍文献的方法相比,我们将目前流行的文献按照从粗到细的多 ...

  6. (新SOTA)UNETR++:轻量级的、高效、准确的共享权重的3D医学图像分割

    (新SOTA)UNETR++:轻量级的.高效.准确的共享权重的3D医学图像分割 0 Abstract 由于Transformer模型的成功,最近的工作研究了它们在3D医学分割任务中的适用性.在Tran ...

  7. 论文阅读笔记--医学图像分割[上下文金字塔融合网络]

    CPFNet: Context Pyramid Fusion Network for Medical Image Segmentation--用于医学图像分割的上下文金字塔融合网络 一 摘要 二.研究 ...

  8. 医学图像分割新网络:Boundary-aware Context Neural Network for Medical Image Segmentation

    文章目录 摘要 一.引言及相关方法 二.本文主要方法 2.1 总体介绍 2.2 Pyramid Edge Extraction Module 2.3 Mini Multi-Task Learning ...

  9. 【论文汇总】CVPR2020语义分割医学图像分割paper汇总

    语义分割&医学图像分割 segmentation@CVPR2020 CVPR2020语义分割和医学图像分割文章总结 文章目录 语义分割&医学图像分割 segmentation@CVPR ...

最新文章

  1. Python爬虫开发:https请求加密问题解决
  2. Linux经常使用到的操作
  3. Spring集成Quartz定时任务框架介绍和Cron表达式详解
  4. java理论知识看了忘_Java基础知识点总结--从细节再看Java(一)
  5. H.265与H.264对比有哪些优势
  6. PHP通过身份证号码获取性别、出生日期、年龄等信息
  7. 3dmax卸载工具_3Dmax软件无法安装?3Dmax软件正确卸载方法,重装无忧
  8. quartus II DDS实验
  9. cobalt strick 4.0 系列教程 (5)--- 获取立足点
  10. 前端识别验证码思路分析
  11. 为什么只能取出购票信息单_如何换取购票信息单 取票取出的是购票信息单
  12. C# winform表格datagridview行高自动设置问题
  13. eclipse配置环境变量 win10
  14. 2020 Domain Adaptation 最新论文:插图速览(三)
  15. 大数据技术之大数据基础阶段考试题(二)
  16. 俞敏洪在同济大学的演讲词
  17. Java Swing高级组件——分割面板
  18. 计算机屏幕出现条纹w7,为什么我安装win7后,屏幕的分辨率会下降?屏幕上有一横一横的条纹?...
  19. 【ROS】ROS安装与配置
  20. python文字图片拼接_Python-PIL-拼接图片

热门文章

  1. compareTo的用法
  2. C语言——整型整除,浮点数整除
  3. H.266/VVC帧间预测技术学习:帧间和帧内联合预测(Combined inter and intra prediction, CIIP)
  4. 【GD32L233C-START】1、初识GD32L233C-START板卡
  5. Matlab打开绘图工具
  6. 最新人脸识别技术方案
  7. Cython入门到放弃(一)
  8. android系统优化启动时间(Google官方推荐)
  9. 如何在网页中设置一个定时器计算时间?
  10. 解耦的概念、spring实现解耦的概述