一种结构化随机失活UNet用于视网膜血管分割
1.目的:减少UNet中过拟合问题,提升端到端分割血管的能力
2主要工作:
(1)受DropBlock启发在每层卷积后使用了结构化随机失活;
(2)在三个视网膜图像数据集上测试了SD-UNet的性能,分别是DRIVE,STARE,CHASE_DB1;
(3)阐述SD-UNet性能在三个数据集上均超过了UNet,并且在DRIVE和CHASE-DB1数据集上达到了SOTA。(sota实际上就是State of the arts 的缩写,指的是在某一个领域做的Performance最好的model,一般就是指在一些benchmark的数据集上跑分非常高的那些模型)
3,模型
Fig 1展示了SD-UNet的详细结构,可以看到在U形网络中包含三层下采样模块和上采样模块,中间通过skip connection连接。每一层下采样模块中包含两个3x3卷积以及一次最大池化,随后是DropBlock层和ReLU层。在上采样部分结构与之类似,区别在于将池化层调换为了转置卷积。
4,Dropout与Dropblock
过拟合问题,根本的原因则是特征维度(或参数)过多,导致拟合的函数完美的经过训练集,但是对新数据的预测结果则较差。
关于Dropout
深度神经网络为了防止计算机视觉中的过拟合问题常使用不同的正则化方法,其中随机失活DropOut就是一种简单但有效的防止过拟合的方法.
神经网络包含多个非线性隐藏层,这使得它能够学习输入和输出之间的复杂关系,但我们不可否认的是:在实际情况中,即使测试集和训练集来自同一分布,训练集仍会存在噪声,那么网络就会同时学习数据和噪声的分布,这样就会容易导致过拟合.
在机器学习中,我们通常采用模型组合来提高模型的性能。然而,对于大型的神经网络来说,对多个网络模型的输出取平均的做法是耗费时间和空间的。所以提出了Dropout。Dropout就是随机丢弃神经网络中的神经元,所谓的丢弃就是将神经元从神经网络中移除,包括它与前向和后向的连接,具体哪个神经元被丢弃是随机的。
但Dropout适用于全连接层,并不适用于卷积层,卷积层的特征图中相邻元素在空间上是共享语义信息的,产生这种现象的原因正是卷积操作能够提取特征,具有感受野也就是说网络仍可以通过该位置的相邻位置元素去学习对应的语义信息。因此需要对卷积网络进行结构化的随机失活,通过对特征图中一部分相邻的整片区域整体失活,这样网络丢失了这一部分整体的信息,就可以更关注其他部位特征的学习。
a是原图,b图使用的是Dropout,c图使用Dropblock,X代表丢弃的位置.因此DropBlock layer包含两个参数:block_size和γ。其中block_size=1时与传统的dropout一样,而block_size=整张特征图时其实就是Spatial Dropout;γ参数负责控制一张特征图中有多少个激活点可以被失活。计算公式如下:
keep-prob: 一个神经元被保留下来的概率(事先给定)
w,h分别代表特征图的宽和高,
block-size:失活块的大小。
5,实验:
本节将系统的对比SD-UNet与原始的UNet在不同数据集上的效果,还会将SD-UNet与当前一些SOTA的框架进行对比。
数据扩充:随机旋转、颜色变换、增加高斯噪声、水平/垂直翻转
性能指标: PPV(精确率),TNR(特异性),TPR(召回率),Acc,AUC,F1score,JS(相似系数)
SR代表分割结果,GT代表地面实况。
结果:
UNet表示未使用dropout的原始UNet
UNet*表示使用了随机失活的UNet 随机失活率0.25
Table IV V VI还展示了SD-UNet与其他SOTA方法的对比,可以看到SU-UNet的性能均比其他方法好。
总结:
本文提出了一种基于全卷积UNet的网络结构-SD-UNet用于视网膜血管的逐像素分割,主要在UNet中增加DropBlock来提升模型性能。
其中UNet负责在下采样过程中捕获上下文信息,在上采样过程中可以有效融合不同层次的特征;同时借助DropBlock,SD-UNet可以在训练时丢弃部分区域的语义特征,从而减轻过拟合问题。
本文首次实现SD-UNet用于视网膜血管分割,为了验证这一方法的有效性在三个开源数据集DRIVE,STARE,CHASE_DB1上进行了测试,并且与其他方法对比,SD-UNet也取得了SOTA的结果。
一种结构化随机失活UNet用于视网膜血管分割相关推荐
- Unet用于人像分割
论文地址:U-Net: Convolutional Networks for Biomedical Image Segmentation 主要内容 人像分割简介UNet的简介UNet实现人像分割 人像 ...
- c语言中用于程序化结构设计的三种结构是,c语言中用于结构化程序设计的3种基本结构是...
大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. c语言中用于结构化程序设计的3种基本结构是顺序结构.选择结构.循环结构. 顺序结构的程序设计是最简单的,只要按照解决问题的顺序写出 ...
- 电子科大(申恒涛团队)京东AI(梅涛团队)提出用于视频问答的结构化双流注意网络,性能SOTA!优于基于双视频表示的方法!...
本文分享论文『Structured Two-stream Attention Network for Video Question Answering』,由电子科大(申恒涛团队)&京东AI(梅 ...
- KDD 2016 | SDNE:结构化深层网络嵌入
目录 前言 摘要 1. 引言 2. 相关工作 2.1 深度神经网络 2.2 网络嵌入 3. SDNE 3.1 问题定义 3.2 模型 3.2.1 框架 3.2.2 损失函数 3.2.3 优化 3.3 ...
- 使用JWT结构化令牌
上一篇中提到生成令牌的方式都是默认一个随机字符串.而在结构化令牌这方面,目前用得最多的就是 JWT 令牌了. JWT结构化令牌 JSON Web Token(JWT)是一个开放标准(RFC 7519) ...
- 在结构化场景中基于单目的物体与平面SLAM方案
点云PCL免费知识星球,点云论文速读. 文章:Monocular Object and Plane SLAM in Structured Environments 作者:Shichao Yang, S ...
- 信息抽取新SOTA!首个结构化生成式信息抽取预训练模型,一统信息抽取四大任务...
©PaperWeekly 原创 · 作者 | 樊润泽 单位 | 中科院计算技术研究所 研究方向 | 信息抽取 前两天在 arxiv 刷到了一篇已被 ACL 2022 主会接受的文章,题名<Uni ...
- 《CCNP TSHOOT 300-135学习指南》——1.2节结构化故障检测与排除方法
本节书摘来自异步社区<CCNP TSHOOT 300-135学习指南>一书中的第1章,第1.2节结构化故障检测与排除方法,作者[加]Amir Ranjbar(阿米尔 兰吉巴),更多章节内容 ...
- 技术20期:结构化数据与非结构化数据:有什么区别?
查看结构化和非结构化数据.它们的主要区别以及哪种形式最能满足您的业务需求. 并非所有数据都是平等的.有些数据是结构化的,但大部分是非结构化的.结构化和非结构化数据以不同的方式获取.收集和扩展,并且每一 ...
最新文章
- Cisco路由器的安全配置简易方案
- acwing算法题--整数分解
- 亿级短视频社交美拍架构实践
- java 采样_java 采集数据
- leetcode 606. Construct String from Binary Tree | 606. 根据二叉树创建字符串
- 【白皮书】2020中国MCN行业发展研究白皮书.pdf(附下载链接)
- 华为2020秋招笔试试题
- linux下编写脚本从ftp服务器定时下载文件
- 轻蜗牛直租平台-业务背景介绍
- Zeppelin设置访问登录权限
- 硬件茶谈(B站up主爱上半导体)
- 棠玥寕谈芭蕾:人生应有一热爱
- python 儿童 游戏_少儿编程分享:手把手教你用Python编写战斗机游戏(完)
- 前端项目微金所1 - bootstrap模板,Compatible(兼容),Viewport(视口),条件注释,第三方依赖,MediaQuery媒体查询...
- 蓝鲸智云-腾讯给广大运维工作者的福利
- 服务器hostname命名规范汇总
- nokia s40 java软件_诺基亚S40手机实现后台教程
- java许愿墙_许愿墙的实现
- C语言学习笔记4---数组、字符串
- 2022年中国大学生计算机设计大赛