coarse-to-fine(1) CF-DRNet

1、Coarse-to-fine classification for diabetic retinopathy grading using convolutional neural network

使用卷积神经网络对糖尿病视网膜病变分级进行从粗到细的分类。

Artificial Intelligence in Medicine

Volume 108, August 2020, 101936

亮点

首次提出了一个分层的从粗到细的糖尿病视网膜病变（DR）网络（CF-DRNet），该网络可以利用卷积神经网络实现分层的五级分级。

拟议的CF-DRNet由预先训练好的粗略网络和预先训练好的精细网络组成。粗粒度网络进行两级分类，细粒度网络进一步进行四级分类 DR严重程度等级。

在预训练的粗网络中引入了自门软注意机制模块（The self-gated soft-attention mechanism modules），用于两类分类，以有效地突出病变特征，抑制无关信息。

摘要：利用卷积神经网络（CNN）对DR的五个阶段的严重程度进行分类。CF-DRNet符合DR分级的分层特点，有效提高了DR五级分级的分类性能，主要包括以下内容。(1) 粗网络进行两级分类，包括无DR和DR，其中注意力门模块（attention gate module）突出突出病变特征，抑制无关的背景信息。(2) 提出的精细网络对粗略网络中的级DR严重程度进行四级分类，包括轻度、中度、重度非增殖性DR（NPDR）和增殖性DR（PDR）。实验结果显示，在公开的IDRiD和Kaggle眼底图像数据集中，所提出的CF-DRNet优于一些先进的方法。

2、背景

DR分级可以通过眼底图像中视网膜表面病变的数量、大小和类型来分类[8]。根据国际临床糖尿病视网膜病变疾病严重程度量表[9]，可以将DR的严重程度分为五个阶段，包括无糖尿病视网膜病变（No DR）、轻度非增殖性 DR（NPDR），中度NPDR，重度NPDR，以及PDR。

3、挑战

DR分类已经有了一些工作。但是存在一些挑战。1）训练样本的不足限制了自动DR分级的分类性能[14]。与拥有数百万数据的分类任务相比，如ImageNet挑战赛[15]，很难在DR分级任务上取得优异的性能；2）DR分级的分类性能受到类间相似性和类内变化的影响[16]。DR分级的分类很复杂，因为同一类别的眼底图像之间的病变大小存在明显的视觉差异，而两个不同类别的眼底图像之间在形状和颜色上存在视觉相似性。

4、相关工作

提到1、过去用机器学习的方法依靠先验知识人工提取特征；2、后来用CNN以及一些改进（增加CNN深度、和输入图像的分辨率）。没有提到分级的借鉴思路。

5、网络结构

(1) 预处理模块对眼底图像进行归一化、图像增强和数据增量等操作。(2）CF-DRNet模块用于DR分类，它由两个子网络组成，包括粗网络和细网络。预先训练好的带有注意力模块的粗网络进行二分类。预先训练好的带有大尺寸图像的精细网络是为这四个阶段的DR严重程度等级设计的。(3) 聚合模块进行标签融合。

输入size。粗256*256；细512*512。

（2）粗网络：基于resnet-18（short-cut结构可以解决退化问题）

注意门来自：Attention u-net: Learning where to look for the pancreas

带有注意门模块的ResNet可以学习增强病变特征，抑制眼底图像的不相关信息。注意力门模块的输出通过乘法操作与输入融合，融合结果作为下一层的输入。

6、训练过程

Overall testing set is divided into two classes including grade No DR and grade DR. 整体测试集被分为两类，包括无DR级和DR级。无DR级的结果是通过粗略网络的两类分类性能得到的。

CF-DRNet的实现和训练/测试过程。计算机平台的配置如下。CPU是Inter(R) Core(TM) i7-5930 K 3.5 GHz；GPU是NVIDIA 2080TI，内存11G。所有代码都在Python 3.6下编写，我们使用Tensorflow r1.4作为深度学习库。这里使用的CUDA版本是10.0。在训练阶段，使用小批量随机梯度下降带动量（设置为0.9）学习权重参数。基础学习率被设置为10 ^ -3 ，并迭代减少，直到损失停止减少。所有的模型都是用10,000次迭代来训练的。
对于粗略网络，数据集中的五个等级的眼底图像和相应的标签（无DR、轻度NPDR、中度NPDR和重度NPDR）被转化为两个等级的眼底图像和相应的标签（无DR、DR）。在训练阶段，批次大小被设定为8，在测试阶段，所有预处理过的×256 256像素的测试图像被输入到粗略网络。最后，测试集的眼底图像被分为两类（无DR、DR）。对于精细网络，在训练阶段，批次大小被设定为4。在测试阶段，来自粗网络分类为DR的图像和标签被进一步分为四个等级（轻度NPDR、中度NPDR和重度NPDR）。所有×512 512像素的测试图像被输入到精细网络。最后，测试集的眼底图像被划分为四个阶段的DR严重程度等级。

7、两个数据集

使用了五倍交叉验证法。我们使用80%的眼底图像进行训练图像进行训练，20%的图像进行测试。值得注意的是训练数据集和测试数据集之间没有数据重叠。数据集。

SEN

SPEC

ACC

实验结果：

可以看出，在Kaggle数据库中，与ResNet相比，在准确率（提高3.75%）和特异性（提高24.36%）方面，凭借注意门模块的粗放网络在DR分级方面比基本ResNet有更好的表现。

在IDRiD数据库中，准确性（提高6.67%）、敏感性（提高2.82%）和特异性（提高8.76%）。

总结：resnet加入attention-gate（取自attention-unet），coarse输入256*256，fine输入512*512（多尺度）

coarse-to-fine(1) CF-DRNet相关推荐

论文阅读：Coarse to Fine Vertebrae Localization and Segmentation with SpatialConfiguration-Net and U-Net
Coarse to Fine Vertebrae Localization and Segmentation with SpatialConfiguration-Net and U-Net 基于Spa ...
NeRF神经辐射场ECCV2020
目录 NeRF前置内容:渲染和观察方向摘要 1.Introduction 2.Related Work 2.1.Neural 3D shape representations 2.2.View sy ...
135套代码,图片人群计数模型crowd count model code repositoty
2017_Switch-CNN 2017_cite=848_CVPR_Switching convolutional neural network for crowd counting val-iis ...
收藏一文熟悉视频目标跟踪技术
01 研究背景介绍近年来,随着大数据.云计算.人工智能等领域日新月异的发展及交互融合,智慧电商.智慧交通.智慧城市等概念越发受到关注.随着人们对更智能.更便捷.更高质量生活的向往,同时伴随着重大的学 ...
高精地图中导航标识识别
高精地图中导航标识识别思路主要介绍高精地图导航标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求. 高精地图介绍当你开车导航的时候,导航地图会向我们推荐一条或几条路线,有些地图甚 ...
一文详解基于先验地图的视觉定位
作者丨cc.fy@知乎来源丨https://zhuanlan.zhihu.com/p/460001686 编辑丨3D视觉工坊问题定义给定一份高精度地图或环境模型,给定相机(不限于单目,双目,多目 ...
相机定位 | cv paper整理
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达作者:梦寐mayshine 链接:https://zhuanlan.zhihu.com/p/13449 ...
人脸对齐--Face Alignment by Explicit Shape Regression
Face Alignment by Explicit Shape Regression CVPR2012 https://github.com/soundsilence/FaceAlignment 本 ...
多视角图像生成--Multi-View Image Generation from a Single-View
Multi-View Image Generation from a Single-View https://www.arxiv.org/pdf/1704.04886 本文使用对抗网络将单视角图像转出 ...
CVPR2022最新106篇论文整理｜包含目标检测、动作识别、图像处理等32个方向
转自:极市平台分类目录: 检测类 2D目标检测 3D目标检测伪装目标检测显著性目标检测边缘检测消失点检测分割类图像分割语义分割视频目标分割人脸人脸生成人脸检测图像处理图像复 ...

coarse-to-fine(1) CF-DRNet

coarse-to-fine(1) CF-DRNet相关推荐

最新文章

热门文章