1、Coarse-to-fine classification for diabetic retinopathy grading using convolutional neural network

使用卷积神经网络对糖尿病视网膜病变分级进行从粗到细的分类。

Artificial Intelligence in Medicine

Volume 108, August 2020, 101936

亮点

首次提出了一个分层的从粗到细的糖尿病视网膜病变(DR)网络(CF-DRNet),该网络可以利用卷积神经网络实现分层的五级分级。

拟议的CF-DRNet由预先训练好的粗略网络和预先训练好的精细网络组成。粗粒度网络进行两级分类,细粒度网络进一步进行四级分类 DR严重程度等级。

在预训练的粗网络中引入了自门软注意机制模块(The self-gated soft-attention mechanism modules),用于两类分类,以有效地突出病变特征,抑制无关信息。

摘要:利用卷积神经网络(CNN)对DR的五个阶段的严重程度进行分类。CF-DRNet符合DR分级的分层特点,有效提高了DR五级分级的分类性能,主要包括以下内容。(1) 粗网络进行两级分类,包括无DR和DR,其中注意力门模块(attention gate module)突出突出病变特征,抑制无关的背景信息。(2) 提出的精细网络对粗略网络中的级DR严重程度进行四级分类,包括轻度、中度、重度非增殖性DR(NPDR)和增殖性DR(PDR)。实验结果显示,在公开的IDRiD和Kaggle眼底图像数据集中,所提出的CF-DRNet优于一些先进的方法。

2、背景

DR分级可以通过眼底图像中视网膜表面病变的数量、大小和类型来分类[8]。根据国际临床糖尿病视网膜病变疾病严重程度量表[9],可以将DR的严重程度分为五个阶段,包括无糖尿病视网膜病变(No DR)、轻度非增殖性 DR(NPDR),中度NPDR,重度NPDR,以及PDR。

3、挑战

DR分类已经有了一些工作。但是存在一些挑战。1)训练样本的不足限制了自动DR分级的分类性能[14]。与拥有数百万数据的分类任务相比,如ImageNet挑战赛[15],很难在DR分级任务上取得优异的性能;2)DR分级的分类性能受到类间相似性和类内变化的影响[16]。DR分级的分类很复杂,因为同一类别的眼底图像之间的病变大小存在明显的视觉差异,而两个不同类别的眼底图像之间在形状和颜色上存在视觉相似性。

4、相关工作

提到1、过去用机器学习的方法依靠先验知识人工提取特征;2、后来用CNN以及一些改进(增加CNN深度、和输入图像的分辨率)。没有提到分级的借鉴思路。

5、网络结构

(1) 预处理模块对眼底图像进行归一化、图像增强和数据增量等操作。(2)CF-DRNet模块用于DR分类,它由两个子网络组成,包括粗网络和细网络。预先训练好的带有注意力模块的粗网络进行二分类。预先训练好的带有大尺寸图像的精细网络是为这四个阶段的DR严重程度等级设计的。(3) 聚合模块进行标签融合。

输入size。粗256*256;细512*512。

(2)粗网络:基于resnet-18(short-cut结构可以解决退化问题)

注意门来自:Attention u-net: Learning where to look for the pancreas

带有注意门模块的ResNet可以学习增强病变特征,抑制眼底图像的不相关信息。注意力门模块的输出通过乘法操作与输入融合,融合结果作为下一层的输入。

6、训练过程

Overall testing set is divided into two classes including grade No DR and grade DR. 整体测试集被分为两类,包括无DR级 和DR级。无DR级的结果是通过粗略网络的两类分类性能得到的。

CF-DRNet的实现和训练/测试过程。计算机平台的配置如下。CPU是Inter(R) Core(TM) i7-5930 K 3.5 GHz;GPU是NVIDIA 2080TI,内存11G。所有代码都在Python 3.6下编写,我们使用Tensorflow r1.4作为深度学习库。这里使用的CUDA版本是10.0。在训练阶段,使用小批量随机梯度下降带动量(设置为0.9)学习权重参数。基础学习率被设置为10 ^ -3 ,并迭代减少,直到损失停止减少。所有的模型都是用10,000次迭代来训练的。
对于粗略网络,数据集中的五个等级的眼底图像和相应的标签(无DR、轻度NPDR、中度NPDR和重度NPDR)被转化为两个等级的眼底图像和相应的标签(无DR、DR)。在训练阶段,批次大小被设定为8,在测试阶段,所有预处理过的×256 256像素的测试图像被输入到粗略网络。最后,测试集的眼底图像被分为两类(无DR、DR)。对于精细网络,在训练阶段,批次大小被设定为4。在测试阶段,来自粗网络分类为DR的图像和标签被进一步分为四个等级(轻度NPDR、中度NPDR和重度NPDR)。所有×512 512像素的测试图像被输入到精细网络。最后,测试集的眼底图像被划分为四个阶段的DR严重程度等级。

7、两个数据集

使用了五倍交叉验证法。我们使用80%的眼底图像进行训练 图像进行训练,20%的图像进行测试。值得注意的是 训练数据集和测试数据集之间没有数据重叠。数据集。

SEN

SPEC

ACC

实验结果:

可以看出,在Kaggle数据库中,与ResNet相比,在准确率(提高3.75%)和特异性(提高24.36%)方面,凭借注意门模块的粗放网络在DR分级方面比基本ResNet有更好的表现。

在IDRiD数据库中,准确性(提高6.67%)、敏感性(提高2.82%)和特异性(提高8.76%)。

总结:resnet加入attention-gate(取自attention-unet),coarse输入256*256,fine输入512*512(多尺度)

coarse-to-fine(1) CF-DRNet相关推荐

  1. 论文阅读:Coarse to Fine Vertebrae Localization and Segmentation with SpatialConfiguration-Net and U-Net

    Coarse to Fine Vertebrae Localization and Segmentation with SpatialConfiguration-Net and U-Net 基于Spa ...

  2. NeRF神经辐射场ECCV2020

    目录 NeRF前置内容:渲染和观察方向 摘要 1.Introduction 2.Related Work 2.1.Neural 3D shape representations 2.2.View sy ...

  3. 135套代码,图片人群计数模型crowd count model code repositoty

    2017_Switch-CNN 2017_cite=848_CVPR_Switching convolutional neural network for crowd counting val-iis ...

  4. 收藏 一文熟悉视频目标跟踪技术

    01 研究背景介绍 近年来,随着大数据.云计算.人工智能等领域日新月异的发展及交互融合,智慧电商.智慧交通.智慧城市等概念越发受到关注.随着人们对更智能.更便捷.更高质量生活的向往,同时伴随着重大的学 ...

  5. 高精地图中导航标识识别

    高精地图中导航标识识别 思路 主要介绍高精地图导航标识识别上的技术演进,这些技术手段在不同时期服务了高精地图产线需求. 高精地图介绍 当你开车导航的时候,导航地图会向我们推荐一条或几条路线,有些地图甚 ...

  6. 一文详解基于先验地图的视觉定位

    作者丨cc.fy@知乎 来源丨https://zhuanlan.zhihu.com/p/460001686 编辑丨3D视觉工坊 问题定义 给定一份高精度地图或环境模型,给定相机(不限于单目,双目,多目 ...

  7. 相机定位 | cv paper整理

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:梦寐mayshine 链接:https://zhuanlan.zhihu.com/p/13449 ...

  8. 人脸对齐--Face Alignment by Explicit Shape Regression

    Face Alignment by Explicit Shape Regression CVPR2012 https://github.com/soundsilence/FaceAlignment 本 ...

  9. 多视角图像生成--Multi-View Image Generation from a Single-View

    Multi-View Image Generation from a Single-View https://www.arxiv.org/pdf/1704.04886 本文使用对抗网络将单视角图像转出 ...

  10. CVPR2022最新106篇论文整理|包含目标检测、动作识别、图像处理等32个方向

    转自:极市平台 分类目录: 检测类 2D目标检测 3D目标检测 伪装目标检测 显著性目标检测 边缘检测 消失点检测 分割类 图像分割 语义分割 视频目标分割 人脸 人脸生成 人脸检测 图像处理 图像复 ...

最新文章

  1. 基于Javaweb实现超市管理系统
  2. Spring 详解(四):Spring MVC
  3. linux 统计_聊聊 Linux 的内存统计
  4. because the principal dbo does not exist 问题解决方法
  5. Nodejs学习(三)-安装nodejs supervisor,提高点效率吧。
  6. 【原创】Erlang 之 match 和 compare equal
  7. Java基础-TreeSet与Java自定义类型的排序
  8. 数学思想 —— 简化问题
  9. 【 Redis开发与运维】第3章 读书笔记
  10. TCPIP协议详解----网络基础知识
  11. iOS Facebook pop动画进阶
  12. clickhouse优缺点总结
  13. 挪威是这样养三文鱼的--转帖
  14. EDI X12 997 功能性确认 Functional Acknowledgment
  15. ssh免密码登录快速配置方法
  16. 安卓美化——添加下拉菜单图片或下拉菜单透明
  17. direct do造句 sb to_wish to do造句
  18. godspeed机器人_来自深渊(KINEMA CITRUS改编的电视动画作品)_百度百科
  19. 贪心绝对值不等式-货仓选址
  20. 淘宝api开发教程(淘宝API测试地址,参数说明)

热门文章

  1. html超链接代码(持续更新中)
  2. android学习之屏幕解锁
  3. eul for 1.4.1 Mac中文版 菜单栏系统状态查看工具
  4. 小白踩坑记:springboot运行一直报错:There was an unexpected error (type=Not Found, status=404).
  5. 统信 UOS 20 初体验
  6. Javascript——手机号,邮箱中间几位显示*星号
  7. mulesoft Module 5 quiz 解析
  8. MATLAB中m文件的新建和使用
  9. uniapp开发微信公众号之网页授权
  10. RIO 窄线宽激光源:紧致型台式激光光源(1528--1565波长可选)