Improved Disease Classification in Chest X-Rays with Transferred Features from Report Generation

从文本生成器的转移特征提升胸部X光的疾病分类表现

首先在小型胸部X射线数据集(IU)上训练报告生成网络,然后将学习的视觉特征传输到在大型数据集(ChestX-ray14)上训练分类网络,并使用新颖的注意力引导特征融合策略来提高检测性能14种常见胸部疾病。

通过学习不同类型的特征表示之间的对应关系,由报告生成和分类模型学习的共同特征被赋予更高的注意力权重,并且不改变任何已经学习到的特征。

贡献:

  1. 加权的视觉特征提高了胸部疾病分类网络的性能。
  2. 证明了使用小数据集上学习到的视觉表示来补充在另一个大数据集上学到的特征是可行的,不同的任务来提高模型的性能。

做法:不同于传统迁移学习(大->小),而是先在小数据集上训练文本生成模型,之后在大数据集上,使用融合特征进行疾病分类模型训练。    ----医学图像上的迁移学习

文本生成特征+分类网络特征得到attention map,之后融合初始特征再进行训练。

模型概览:

使用NLP+CV的分层结构

  1. 放射报告生成模型

对于长度为T的第i个句子,估计的概率可表示为:

Image Encode:使用ResNet152的最后一层卷积得到attention map的局域特征(2048*7*7,49个),最后一个平均池化层取全局特征àimage encode

上半部分:报告生成器首先将正面视图图像作为输入并通过CNN-RNN模型,然后使用双向长短期存储器(Bi-LSTM)作为主题编码器以产生全局主题向量。

下半部分:句子解码器采用区域视觉特征和主题向量来生成第一个句子。之后,通过将区域视觉特征,先前生成的句子和主题向量作为多模式输入来生成每个句子。

训练细节:由Adam优化器训练。 初始学习率设置为1e-4,并且每5个时期学习率衰减为0.5。 批量大小为32,采用贪婪搜索在每个时间步长中生成单词和句子。最大句子数设置为7.分开训练Iimpression decoder和sentence decoder。

  1. 胸部疾病分类以及注意力主导的特征融合过程

不变操作:

训练两种不同的基线分类模型以获得视觉特征。ResNet-18模型和DenseNet-121模型。,最终完全连接的层被替换为具有14个输出的14个疾病类别。通过最小化二元交叉熵损失来完成训练。使用ImageNet上预训练的模型的权重初始化网络的权重。

特殊操作:

丢弃包括最终汇集层,最终完全连接层和Sigmoid的转换块,以仅保留局部视觉特征。然后在分类数据集上运行报告生成器的图像编码器。将提取的局部视觉特征和来自分类网络的本地视觉特征两者馈送到特征关注模块中:

特征归一化:

之后将注意力权重应用于从分类网络学习的原始视觉特征。融合两种特征并重新训练最后几层以获得新的分类预测。

特征注意模块可以发现在两个独立的任务上训练的特征之间的对应关系,并且更多地强调在两个表示中共存的特征,获得更高的分类准确度,而无需重新训练特征提取模型。

3. 实验结果

文本生成网络:

使用BLEU,METEOR,ROUGE和CIDEr指标评估

由于放射学报告的语料库与其他文本语料库不同,CIDEr未提高。

说明我们的报告生成模型能够通过图像编码器学习有意义的特征

疾病分类网络:

14种疾病类别的ROC曲线的AUC的比较。 R18和D121分别代表ResNet-18和DenseNet-121基线模型。

在特征融合期间,由报告生成器的图像编码器和原始分类模型学习的所有视觉特征是固定的,以确保改进不是来自模型的重新训练而是更好的利用了已经学习到的特征。。

具有转移特征和注意力引导特征融合的ResNet-18模型在几乎所有除Mass之外的疾病上都大大优于基线ResNet-18分类模型

CheXNet除了心脏扩大和疝气之外的12种疾病的明显改善

DenseNet-121模型在14个类别中的11个中获得了最高的AUC分数,并且在所有方法中具有最高的平均AUC分数

实验结果表明,报告生成器中的图像编码器确实在训练过程中学到了有意义的特征,并且注意力模块引导的特征融合能够通过更好地利用多任务特征来改进分类结果。

总结:

  1. 报告生成模型首先在小胸部X射线数据集上进行训练,并由放射科医师提供书面报告,然后将学习的视觉表示转移到具有多种疾病的较大胸部X射线数据集中,这些特征能在注意力模块下进行加权。成功地改进了疾病分类结果,
  2. 针对不同任务在不同数据集上学习特征的迁移和注意引导特征融合可以提高模型性能,即使在大型数据集上也是如此。通过以互补的方式利用来自不同领域或任务的特征表示,这种特征转移和融合模型具有巨大的潜力,并且可以扩展到训练数据有限的其他医学成像应用,以推广原始模型并增强性能。

Improved Disease Classification in Chest X-Rays with Transferred Features from Report Generation论文解读相关推荐

  1. Kaggle Cassava Leaf Disease Classification 木薯叶疾病分类竞赛

    题目描述 kaggle挑战赛题目,构造一个分类模型,准确的识别出图像中木薯叶子感染的具体疾病. 详情可以参考链接:Cassva Leaf Disease Classification 木薯叶1 任务就 ...

  2. 【翻译】Evaluation of a computer‑aided method for measuring the Cobb angle on chest X‑rays

    Evaluation of a computer‑aided method for measuring the Cobb angle on chest X‑rays 计算机辅助测量胸部X光片Cobb角 ...

  3. 论文解读《Co-Correcting:Noise-tolerant Medical Image Classification via mutual Label Correction》

    论文解读<Co-Correcting:Noise-tolerant Medical Image Classification via mutual Label Correction> 论文 ...

  4. 论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

    论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference   随着 ...

  5. Open-Vocabulary Multi-Label Classification via Multi-modal Knowledge Transfer 论文解读

    Open-Vocabulary Multi-Label Classification via Multi-modal Knowledge Transfer 论文解读 前言 Motivation Con ...

  6. 论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering

    论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering   本文解决KBQA中的子问题--Relat ...

  7. 元学习论文阅读 | CAD: Co-Adapting Discriminative Features for Improved Few-Shot Classification, CVPR2022

    1 motivation FEAT(CVPR2020)中提出了embedding adaptation这个概念,具体来说就是对support set的样本利用transformer等方式实现信息聚合, ...

  8. Kaggle Cassava Leaf Disease Classification

    Kaggle木薯病害分类 我要吃麦旋风-OpenBayes ---------------------- 12-01--------在kaggle上的第一个比赛,0.900, 先占个坑,慢慢刷锅 -- ...

  9. [论文解读] A Ranking-based, Balanced Loss Function Unifying Classification and Localisation in Object De

    文章内容 相关研究现状 1. 定位任务和分类任务的平衡/耦合 2. 基于排名的目标检测算法 本文工作 基于排序损失的误差驱动优化方法推广 定理1:基于概率分布的损失函数重定义 定理2:正负样本梯度总和 ...

最新文章

  1. python与R行列数据过滤(row column filtering):dplyr、 isnull、isna、drop、select、iloc、loc、isin、filter
  2. 换晶振导致stm32串口数据飞码的解决办法(补充)
  3. Elasticsearch在后台启动(Linux)
  4. psychopy 音频时长代码_PsychoPy入门_03_视频和音频的呈现
  5. 使用NavigationUI更新UI组件
  6. openpyxl删除添加excel列_Python | 如何使用Python操作Excel(二)
  7. random对文件随机重命名
  8. java学习(13):scanner中的方法
  9. 看图了解RocksDB
  10. html-按钮和多选框
  11. cx oracle 中文 u,cx\U Oracle永久连接
  12. 20191023:(leetcode习题)最大连续1的个数 III
  13. 【动态规划】leetcode 53:最大子数组和
  14. 单/多文档的窗体类属性修改(VC_MFC)
  15. CentOS hgfs中没有共享文件夹
  16. 视觉SLAM应用(一)------AR发展的理解
  17. 科学计算机clr,怎么用科学计算器解方程?
  18. PUN ☀️六、机器人基础设置:运动、相机、攻击与生命值
  19. 聊聊数据治理与成本管理
  20. Google的图片处理库和条码处理库、汉字转拼音库

热门文章

  1. php7.0扩展yac,PHP扩展YAC安装过程
  2. 爬虫获取车质网的投诉信息
  3. 精确度,准确度,精密度关系
  4. 关于创新的两个谎言和一个真理
  5. android拍照图片如何存储空间不足,手机照相显示内存不足怎么办 解决方法【详解】...
  6. 软件测试之BUG处理流程
  7. SWOT基础与个人SWOT分析
  8. 安全帽佩戴识别系统介绍
  9. 学习一个月web开发的成果,服务器C++,数据库postgresql简易的知识分享平台
  10. css如何让图片自然布满盒子且不出现变形