文章介绍:

这篇主要针对医学图像处理领域标注数据匮乏的问题,如何通过卷积神经网络(CNN)的Fine-tune和主动学习(Active Learning)来解决。使用CNN进行生物医学图像分析在最近几年得到了比较多的关注,但面临的一个问题是缺乏大量的标注数据,相比imagenet,对医学图像进行标注需要大量的专业背景知识,为了节约标注的成本和时间,这篇论文提供了一个新型的方法AIFT(Active,Incremental Fine-Tuning),把主动学习和迁移学习集成到一个框架。AIFT算法开始是直接使用一个预训练从未标注数据里找一些比较值得标注的样本,然后模型持续的加入新标注的数据,一直做微调。

AIFT方法是在CAD(计算机辅助诊断)系统的环境下使用,CAD可以生成候选集U,都是未标注数据,其中每一个候选样本(candidate)通过数据增强可以生成一系列的patches,由于这些patches来自于同一个候选样本,所以它们的标签跟该候选样本一致。

AIFT方法的主要创新点体现在如下几个方面:

  • 持续性的fine-tuning

一开始标注数据集L是空的,我们拿一个已经训练好了的CNN(比如AlexNet),让它在未标注数据集U中选b个候选集来找医生标注,这新标注的候选集将会放到标注数据集L中,来持续的增量式fine-tune那个CNN直到合格,通过实验发现,持续的fine-tuning CNN相比在原始的预训练中重复性的fine-tuning CNN,可以让数据集收敛更快。

  • 通过Active learning选择候选样本

主动学习的关键是找到一个标准来评判候选样本是否值得标注,在当前CNN中,一个候选样本生成的所有patches都应该是有差不多的预测。所以我们可以先通过这个CNN来对每个候选样本的每个patch进行预测,然后对每个候选样本,通过计算patch的熵和patch之间KL距离来衡量这个候选样本。如果熵越高,说明包含更多的信息,如果KL距离越大,说明patch间的不一致性大,所以这两个指标越高,越有可能对当前的CNN优化越大。对每个矩阵都可以生成一个包含patch的KL距离和熵的邻接矩阵R。

  • 通过少数服从多数来处理噪音

我们普遍都会使用一些自动的数据增强的方法,来提高CNN的表现,但是不可避免的给某些候选样本生成了一些难的样本,给数据集注入了一些噪音。所以为了显著的提高我们方法的鲁棒性,我们依照于当前CNN的预测,对每个候选样本只选择一部分的patch来计算熵和多样性。首先对每个候选样本的所有patch,计算平均的预测概率,如果平均概率大于0.5,我们只选择概率最高的部分patch,如果概率小于0.5,选最低的部分patch,再基于已经选择的patch,来构建得分矩阵R。

  • 预测出的结果有不同的模式

对每个候选样本进行计算所有补丁的概率分布直方图,对于概率的分布有以下几种模式:

1、patch大部分集中在0.5,不确定性很高,大多数的主动学习算法都喜欢这种候选集。

2、比a还更好,预测从0-1分布均匀,导致了更高的不确定性,因为所有的patch都是通过同一个候选集数据增强得到,他们理论上应该要有差不多的预测。这种类型的候选集有明显优化CNN模型的潜力。

3、预测分布聚集在两端,导致了更高的多样性,但是很有可能和patch的噪声有关,这是主动学习中最不喜欢的样本,因为有可能在fine-tuning的时候迷惑CNN。

4、预测分布集中在一端(0或1),包含更高的确定性,这类数据的标注优先级要降低,因为当前模型已经能够很好的预测它们了。

5、在某些补丁的预测中有更高的确定性,并且有些还和离群点有关联,这类候选集是有价值的,因为能够平滑的改善CNN的表现,尽管不能有显著的贡献,但对当前CNN模型不会有任何伤害。

应用的创新:

上述方法被应用在了结肠镜视频帧分类和肺栓塞检测上,得到了比较好的效果。前者只用了800个候选样本就达到了最好的表现,只用了5%的候选样本就代表了剩下的候选样本,因为连续的视频帧通常都差不多。后者使用了1000个样本就达到了AlexNet做Fine-tune使用2200个随机样本的效果。

该工作的主要优势包括如下几点:

1、从一个完全未标注的数据集开始,不需要初始的种子标注数据。

2、通过持续的fine-tuning而不是重复的重新训练来一步一步改善学习器。

3、通过挖掘每一个候选样本的补丁的一致性来选择值得标注的候选集。

4、自动处理噪音

5、只对每个候选集中小数量的补丁计算熵和KL距离,节约了计算。

总结下来,该工作提出的方法显著的减低标注的工作量,并且有指导的选择哪些数据需要标注,同时降低了数据增强带来的噪声影响。这个方向在医学图像处理领域有非常大的价值,相信会得到越来越多的关注。

《用于生物医学图像分析的精细调节卷积神经网络:主动性增量性》(Fine-tuning Convolutional Neural Networks for Biomedical Image Analy相关推荐

  1. CVPR2017精彩论文解读:用于生物医学图像分析的精细调节卷积神经网络

    雷锋网(公众号:雷锋网)AI科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续.下文是宜远智能的首席科学家刘凯对此次大会收录的<用于生物医学图像分析的精细调节卷积神经网络 ...

  2. 【卷积神经网络的加速】Speeding up Convolutional Neural Networks with Low Rank Expansions

    主题:[深度卷积神经网络的加速] Speeding up Convolutional Neural Networks with Low Rank Expansions 附上论文链接:上一篇中提到的低秩 ...

  3. 3D卷积“LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks”

    LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 3D卷积计算量大,消耗内存多,论文提出了修正的局部相量(ReLP ...

  4. 应用卷积神经网络CNN预测DNA-蛋白结合位点Convolutional neural network architectures for predicting DNA–protein binding

    深度学习是机器学习研究中的一个新的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本.卷积神经网络是目前应用最为广泛之一的深度学习技术,它是一种含特 ...

  5. (ICCV-2021)用于步态识别的3D局部卷积神经网络(一)

    文章目录 用于步态识别的3D局部卷积神经网络 Abstract 1. Introduction 2. Related Works 用于步态识别的3D局部卷积神经网络 论文题目:3D Local Con ...

  6. 卷积神经网络Convolutional Neural Networks深度解析I

    知识的广度来自知识的深度,学习如果不成体系那是多可怕的一件事儿,希望我们在未来的学习道路上坚守初心,不要给自己留下遗憾,以自己喜欢的方式生活,做自己喜欢做的事,宠爱自己,做一个独一无二的自己! 对于文 ...

  7. Graph Convolutional Neural Networks for Web-Scale Recommender Systems(用于Web级推荐系统的图形卷积神经网络)

    Graph Convolutional Neural Networks for Web-Scale Recommender Systems 用于Web级推荐系统的图形卷积神经网络 ABSTRACT R ...

  8. 多功能的图像超分辨模型:用于盲图像超分辨的非对称卷积神经网络

    哈工大.台湾国立清华大学与香港中文大学的研究人员联合提出用于盲图像超分辨的非对称卷积网络,该文收录于IEEE Transactions on Systems, Man, and Cybernetics ...

  9. Convolutional Neural Networks for Sentence Classification用于句子分类的卷积神经网络

    Convolutional Neural Networks for Sentence Classification 论文任务:用卷积神经网络(CNN)在预先训练好的词向量上进行句子级分类任务 论文借用 ...

最新文章

  1. NVIDIA Jarvis:一个GPU加速对话人工智能应用的框架
  2. 软件测试用python一般用来做什么-python能够做软件的自动化测试吗?
  3. [转]Shared——回调函数是什么
  4. flog和flag_FLAG:写作,英语和持续学习
  5. div.2/C. They Are Everywheretwo pointer
  6. lion.ec开源框架简介(原创)
  7. SSMS 18.0运行时闪退
  8. ChinaITLab-Linux工程师培训课程笔记5
  9. matlab 电路频率响应_频率响应法与matlab指令计算
  10. 重装系统笔记本电脑黑屏怎么办
  11. Cocos creator接 IOS 穿山甲
  12. C#语言实例源码系列-自定义ListBox背景
  13. Python每日一练——第10天:经典问题猴子吃桃
  14. 数据库---主键,候选键,超键
  15. idea 右侧的maven没有dependencies
  16. 父母亲的“智能生活”你关心过吗?
  17. 梦回校园,一个很精彩的梦(精彩做梦,今天记录1个到博客,其它都发在微信朋友圈和QQ空间了)
  18. 总结 nginx access.log 太大如何清理
  19. 微信小程序——自定义组件
  20. 菜鸟学算法——动态规划(二)

热门文章

  1. java实现多线程抢单_Java模拟多线程实现抢票代码实例
  2. gre subject计算机,终于晓得gre-subject考试难不难
  3. CSDN周赛29题解-订班服、争抢糖豆、走楼梯、打家劫舍
  4. 在AI与信息交互之间:QQ 浏览器的边界探索
  5. 教你怎么用Vulnhub来搭建环境(爸爸再也不用担心我没有靶场练习了)(增加自己的部分)
  6. 什么是区块链去中心化?
  7. Java调用ffmpeg实现视频转gif、webp动图
  8. JavaWeb购物车实现
  9. 【USACO】破碎的项链
  10. 面向对象大作业—停车场计费系统