Filtration and Distillation: Enhancing Region Attention for Fine-Grained Visual Categorization

文章目录

  • Filtration and Distillation: Enhancing Region Attention for Fine-Grained Visual Categorization
    • 参考
    • 背景 & 问题
    • 主体结构
      • Discriminative Regions Proposing
      • Feature Learning and Recognition Ensemble
      • Filtration Learning with Discrimination Matching
      • Distillation Learning with Knowledge Transferring
      • 总体Loss的表示
    • 实验结果

参考

  • 原文:https://sci-hub.se/10.1609/aaai.v34i07.6822

背景 & 问题

  • 问提:

    • 图像定位主要基于过滤器(filter),但是这个不能被性能指标优化
    • 现存方法将区域特征提取器的训练作为一个特别的分类任务,但是这个往往会忽视全局目标的特征
  • 解:
    • FDL = Filtration and Distillation Learning
  • 本篇论文的主要贡献:
    • 用Filtration Learning (FL)做部分区域的proposal,它基于proposing和predicting之间的区别匹配,region proposing在不需要bbox的情况下可以直接打到最佳
    • 提出Distillation Learning (DL)用于强化区域特征的学习,通过对整个对象的特征提取,区域特征的学习可以在对象区域约束下得到更好的监督
    • 更灵活,可更换backbone
    • FDL在弱监督目标定位(WSOL)中具有很强的可解释性和竞争力

主体结构

  • 模型的主体结构一目了然:

  • 首先对于Input,他会分两路走

    • 下面这路是参考了RPN的思想,即利用RPN选出目标的part,经过resize之后进行feature extractor,然后fc+softmax进行分类,分出来的类别表示是否是某一类的部分
    • 上面这路就是对整张图片进行卷积,然后把它当作teacher网络,指导下方的part卷积分类的学习
  • 最后所有部分concat在做一次总的分类得到最终结果

Discriminative Regions Proposing