论文地址:https://openaccess.thecvf.com/content/ICCV2021/html/Choi_Active_Learning_for_Deep_Object_Detection_via_Probabilistic_Modeling_ICCV_2021_paper.html
代码:https://github.com/NVlabs/AL-MDN
发表于:ICCV 21

Abstract

主动学习的目的是通过在数据集上只选择信息量最大的样本来降低标注成本。现有的工作很少有涉及目标检测的主动学习。这些方法大多是基于多个模型,或者是分类方法的直接扩展,因此只用分类头来估计图像的信息量。在本文中,我们提出了一种新的用于目标检测的深度主动学习方法。我们的方法依赖于混合密度网络,为每个定位和分类头的输出估计一个概率分布。我们在单个模型的单个前向传递中明确地估计出了偶然(aleatoric)和认知(epistemic)的不确定性。我们的方法使用一个评分函数,将两个头的这两种不确定性汇总起来,以获得每个图像的信息量分数。我们在PASCAL VOC和MS-COCO数据集中证明了我们方法的有效性。我们的方法优于基于单模型的方法,并与基于多模型的方法性能相当,而计算成本却很低。

I. Introduction

本文算是少数的为目标检测模型专门定制的主动学习方法。事实上,现有的宣称能够应用于目标检测的主动学习分类方法基本都没有开源的。而从创新点出发,本文的亮点在于对传统的不确定性概念进行了解耦,分为了两部分:

  • 偶然不确定性:即模型本身对样本的不确定程度。也就是说,如
    果模型对当前样本的预测结果的置信度较低,则该样本的偶然不确定性较高。
  • 认知不确定性:即当前样本与训练集已有样本的差异。也就是说,如果该样本的特征与已标注集已有样本特征空间之间的差异较大,则认知不确定性较高。

容易发现,这两种不确定性单独拿出来做的话相当于两种主流的解决思路,与任务无关的方法大多基于偶然不确定性,而依赖任务模型的方法则大多基于认知不确定性。本文的特点是这两种思路同时给用上了。而关于这两种不确定性的求解,则都是通过"概率建模"来实现的。

II. Method

本文算是少数的单独为目标检测设计的主动学习算法。在之前,一般都是设计一个用于分类的算法,然后再将其拓展到目标检测中(即,应用到目标检测模型的classification head上)。那么为什么很少有人做这种原生的方法呢?因为对于localization head而言,本质上给的是一个固定的框(x,y,w,h),那么就不太好去从这个固定输出中推导不确定性之类的东西。如果要推导,那大概率得用到基于ensemble思想的方法,即训练多个有略微差异的模型,通过比较输出结果之间的差异大小来计算不确定性。但是这一方法的训练成本巨大。相比之下,classification head不存在这一问题,虽然本质上预测也是个定值,但仍可以通过观察softmax层的输出来简单计算不确定性。

那么有没有更简单的方法来估算localization head的不确定性呢?这就涉及到了本文的核心创新点,即标题中的Probabilistic Modeling。这个所谓的概率建模是通过一个插件——混合密度网络(Mixture Density Network, MDN)来实现的。对于一般的网络而言,输入一个x,输出的是确定值y,通过y再推导不确定性是一个间接的过程。而对于MDN,输入一个x,输出的是一个混合高斯分布,而最终的y是从该分布中采样得到的。也就是说,通过观察分布的均值、方差等特征,便可以直接进行不确定性求解。实际上,本文的偶然不确定性与认知不确定性都是从该分布中启发式地推导而来的。

[论文阅读] Active Learning for Deep Object Detection via Probabilistic Modeling相关推荐

  1. 论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio

    论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio ...

  2. 小目标检测论文笔记:Learning Calibrated-Guidance for Object Detection in Aerial Images

    论文 Learning Calibrated-Guidance for Object Detection in Aerial Images paper:https://arxiv.org/abs/21 ...

  3. 【视频目标检测论文阅读笔记】Optimizing Video Object Detection via a Scale-Time Lattice

    1.1 论文信息 标题 Optimizing Video Object Detection via a Scale-Time Lattice 会议 CVPR 2018 原文链接 Optimizing ...

  4. 【论文阅读】Oriented R-CNN for Object Detection

    原文链接:https://arxiv.org/abs/2108.05699 原文代码:GitHub - jbwang1997/OBBDetection: OBBDetection is an orie ...

  5. [论文阅读] Disentangled High Quality Salient Object Detection

    论文地址:https://arxiv.org/abs/2108.03551 代码:https://github.com/luckybird1994/HQSOD 发表于:ICCV'21 Abstract ...

  6. [论文阅读] Unsupervised Domain Adaptive Salient Object Detection Through Uncertainty-Aware Pseudo-Label

    论文地址:https://arxiv.org/abs/2202.13170 代码:https://github.com/Kinpzz/UDASOD-UPL 发表于:AAAI 22 Abstract 深 ...

  7. [论文阅读] Structure-Consistent Weakly Supervised Salient Object Detection with Local Saliency Coherence

    论文地址:https://ojs.aaai.org/index.php/AAAI/article/view/16434 代码:http://github.com/siyueyu/SCWSSOD 发表于 ...

  8. 【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测,可学习变换,时间序列,表格数据

    本博客系博主阅读论文之后根据自己理解所写,非逐字逐句翻译,预知详情,请参阅论文原文. 论文标题:Neural Transformation Learning for Deep Anomaly Dete ...

  9. Deep Learning for Generic Object Detection: A Survey -- 目标检测综述总结

      最近,中国国防科技大学.芬兰奥卢大学.澳大利亚悉尼大学.中国香港中文大学和加拿大滑铁卢大学等人推出一篇最新目标检测综述,详细阐述了当前目标检测最新成就和关键技术.文章最后总结了未来8个比较有前景的 ...

最新文章

  1. WiseCloud成为全球首批Kubernetes官方认证平台产品-CNCF官方发布
  2. 傅里叶变换函数FFT的使用方法
  3. lnmp1.7安装环境后mysql无法启动的解决
  4. sqlite3_colum
  5. 如何创建圆角 UITextField 与内阴影
  6. Just $h$-index HDU - 6278(主席树找区间大于等于k的个数)
  7. 利用MyBatis Generator自动创建代码
  8. Android 自定义Dialog 去除阴影
  9. 分数的全面解析式与在C语言中应用分数计算
  10. LOADRUNNER居于HTTP协议函数使用
  11. Vue_(组件)计算属性
  12. c语言中函数的递归调用,用C语言函数调用与递归解决问题
  13. hbase java 建表_Java在HBase数据库创建表
  14. 软件工程大学生职业生涯规划_我的大学生职业生涯规划书(软件工程专业的职业生涯规划书)...
  15. ps显示计算机内存不足怎么办,PS常见问题——内存不足,解决办法!
  16. android恢复短信中心号码,短信中心号码设置解决安卓手机不能发短信问题,教你设置解决异地发不了短信问题...
  17. 鸿蒙开发起步系列 | 环境搭建、HarmonyOS应用开发及智能硬件开发
  18. hdoj 开门人和关门人
  19. HDU 5242 上海大都会 G题
  20. 淘宝开店须知——新手卖家最基础的运营思路

热门文章

  1. linux telnet 127.0.0.1 不通,Linux 出现telnet: 127.0.0.1: Connection refused错误解决办法
  2. 一则故事表达:并发,并行,同步,异步,线程,多线程
  3. python列表解析,生成表达式(一分钟读懂)
  4. python黑色背景白色背景_用Python去除图像的黑色或白色背景实例
  5. 利用GitHub搭建一个酷炫免费的个人博客
  6. LeetCode 1116. 打印零与奇偶数
  7. 如何MATLAB中将一个向量或者矩阵强行转换为列向量
  8. pip 安装 tensoflow
  9. CPU中的Little Endian与Big Endian
  10. 语义分割之评价指标MIoU介绍