Abstract

在这项工作中,我们提出了一种从一组图像中的新颖对象类别中定位常见对象的方法。 我们使用新的通用组件激活图(CCAM)解决了这个问题,其中我们将特定于类别的激活图(CAM)视为组件,以发现图像集中的通用组件。 我们证明了我们的方法可以在实验中推广到新颖的对象类别。

Introduction

在这项工作中,我们同时考虑了弱监督的对象定位和对象共定位co-localization,以针对没见过的对象类别提出一种简单而有效的通用对象定位方法。与以前的工作不同,我们的方法是无提议框的,它不需要任何对象提议框即可执行对象定位,只需要具有与[17]类似的架构的CNN模型,并预训练分类任务。我们将最后一个全连接层的输出视为输入对象的分量向量,而不是概率图的分类输出。对于一组图像,我们首先计算分量矢量的平均值,以找到组公共矢量。然后,我们从组公共向量中选取k个最大条目。最后,对于每张图像,我们计算最后一个卷积层的特征图的加权和,以获得根据前k个成分的公共成分激活图。我们在六个没见过的ImageNet类[8]上测试了我们的方法,这些类未包含在用于训练CNN分类模型的1000个类别中。我们在结果部分展示了我们方法的有效性。

Method

Class Activation Map
对于特定的对象类别,CAM指示CNN用来识别该类别重要性的区分图像区域。 给定输入图像I,我们首先将其传递通过分类网络,该网络在最后一个卷积层上使用全局平均池,然后将其用作完全连接层的特征以产生对象分类输出。 令F代表最后一个完全卷积层的特征图。 F的大小为H×W×C,其中H×W为空间大小,C为特征通道数。 我们将全连接层的权重矩阵表示为W,其中Wsc是与通道c的类别s相对应的权重,并指示通道c对于特定类别s的重要性。 然后,将类的类激活映射定义为
对于特定的类s,Ms(x,y)可以直接显示出在空间网格(h,w)处激活的重要性。


Common Component Activation Map
对于具有已知类别的给定图像,CAM可以识别与这些特定类别最相关的图像区域。 但是,这种方法无法找到没见过的对象类别的重要区域,这些类别不包含在训练数据集中。 为了生成新颖的对象的激活图,我们将全连接的层的输出视为输入图像的矢量分量,而不是分类概率图。 对于给定的N组图像,其中I = {I1,…,IN}包含一个新颖的类别对象,令矢量V = {V1,…,VN}是softmax函数的输出。 然后我们通过计算输出向量V的平均值来获得这组的公共分量:
给定向量G,我们将K(G)表示为K个最大条目的一组索引。 对于每个图像Ii,我们根据最后的K个分量计算最后一个卷积层的特征图的加权和,以获得CCAM。
为了执行定位,我们可以给定图像Ii的CCAM生成一个边界框。使用CCAM,我们可以将常见的新对象的激活图分解为语义可解释的组件,这些组件用已知的对象类别进行了预训练。 在图2中,显示了每个组件及其对应的已知对象类别特定CAM的贡献百分比。

Experiments

Generating Boxes
为了从CCAM生成边界框,我们使用与[17]类似的阈值方法来分割热图。 特别是,我们对值大于固定阈值的区域进行了细分。 与[17]相比,我们只取一个框来覆盖分割图中最大的连接分量,并包括CCAM的最大值。 在我们的实验中,我们将阈值设置为CCAM最大值的25%。 我们采用前K = 200个组件来计算CCAM。


Evaluation Metric
我们将CorLoc用作评估指标,它定义为一种方法正确定位公共对象的图像百分比。 如果共有物体的一个 ground-truth box与predicted box的交并比大于0.5,则我们将此图像算作正确定位的盒子。


Dataset
为了评估针对新颖的对象类别的方法,我们遵循[8]并在ImageNet的六个子集上测试了我们的方法,这些子集未包含在ILSVRC中。 这些看不见的物体是花栗鼠,犀牛,鼪,浣熊,耙子和轮椅。

弱监督目标检测算法论文阅读(四)Localizing Common Objects Using Common Component Activation Map相关推荐

  1. 弱监督目标检测算法论文阅读(六)Erasing Integrated Learning : A Simple yet Effective Approach for Weakly Supervised

    这是一篇CVPR2020的中山大学的一篇文章,提出了一个新颖的擦除网络. Abstract 弱监督对象定位(WSOL)旨在仅通过图像级别标签之类的弱监督来定位对象.但是,基于分类网络的可用技术的一个长 ...

  2. 弱监督目标检测算法论文阅读(五)Combinational Class Activation Maps for Weakly Supervised Object Localization

    Abstract 弱监督的对象定位最近吸引了关注,因为它旨在通过使用图像级标签来识别类标签和对象位置.先前的大多数方法都使用与最高激活源相对应的激活图.仅利用一个最高概率类别的激活图通常会偏向有限的区 ...

  3. 弱监督目标检测相关论文阅读笔记

    弱监督目标检测论文相关 1.传统目标检测 2014年之前->传统的目标检测器:VJ检测器->HOG检测器->DPM 2014年之后->基于深度学习的目标检测器: 双阶段:RCN ...

  4. keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记

    背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...

  5. AAAI 2020论文解读:商汤科技提出新弱监督目标检测框架

    来源 | Object Instance Mining for WeaklySupervised Object Detection 编辑 | Carol 出品 | AI科技大本营(ID:rgznai1 ...

  6. 造球粒径检测算法论文阅读笔记

    造球粒径检测算法论文阅读笔记 1.图像感兴趣区域的划分 2.生球区图像高斯滤波 3.生球区域与阴影区域的分割 4.对生球区域的分类标记(区分上下层球) 1.图像感兴趣区域的划分 依据光照的不同,将图像 ...

  7. 弱监督目标检测与半监督目标检测

    一.监督学习分类 根据数据集的标注情况,分为:监督学习.弱监督学习.弱半监督学习和半监督学习. 监督学习:数据集为带实例级标注的标签,包含坐标和类别信息 弱监督学习:数据集仅带有数据类别的标签,不包含 ...

  8. 基于激光雷达点云的3D目标检测算法论文总结

    作者丨eyesighting@知乎 来源丨https://zhuanlan.zhihu.com/p/508859024 编辑丨3D视觉工坊 前言  过去很多年激光雷达的车规标准和高昂价格是阻碍其量产落 ...

  9. 多尺度特征融合的目标检测算法-论文解读

    1.论文声称的创新点   论文中的创新点主要体现在网络结构的创新上,作者提出了一种基于SSD多尺度特征融合(Multi-scale Feature Fusion Single Shot Detecto ...

最新文章

  1. mysql主从脚本_shell脚本部署mysql主从
  2. ajax.filter json过滤,$.ajax()的dataFilter方法
  3. python json模块rodas方法_json模块使用总结——Python
  4. box2d 碰撞检测_(译)如何使用box2d来做碰撞检测(且仅用来做碰撞检测)
  5. vue内引入语音播报功能
  6. 怎么解决VMware“该虚拟机似乎正在使用中”问题
  7. iOS底层探索之Block(四)——Block的探索和源码分析
  8. matlab covar,delta CoVaR 系统性风险指标计算
  9. 2000元台式电脑组装配置单2021 2000元组装电脑配置清单
  10. 【C++】error: passing ‘const xxx’ as ‘this’ argument discards qualifiers
  11. MATLAB编程算矩阵,MatLab矩阵计算
  12. 【三十八】Python全栈之路--HTML
  13. 嵌入式分享合集125
  14. 最新彩色文字方格广告位代码
  15. twitter和新浪微博--比较
  16. 程序员笔记本性能需求分析--2020年--极致性价比(真香定律)
  17. htcvive怎么输入_HTC Vive如何播放视频 3种方法教你用Vive播放VR视频
  18. 2022QS世界大学学科排名,中国大陆上榜课程数仅次于美英,化学、材料、生物集中度最高 | 美通社头条...
  19. plsql和navicate有什么区别_plsql和navicat连接远程oracle(易错点)
  20. Cloudera Manager大数据管理平台介绍

热门文章

  1. 职场上不得不知的六个潜规则
  2. 那些有趣的国界线:这中国字谁写的?
  3. 第22集丨人生的智慧:通权达变的智慧
  4. 教程|使用MyEclipse中的CodeMix完成PyDev集成配置
  5. nuScenes数据集3Dbonding box
  6. 施耐德软起故障php,施耐德软启动器排除故障的具体措施和方法
  7. Atmel Studio 7新建AVR单片机工程
  8. html文件损坏,PPT文件损坏怎么修复?
  9. 你想找的Python资料这里全都有!没有你找不到!史上最全资料合集
  10. Unity3D (C#)事件分发机制的实现