《Region Proposal by Guided Anchoring》来自CVPR2019,非anchor-free时代中anchor在多数目标检测算法中都起到了重要的作用,本篇提出了一种新的anchor生成方法 ,不同于之前的固定 anchor或者根据数据集聚类anchor的方法,通过guided anchoring可以预测anchor的形状和位置得到稀疏的anchor,以及作者提出了Feature Adaption模块使得anchor和特征更加匹配。

推荐资料:作者知乎链接

本篇主要记录下在论文阅读中的个人理解供日后翻阅。

Guided Anchoring

最早的anchor使用方法比如Faster-RCNN中的RPN,将一系列形状和宽高比不同的anchor安插在feature map的每个点上,这样有两个问题:

  • 位置上:anchor是密集的,分布在图像的各个地方,但是图像中大部分区域都是不包含物体的背景,大多数的anchor并不能起到作用,因此我们期望的应该是和目标所在位置匹配的稀疏anchor
  • 形状上:anchor通常是预设好或者根据数据集聚类而来,无论是哪一种方法得到的anchor,都是固定的
    ,并不一定能完全贴合实际并且对于特殊大小和宽高比悬殊的物体检测就不够鲁棒了。

基于这些问题,作者提出了guided anchoring方法。anchor的定义由及宽高和位置坐标组成,可以写成如下的联合概率分部:

上面的式子告诉我们:

  1. anchor在不同的位置有不同的出现概率p(x,y|I),即anchor只 应当在特定的位置出现。
  2. 每个位置上anchor的宽高w,h应该和其位置有关系。

基于此,提出了下面的网络结构:

Anchor Location Target

anchor位置的预测部分应当得到的是一个和F1同样大小的probability map P(.|F1),并且在训练的时候,秉承的原则 应当是:anchor应当尽可能的和groudtruth的中心重合来获得更大的IOU,因此作者将每个groudtruth的划分成了三种类型的区域:

  • 中心区域,图中绿色部分,中心区域内的像素点均为正样本。
  • 略大于中心区域,并且抠除中心区域,,即图中黄色部分,这部分点既不是正样本也不是负样本,不参与训练。
  • 外部区域OR即排除了CR和IR以外的区域,为负样本,图中灰色部分。

同时因为我们用了FPN会产生不同大小的feature map,而不同大小的feature map理论上应当负责检测不同大小的物体,较大尺寸的feature map有着更小的感受野并且融合了底层的细粒度特征,应当负责检测更小尺寸的物体(如下图蓝框中的黑色小羊);而较小尺寸的feature map有着更大的感受野并且融合了更高层的语义信息,负责检测大尺寸的物体(如红框中的白色羊)。并且因为CR\IR\OR三种区域的数量不同,训练location的时候采用了focal loss。

Anchor Location Target

理论上如果我们想预测anchor的宽高,应当先计算出和当前groundtruth最匹配的宽高,然后可以通过smooth L1/L2这种类似的loss来监督网络学习anchor的宽和高就好了。然而这个和当前groudtruth最匹配的宽和高是很难计算的,因此作者的想法是通过IOU来监督网络学习使得IOU最大的anchor的宽和高,同时因为IOU是可导的,进行反向传播也毫无压力:

有个问题就是:在从前我们固定anchor大小的情况下,可以用与groundtruth最大IOU的那个anchor来相匹配就可以了。但是现在anchor是网络学习出来的,其大小是可变的了,我们又不可能穷举所有可能的w和h来计算和groundtruth最大IOU的anchor,因此可以采取一种近似的方式,即sample几种可能性的w和h来估计vIOU。作者sample了9对w和h来估计vIOU,并且经过实验证明网络对于具体要sample多少的(x,y),这个超参数并不敏感。

shape的loss function定义:

Feature Adaption

这一部分上面也提过,主要将anchor的形状信息融入到特征当中。RPN中的anchor采取了类似于滑窗似的方法均匀分部在整张图像中,因为anchor的分部是均匀的,可以说每个anchor都可以用同样感受野大小的feature来做检测。但是应用了guided anchoring之后,anchor的大小是可变的了,因此每个anchor对应的位置的感受野大小应当有所区别才能体现出anchor大小不同的优势。为了达到这一目的,作者采用了3x3的可变行卷积Nt,并且为了融合每个anchor的形状信息,将W x H x 2经过1 x 1的卷积得到的offsets。这样的好处是:feature 的有效范围和 anchor 形状更加接近,不同的位置可以应用不同形状的anchor了。

经作者测试,Feature Adaption可以带来接近5个点的提升:

Use of High-quality Proposals

作者发现通过anchoring guided的方式可以得到非常多高质量的proposal region,但是给检测器带来的提升效果却十分的有限。后来作者发现通过anchoring guided方式得到的proposal有两个特点:

  1. proposal中正样本的比例相比于传统方法更高
  2. proposal的IOU普遍变得更大了。

为了能更好应用如此高质量的proposal,采取了以下策略:

  • 减少RPN产生的proposal region的数量
  • 提高IOU阈值

总之想法就是,proposal的质量很高,我们有必要在数量和质量上对proposal做一个更加严格的筛选,才能更好的利用到那些更高质量的proposal。经作者尝试,这样在Faster-RCNN上能提高2.7个百分点。

【论文笔记】:Region Proposal by Guided Anchoring相关推荐

  1. 【论文阅读】Region Proposal by Guided Anchoring

    论文地址:https://arxiv.org/abs/1901.03278v2 代码地址: mmdetection (https://github.com/open-mmlab/mmdetection ...

  2. 【论文阅读】GA-RPN:Region Proposal by Guided Anchoring

    论文名称:Region Proposal by Guided Anchoring 作者: Jiaqi Wang \ Kai Chen \ Shuo Yang \ Chen Change Loy \ D ...

  3. 【目标检测系列:十】Anchor Free | GARPN | Region Proposal by Guided Anchoring

    CVPR 2019 商汤 Region Proposal by Guided Anchoring https://github.com/open-mmlab/mmdetection DCN ancho ...

  4. [深度学习论文笔记]A Tri-attention Fusion Guided Multi-modal Segmentation Network

    A Tri-attention Fusion Guided Multi-modal Segmentation Network 一种三注意力融合引导的多模态分割网络 Published: 2 Nov 2 ...

  5. NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing论文笔记

    NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing论文笔记 看论文的笔记,欢迎 ...

  6. [论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit

    [论文笔记] Line-CNN: End-to-End Traffic Line Detection With Line Proposal Unit IEEE TITS 2019 YangJian 简 ...

  7. High Performance Visual Tracking with Siamese Region Proposal Network 论文学习

    文章目录 论文阅读总结 Translation Abstract 1 Introduction 2 Related Works 2.1 Trackers based on Siamese networ ...

  8. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  9. 目标检测经典论文——Faster R-CNN论文翻译:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Net

    Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Faster R-CNN:通过Region ...

  10. 论文精读:Faster R-CNN: Towards Real-Time ObjectDetection with Region Proposal Networks

    Faster R_CNN代码实现详解参见:faster-rcnn源码详解_樱花的浪漫的博客-CSDN博客_faster rcnn源码 Faster-rcnn详细注释版源码地址:faster_rcnn源 ...

最新文章

  1. dockerfile COPY ADD 命令
  2. 编写EasyCluster V2.0 Portal主界面时的HTML心得(NOWRAP)
  3. Django之ORM(多对多)
  4. Visual Studio 2013 添加一般应用程序(.ashx)文件到SharePoint项目
  5. matlab绘制二元一次函数图像_【八上数学】 一次函数必考知识点(下)
  6. surfaceview结束后怎么处理_污泥压滤机处理后的污泥怎么处置
  7. 前端vue实现pdf文件的在线预览
  8. 函数的返回值可以不用赋值_C语言学习|函数的应用《一》
  9. 《HTML5移动应用开发入门经典》—— 1.6 编写移动网站
  10. 在C#中使用C++编写的类
  11. [工具] CuteMarkEd
  12. cupsd进程_linux pstree命令显示正在运行的进程的进程树状图
  13. 基本数据结构之Sort
  14. SPOJ KPSUM ★(数位DP)
  15. js能调用c语言吗,HTML页面,测试JS对C函数的调用
  16. Node.js详细安装教程(2021)
  17. Photoshop 2023(版本24.0)新增功能和软件下载
  18. 推荐几本英文写作的好书
  19. Echarts地图实现点击某地区跳转到指定页面
  20. mysql中explain执行结果中的rows是什么意思?

热门文章

  1. win2003 开启显示加速
  2. timus 1741. Communication Fiend URAL 解题报告 DP+读题
  3. 最新微博图片相册批量下载工具
  4. EndNote 使用教程
  5. alk In Web Security(安全世界观): Devleping a Secure Wesite
  6. 雨听 | 英语学习笔记(三)~作文范文:90后的网络生活
  7. Xcode 历史版本官方下载地址 Xcode6 Xcode7
  8. github上Android常用第三方库
  9. 编写一个JSP页面,实现根据一个人的18位身份证显示出生日的功能,要求把表达式声明和Scriptlet全部用到,并把结果显示在表格中
  10. 【软件需求工程】北理的恶龙们01——需求获取阶段准备工作