一、anchor机制
       anchor是目标检测中非常重要的一种预设框机制,在卷积层出来的feature map上,使用一组预定义的比例尺和纵横比在空间域上均匀采样锚点,一般情况下,一个锚点就是该feature map上的一个像素点,在该锚点上,可以得到以该锚点为中心的,长宽比不同,的k个anchor(box),作为预设框,目标框是在该预设框的基础上,做中心位置的偏移,以及尺寸的缩放得到的,偏移值和缩放值就是网络要预测的值。

二、现存的anchor机制的问题(论文提出的)

  • 论文认为:设置固定的anchor尺寸和比例,效率不高,而且为了得到很高的召回率,需要设置大量的anchor的尺寸来捕获目标,但其实,这些大量的achor box中,真正能为检测到目标做贡献的,不多。
  • 我的思考:就是,训练之前,怎么为一个检测场景设置更贴合的anchor?就是怎么判断anchor设置的好不好?这里有个思路(之前没有试过,以后有机会可以试一试):1)、将某层feature上的anchor框在输入图片(网络输入,例如512x512)上重现;2)、gt 重现到输入图片上;3)、计算所有gt和所有anchor的iou矩阵;4)、分析iou矩阵,可以发现,anchor设置的不合理,导致anchor不覆盖所有的gt,即有些gt不能和所有的anchor匹配上。

三、针对问题,论文提出的解决方案
      论文的思路是,将固定的shape和scale变成可变的shape和scale。分为两步:首先判断一个子区域是否含有目标,然后再该子区域内决定目标的shapes。
      

  • Anchor Location Prediction Net
    特征图F从卷积层出来之后,一个分支进入anchor预测网络,该网络生成一个概率图p,大小和F一样,概率图上p(i,j)表示,在输入图片上,以((i + 0.5)*s, (j + 0.5)*s)为中心,s是stride,存在一个目标的概率。通过这个网络,可以过滤到90%的无用的区域,并且保证相同的召回率。

  • Anchor Shape Prediction Net
    该网络负责预测宽w和高h的值,直接预测不可能,因为这两个值不稳定,因此使用下面的转换公式进行预测:

    该公式将预测范围从[0,1000]转换为[-1,1]

四、代码解刨
mmdetection 中加入了Guided Anchoring的代码,该部分是通过解读代码,深挖论文的细节。
未完待续!!!

论文阅读一《Region Proposal by Guided Anchoring》相关推荐

  1. 【论文阅读】Region Proposal by Guided Anchoring

    论文地址:https://arxiv.org/abs/1901.03278v2 代码地址: mmdetection (https://github.com/open-mmlab/mmdetection ...

  2. 【论文阅读】GA-RPN:Region Proposal by Guided Anchoring

    论文名称:Region Proposal by Guided Anchoring 作者: Jiaqi Wang \ Kai Chen \ Shuo Yang \ Chen Change Loy \ D ...

  3. 【目标检测系列:十】Anchor Free | GARPN | Region Proposal by Guided Anchoring

    CVPR 2019 商汤 Region Proposal by Guided Anchoring https://github.com/open-mmlab/mmdetection DCN ancho ...

  4. (九)论文阅读 | 目标检测之GA

    简介 图1:论文原文 论文是发表在 C V P R 2019 {\rm CVPR\ 2019} CVPR 2019上的一篇关于目标检测的论文.论文的主题是 G u i d e d A n c h o ...

  5. 单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15

    单目深度估计 问题公式化:求非线性映射函数 一.数据集: NYU Depth:视频序列和dense depth map通过RGB-D采集的,但是不是每一种图像都有深度图,因为映射是离散的. KITTI ...

  6. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  7. 论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection

    论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection (1)Author (2)Abstract (3 ...

  8. (论文阅读)NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing

    2020CVPR的密集行人检测论文      原文链接:             NMS by Representative Region: Towards Crowded Pedestrian De ...

  9. High Performance Visual Tracking with Siamese Region Proposal Network 论文学习

    文章目录 论文阅读总结 Translation Abstract 1 Introduction 2 Related Works 2.1 Trackers based on Siamese networ ...

  10. character-level OCR之Character Region Awareness for Text Detection(CRAFT) 论文阅读

    Character Region Awareness for Text Detection 论文阅读 论文地址(arXiv) ,pytorch版本代码地址 最近在看一些OCR的问题,CRAFT是在场景 ...

最新文章

  1. mysql之 mysql 5.6不停机主主搭建(活跃双主基于日志点复制)
  2. 数据库安全性相关知识笔记​
  3. mvn linux,Linux安装Maven
  4. tensorflow中同时两个损失函数_深度度量学习中的损失函数
  5. unity 如何获取到屏幕中间_请问如何获得场景的中心点在屏幕上的坐标?
  6. php+memcached缓存技术实例
  7. Linux中hosts文件的修改
  8. excel2010服务器打开闪退
  9. android 全屏时钟,手机全屏数字时钟软件
  10. 网站如何统计访问人数?51LA如何安装使用?
  11. 实现自动化测试,首先不是一个技术问题
  12. 监控服务架构组成详解和实现监控方法
  13. x41t下使用工行华虹u盾
  14. 致远项目管理SPM系统之项目立项审批
  15. 武汉新时标文化传媒有限公司“土味”下的视频平权化
  16. Codeforces Round #801 (Div. 2) D2(思维/dfs)
  17. 让opencv输出人脸检测的得分(置信率),找出一些和脸比较像但是不是脸的负样本
  18. netcore部署docker,在图片处理时有乱码或者The type initializer for ‘Gdip‘ throw an exception异常
  19. python的项目骨架_练习 46 - 一个项目骨架 - Learn Python 3 The Hard Way
  20. 如何建立自己的技术壁垒

热门文章

  1. html验证座机号码_JS校验手机号 座机 邮箱 微信号
  2. 网页QQ客服聊天功能
  3. CF 1056D Decorate Apple Tree
  4. html中style写啥,style标签的作用
  5. [BZOJ3993] [SDOI2015]星际战争(最大流+二分)
  6. 屏幕刷新频率怎么更改?
  7. Chat Top10 | 实战:参考牛顿冷却定律优化最热问题的排序
  8. Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding
  9. 第一届全国区块链和分布式记账技术标准化技术委员会 委员名单
  10. iPhone6 6p 7 7p屏幕适配,切图准则