论文阅读一《Region Proposal by Guided Anchoring》
一、anchor机制
anchor是目标检测中非常重要的一种预设框机制,在卷积层出来的feature map上,使用一组预定义的比例尺和纵横比在空间域上均匀采样锚点,一般情况下,一个锚点就是该feature map上的一个像素点,在该锚点上,可以得到以该锚点为中心的,长宽比不同,的k个anchor(box),作为预设框,目标框是在该预设框的基础上,做中心位置的偏移,以及尺寸的缩放得到的,偏移值和缩放值就是网络要预测的值。
二、现存的anchor机制的问题(论文提出的)
- 论文认为:设置固定的anchor尺寸和比例,效率不高,而且为了得到很高的召回率,需要设置大量的anchor的尺寸来捕获目标,但其实,这些大量的achor box中,真正能为检测到目标做贡献的,不多。
- 我的思考:就是,训练之前,怎么为一个检测场景设置更贴合的anchor?就是怎么判断anchor设置的好不好?这里有个思路(之前没有试过,以后有机会可以试一试):1)、将某层feature上的anchor框在输入图片(网络输入,例如512x512)上重现;2)、gt 重现到输入图片上;3)、计算所有gt和所有anchor的iou矩阵;4)、分析iou矩阵,可以发现,anchor设置的不合理,导致anchor不覆盖所有的gt,即有些gt不能和所有的anchor匹配上。
三、针对问题,论文提出的解决方案
论文的思路是,将固定的shape和scale变成可变的shape和scale。分为两步:首先判断一个子区域是否含有目标,然后再该子区域内决定目标的shapes。
Anchor Location Prediction Net
特征图F从卷积层出来之后,一个分支进入anchor预测网络,该网络生成一个概率图p,大小和F一样,概率图上p(i,j)表示,在输入图片上,以((i + 0.5)*s, (j + 0.5)*s)为中心,s是stride,存在一个目标的概率。通过这个网络,可以过滤到90%的无用的区域,并且保证相同的召回率。Anchor Shape Prediction Net
该网络负责预测宽w和高h的值,直接预测不可能,因为这两个值不稳定,因此使用下面的转换公式进行预测:
该公式将预测范围从[0,1000]转换为[-1,1]
四、代码解刨
mmdetection 中加入了Guided Anchoring的代码,该部分是通过解读代码,深挖论文的细节。
未完待续!!!
论文阅读一《Region Proposal by Guided Anchoring》相关推荐
- 【论文阅读】Region Proposal by Guided Anchoring
论文地址:https://arxiv.org/abs/1901.03278v2 代码地址: mmdetection (https://github.com/open-mmlab/mmdetection ...
- 【论文阅读】GA-RPN:Region Proposal by Guided Anchoring
论文名称:Region Proposal by Guided Anchoring 作者: Jiaqi Wang \ Kai Chen \ Shuo Yang \ Chen Change Loy \ D ...
- 【目标检测系列:十】Anchor Free | GARPN | Region Proposal by Guided Anchoring
CVPR 2019 商汤 Region Proposal by Guided Anchoring https://github.com/open-mmlab/mmdetection DCN ancho ...
- (九)论文阅读 | 目标检测之GA
简介 图1:论文原文 论文是发表在 C V P R 2019 {\rm CVPR\ 2019} CVPR 2019上的一篇关于目标检测的论文.论文的主题是 G u i d e d A n c h o ...
- 单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15
单目深度估计 问题公式化:求非线性映射函数 一.数据集: NYU Depth:视频序列和dense depth map通过RGB-D采集的,但是不是每一种图像都有深度图,因为映射是离散的. KITTI ...
- 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》
深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...
- 论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection
论文阅读:Saliency-Guided Region Proposal Network for CNN Based Object Detection (1)Author (2)Abstract (3 ...
- (论文阅读)NMS by Representative Region: Towards Crowded Pedestrian Detection by Proposal Pairing
2020CVPR的密集行人检测论文 原文链接: NMS by Representative Region: Towards Crowded Pedestrian De ...
- High Performance Visual Tracking with Siamese Region Proposal Network 论文学习
文章目录 论文阅读总结 Translation Abstract 1 Introduction 2 Related Works 2.1 Trackers based on Siamese networ ...
- character-level OCR之Character Region Awareness for Text Detection(CRAFT) 论文阅读
Character Region Awareness for Text Detection 论文阅读 论文地址(arXiv) ,pytorch版本代码地址 最近在看一些OCR的问题,CRAFT是在场景 ...
最新文章
- mysql之 mysql 5.6不停机主主搭建(活跃双主基于日志点复制)
- 数据库安全性相关知识笔记​
- mvn linux,Linux安装Maven
- tensorflow中同时两个损失函数_深度度量学习中的损失函数
- unity 如何获取到屏幕中间_请问如何获得场景的中心点在屏幕上的坐标?
- php+memcached缓存技术实例
- Linux中hosts文件的修改
- excel2010服务器打开闪退
- android 全屏时钟,手机全屏数字时钟软件
- 网站如何统计访问人数?51LA如何安装使用?
- 实现自动化测试,首先不是一个技术问题
- 监控服务架构组成详解和实现监控方法
- x41t下使用工行华虹u盾
- 致远项目管理SPM系统之项目立项审批
- 武汉新时标文化传媒有限公司“土味”下的视频平权化
- Codeforces Round #801 (Div. 2) D2(思维/dfs)
- 让opencv输出人脸检测的得分(置信率),找出一些和脸比较像但是不是脸的负样本
- netcore部署docker,在图片处理时有乱码或者The type initializer for ‘Gdip‘ throw an exception异常
- python的项目骨架_练习 46 - 一个项目骨架 - Learn Python 3 The Hard Way
- 如何建立自己的技术壁垒
热门文章
- html验证座机号码_JS校验手机号 座机 邮箱 微信号
- 网页QQ客服聊天功能
- CF 1056D Decorate Apple Tree
- html中style写啥,style标签的作用
- [BZOJ3993] [SDOI2015]星际战争(最大流+二分)
- 屏幕刷新频率怎么更改?
- Chat Top10 | 实战:参考牛顿冷却定律优化最热问题的排序
- Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynamic Thresholding
- 第一届全国区块链和分布式记账技术标准化技术委员会 委员名单
- iPhone6 6p 7 7p屏幕适配,切图准则