基本流程

  1. 图像输入网络得到特征图
  2. 使用RPN生成候选框,将候选框投影到特征图获得特征矩阵
  3. 对特征矩阵使用ROI pooling得到特征图并展平,得到预测结果

重点解析

RPN在网络中的位置


在上图中,从feature map层来看,有两个指向上层的箭头,其中左侧指向Region Proposal Network的即为RPN结构,右侧指向Roi pooling与fast rcnn保持一致。

RPN结构


在feature map上使用3∗33*33∗3滑动窗口,每一个位置得到一个256维向量(不唯一,此处backbone输出的深度为256),然后经过全连接层,得到分类的2k个分数(对应右侧指向的k个anchor,每个anchor两个参数描述前景概率与后景概率),与位置框回归的4k个参数。

特征图的anchor与原图的对应关系
由原图与特征图的放缩比例系数,可计算出特征图的anchor中心对应在原图的坐标,然后在原图上生成一系列指定大小的anchor。
在原图上的anchor,每个位置有9个不同大小,三种面积{128∗128128*128128∗128,256∗256256*256256∗256,512∗512512*512512∗512},三种长宽比例{1:11:11:1,1:21:21:2,2:12:12:1}

2k参数(每两个一组,表示(前景概率,后景概率)):

( 0.2 0.8) (0.7 0.3) (0.4 0.6) (0.9 0.1)

4k参数(每四个一组,表示第k个anchor的预测回归(dxk,dyk,dwk,dhkd_x^k,d_y^k,d_w^k,d_h^kdxk​,dyk​,dwk​,dhk​)):

( 0.12 0.21 0.74 0.33) (0.54 0.16 0.09 0.21)

RPN损失函数

由分类损失与边界框的损失组成

其中
pip_ipi​是第i个anchor预测为真实标签的概率
pi∗p_i^*pi∗​正样本为1,负样本为0
tit_iti​是预测第i个anchor的边界框的参数
ti∗t_i^*ti∗​是真实框的参数
NclsN_{cls}Ncls​是一个batch中的样本数量
NregN_{reg}Nreg​是anchor位置个数

Faster R-CNN训练


论文中采取RPN Loss + Fast R-CNN Loss联合训练方法

  1. 使用预训练分类模型初始化卷积网络参数(即上图中的CNN层),单独训练RPN网络(上图左侧箭头部分)
  2. 固定RPN网络的卷积层与全连接层参数,并使用RPN网络生成的目标框训练Fast RCNN网络(上图右侧箭头部分)
  3. 固定训练好的Fast RCNN网络参数,微调RPN网络参数
  4. 固定RPN网络的卷积层与全连接层参数,微调Fast RCNN网络参数(Roi pooling层及以后)

目标检测之Faster RCNN分析相关推荐

  1. 卷积神经网络——目标检测之Faster R-CNN论文翻译

    论文连接 https://arxiv.org/abs/1506.01497 相关论文翻译链接 R-CNN:https://blog.csdn.net/itlilyer/article/details/ ...

  2. 目标检测算法Faster R-CNN简介

    在博文https://blog.csdn.net/fengbingchun/article/details/87091740 中对Fast R-CNN进行了简单介绍,这里在Fast R-CNN的基础上 ...

  3. 用于目标检测的Faster R-CNN算法的实际实现

    Introduction 您使用哪种算法进行对象检测任务? 为了在最短的时间内构建最精确的模型,我尝试了其中的一些. 这个跨越多个黑客马拉松和现实世界数据集的旅程通常总是让我进入R-CNN系列算法. ...

  4. 目标检测算法Faster R-CNN论文解读

    论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 论文地址:https://arx ...

  5. 目标检测算法——Faster R-CNN

    文章目录 1.Faster R-CNN简介 2.基本概念扩展 1)ZFNet 2)感受野 3.RPN结构 1)sliding window 2)anchors 4.Faster R-CNN正负样本 5 ...

  6. 【目标检测】Faster RCNN算法详解

    转载自:http://blog.csdn.net/shenxiaolu1984/article/details/51152614 Ren, Shaoqing, et al. "Faster ...

  7. 【目标检测】Faster R-CNN的复现

    文章目录 Faster Rcnn 0. 利用Git下载Code 1. 数据准备 2. 模型加载 3. 模型训练 4. 模型测试 5. 运行demo.py 6. 训练自定义Images文件和对应XML文 ...

  8. (目标检测)Faster R-CNN 论文解读+复现

    Faster R-CNN xyang 声明:本篇文章借用了他人理解,如有侵权,请联系,另如需转载,请注明出处 关于最新最全的目标检测论文,可以查看awesome-object-detection &l ...

  9. 目标检测simple Faster R-CNN训练自己的数据集

    一.复现 刚开始接触目标检测,自己动手复现的第一个开源项目是github上chenyuntc的simple faster rcnn.历经千辛万苦最后貌似因为服务器显卡内存不够,在训练时一直出现一个错误 ...

  10. 目标检测相关 Faster RCNN yolo SSD

    一文读懂Faster RCNN https://zhuanlan.zhihu.com/p/31426458 1.Conv layers.作为一种CNN网络目标检测方法,Faster RCNN首先使用一 ...

最新文章

  1. iOS中KVO模式的解析与应用
  2. 在时间关系数据上AutoML:一个新的前沿
  3. eos和以太坊有什么关系_比特币、以太坊、柚子三者的关系
  4. 计算机社团发展目标,计算机社团工作计划
  5. 数组|leetcode27.移除元素
  6. python 读取excel表格_python 对Excel表格的读取
  7. Android 系统(255)---dump解码所得图片方法
  8. Unique Binary Search Trees,Unique Binary Search Trees2 生成二叉排序树
  9. python数据分析 制图_Python与开源GIS:数据处理、空间分析与地图制图
  10. 算法设计与分析第五章习题解答与学习指导(第2版)屈婉婷 刘田 张立昂 王捍贫编著 清华大学出版社
  11. 淘宝 直通车 _h python源码
  12. 阿里云智能接入网关体验
  13. 每日新闻:抖音杀入小程序战场;懂车帝发布SaaS系统 ; 汉得开源其企业级PaaS平台;甲骨文推出“第二代云” 向AWS发起挑战...
  14. 常见状态码(200、403、404、500)
  15. 08 | QPaint绘图类
  16. *7-2 CCF 2015-09-2 日期计算
  17. opengles绘制天空盒
  18. 【实例】使用 PHPExcel 读取excel 文件
  19. 13.Django shell与创建数据
  20. 利用matlab工具箱的pid参数科学整定方法

热门文章

  1. Enscape for SketchUp 室外日夜景照明设置技巧
  2. mysql的填充因子_聚集索引和填充因子fill factor的设置,减少死锁 | 学步园
  3. 【CodeForces 767C】Garland (树形DP)
  4. 欢迎使用CSDN-markdown编辑器恢复看电视剧弗兰克的说法
  5. php文章下一页,php实现文章上一页下一页的实例
  6. python写鼠标宏_win操作(1)-键盘鼠标输入
  7. html a标签鼠标聚焦,html怎么实现鼠标悬停提示A标签内容
  8. width 与 height
  9. Codeforces Gym 100015B Ball Painting 找规律
  10. c#窗体应用程序链接本地html网页,使用C# Winform应用程序获取网页源文件的解决方法...