论文地址:https://arxiv.org/abs/1506.01497

  Fast R-CNN提出后,降低目标检测时间的主要瓶颈就来到了待选区域的计算上,于是诞生了Faster R-CNN。作者提出了一种新的网络结构,即RPN,其作用为通过一系列卷积网络来得到待选区域,因此Faster R-CNN其实可以看作是RPN + Fast R-CNN的组合。另外这里还将RPN中部分卷积层与产生feature maps的卷积层合用。网络结构如下:

  

            图1 Faster R-CNN网络结构

  以上Faster R-CNN的基本结构,这里将它分为4个部分:

  1. Conv layers。通过vgg16或者resnet,得到feature maps。

  2. RPN。将步骤1中的feature maps通过一个卷积层和一个全连接层(实际上为卷积核为1*1的卷积层)得到待选区域4k,和分类值2k,通过计算出roi筛选出部分待选区域(rois)供后续目标检测使用。

  3. ROI Pooling。输入步骤1中得到的feature maps和RPN中得到的rois,将rois对应feature maps中的区域通过ROI Pooling得到固定尺寸的图形。

  4. 将步骤3中得到的固定尺寸图形通过全连接层得到预测classification结果和预测bounding box结果,计算loss。


  RPN的具体结构如下:

  

            图2 RPN的网络结构

  由图2可知,RPN先对feature map进行卷积核为3*3大小的卷积,得到512维(vgg处理中为512维而不是这里的256)新的特征图,然后再为新特征图的每一个像素点设置k(论文中为9,即为3种scale和3中aspect ration的乘积)个可能区域,所以2k个cls值即为在某特定scale和aspect ratio情况下对应的区域中,图像为目标的概率和其为背景的概率(2*k);4k个reg值即为在某特定scale和aspect ratio情况下对应区域的中心点坐标x、y和高宽h、w(4*k)。

转载于:https://www.cnblogs.com/ylwn/p/10987479.html

Faster R-CNN 论文笔记相关推荐

  1. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  2. YOLOv2/YOLO9000 《YOLO9000: Better, Faster, Stronger》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  3. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解

    Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但 ...

  4. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

  5. 行为识别论文笔记|I3D S3D R(2+1)D P3D CSN

    行为识别论文笔记-I3D T3D S3D R(2+1)D P3D CSN I3D Carreira, Joao, and Andrew Zisserman. "Quo vadis, acti ...

  6. 论文笔记--DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

    论文笔记--DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter 1. 文章简介 2. 文章概括 ...

  7. 【论文笔记 2】CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET

    [论文笔记 2]CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET 1. 综述 对现代的CNN网络结构进行了简要说明,一般的网络都是由卷 ...

  8. 经验 | 深度学习中从基础综述、论文笔记到工程经验、训练技巧

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:本文授权转自知乎作者跑者小越,https://zhuanla ...

  9. 3d object是什么文件_[单目3D目标检测论文笔记] 3D Bounding Box Estimation

    本文是3D Bounding Box Estimation Using Deep Learning and Geometry的论文笔记及个人理解.这篇文章是单目图像3d目标检测的一个经典工作之一.其目 ...

  10. 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...

最新文章

  1. 玩转spring boot——结合redis
  2. c语言连接mysql(入门)_MySQL入门之C语言操作MySQL
  3. 项目开发日志:Build AssetBundle——SpriteAtlas(已解惑)
  4. 厦门信息集团与EMC战略合作共建智慧厦门
  5. 转载 :配置ssh密钥认证自动登录
  6. 透露一个未来3到5年的巨大商机
  7. cmake使用教程(四)调用外部共享库和头文件
  8. ASP.NET会话(Session)模式
  9. Makefile的学习笔记
  10. PhpStorm Live Template加PHP短语法Short Open Tags打造原生模板
  11. 游戏窗口化工具_仙剑奇侠传16珍藏版大合集(含各个版本和工具)
  12. 物联网技术体系的介绍
  13. activex控件无法安装解决方法
  14. 添加Nginx ALG模块支持FTP协议ALG
  15. 使用python计算三角形面积
  16. 决策树ID3简单实现
  17. PHP7 搭建简易的学生管理系统(四)
  18. 碱性干电池的内阻测试方法_碱性锌锰干电池电极反应式 锌锰干电池原理是什么【详细介绍】...
  19. Ubuntu16.04下配置nginx + RTMP流媒体服务器
  20. Cocos Creator 一步一步实现重力球游戏

热门文章

  1. mysql ---- 多表查询
  2. java回收内存_JAVA之内存回收
  3. springboot线程池配置
  4. AMQP Connection 127.0.0.1:5672] ERROR [o.s.a.rabbit.connection.CachingConnectionFactory] CachingConn
  5. Vue 字符串转JSON
  6. css怎样使鼠标移到div上显示手型
  7. c语言 __FILE__,__DATE__,__TIME__ (宏)
  8. 人工智能为失散家人寻找“回家路”
  9. 突然发现一个很好用Golang的json库
  10. 【Eclipse】Eclipse中tomcat的Server配置(解决修改代码不断的重启服务器)以及设置tomcat文件发布位置与JSP编译位置查看...