Faster R-CNN 论文笔记
论文地址:https://arxiv.org/abs/1506.01497
Fast R-CNN提出后,降低目标检测时间的主要瓶颈就来到了待选区域的计算上,于是诞生了Faster R-CNN。作者提出了一种新的网络结构,即RPN,其作用为通过一系列卷积网络来得到待选区域,因此Faster R-CNN其实可以看作是RPN + Fast R-CNN的组合。另外这里还将RPN中部分卷积层与产生feature maps的卷积层合用。网络结构如下:
图1 Faster R-CNN网络结构
以上Faster R-CNN的基本结构,这里将它分为4个部分:
1. Conv layers。通过vgg16或者resnet,得到feature maps。
2. RPN。将步骤1中的feature maps通过一个卷积层和一个全连接层(实际上为卷积核为1*1的卷积层)得到待选区域4k,和分类值2k,通过计算出roi筛选出部分待选区域(rois)供后续目标检测使用。
3. ROI Pooling。输入步骤1中得到的feature maps和RPN中得到的rois,将rois对应feature maps中的区域通过ROI Pooling得到固定尺寸的图形。
4. 将步骤3中得到的固定尺寸图形通过全连接层得到预测classification结果和预测bounding box结果,计算loss。
RPN的具体结构如下:
图2 RPN的网络结构
由图2可知,RPN先对feature map进行卷积核为3*3大小的卷积,得到512维(vgg处理中为512维而不是这里的256)新的特征图,然后再为新特征图的每一个像素点设置k(论文中为9,即为3种scale和3中aspect ration的乘积)个可能区域,所以2k个cls值即为在某特定scale和aspect ratio情况下对应的区域中,图像为目标的概率和其为背景的概率(2*k);4k个reg值即为在某特定scale和aspect ratio情况下对应区域的中心点坐标x、y和高宽h、w(4*k)。
转载于:https://www.cnblogs.com/ylwn/p/10987479.html
Faster R-CNN 论文笔记相关推荐
- Faster R CNN
Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...
- YOLOv2/YOLO9000 《YOLO9000: Better, Faster, Stronger》论文笔记
本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.
- Deep Learning论文笔记之(五)CNN卷积神经网络代码理解
Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但 ...
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- 行为识别论文笔记|I3D S3D R(2+1)D P3D CSN
行为识别论文笔记-I3D T3D S3D R(2+1)D P3D CSN I3D Carreira, Joao, and Andrew Zisserman. "Quo vadis, acti ...
- 论文笔记--DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
论文笔记--DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter 1. 文章简介 2. 文章概括 ...
- 【论文笔记 2】CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET
[论文笔记 2]CNN经典入门STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET 1. 综述 对现代的CNN网络结构进行了简要说明,一般的网络都是由卷 ...
- 经验 | 深度学习中从基础综述、论文笔记到工程经验、训练技巧
点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:本文授权转自知乎作者跑者小越,https://zhuanla ...
- 3d object是什么文件_[单目3D目标检测论文笔记] 3D Bounding Box Estimation
本文是3D Bounding Box Estimation Using Deep Learning and Geometry的论文笔记及个人理解.这篇文章是单目图像3d目标检测的一个经典工作之一.其目 ...
- 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...
最新文章
- 玩转spring boot——结合redis
- c语言连接mysql(入门)_MySQL入门之C语言操作MySQL
- 项目开发日志:Build AssetBundle——SpriteAtlas(已解惑)
- 厦门信息集团与EMC战略合作共建智慧厦门
- 转载 :配置ssh密钥认证自动登录
- 透露一个未来3到5年的巨大商机
- cmake使用教程(四)调用外部共享库和头文件
- ASP.NET会话(Session)模式
- Makefile的学习笔记
- PhpStorm Live Template加PHP短语法Short Open Tags打造原生模板
- 游戏窗口化工具_仙剑奇侠传16珍藏版大合集(含各个版本和工具)
- 物联网技术体系的介绍
- activex控件无法安装解决方法
- 添加Nginx ALG模块支持FTP协议ALG
- 使用python计算三角形面积
- 决策树ID3简单实现
- PHP7 搭建简易的学生管理系统(四)
- 碱性干电池的内阻测试方法_碱性锌锰干电池电极反应式 锌锰干电池原理是什么【详细介绍】...
- Ubuntu16.04下配置nginx + RTMP流媒体服务器
- Cocos Creator 一步一步实现重力球游戏
热门文章
- mysql ---- 多表查询
- java回收内存_JAVA之内存回收
- springboot线程池配置
- AMQP Connection 127.0.0.1:5672] ERROR [o.s.a.rabbit.connection.CachingConnectionFactory] CachingConn
- Vue 字符串转JSON
- css怎样使鼠标移到div上显示手型
- c语言 __FILE__,__DATE__,__TIME__ (宏)
- 人工智能为失散家人寻找“回家路”
- 突然发现一个很好用Golang的json库
- 【Eclipse】Eclipse中tomcat的Server配置(解决修改代码不断的重启服务器)以及设置tomcat文件发布位置与JSP编译位置查看...