https://blog.csdn.net/shenxiaolu1984/article/details/51036677

同样使用最大规模的网络,Fast RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间。

Fast RCNN方法解决了RCNN方法三个问题:

  • 问题一:测试时速度慢

RCNN一张图像内候选框之间大量重叠,提取特征操作冗余。
本文将整张图像归一化后直接送入深度网络。在邻接时,才加入候选框信息,在末尾的少数几层处理每个候选框。

  • 问题二:训练时速度慢

原因同上。
在训练时,本文先将一张图像送入网络,紧接着送入从这幅图像上提取出的候选区域。这些候选区域的前几层特征不需要再重复计算。

  • 问题三:训练所需空间大

RCNN中独立的分类器和回归器需要大量特征作为训练样本。
本文把类别判断和位置精调统一用深度网络实现,不再需要额外存储。

特征提取网络

基本结构

图像归一化为224×224直接送入网络。

前五阶段是基础的conv+relu+pooling形式,在第五阶段结尾,输入P个候选区域((图像序号×1+几何位置×4)

roi_pool层的测试(forward)

roi_pool层将每个候选区域均匀分成M×N块,对每块进行max pooling。将特征图上大小不一的候选区域转变为大小统一的数据,送入下一层。

roi_pool层的训练(backward)

网络参数训练

参数初始化

在ImageNet上训练1000类分类器。结果参数作为相应层的初始化参数。 其余参数随机初始化。

分层数据

在调优训练时,每一个mini-batch中首先加入N张完整图片,而后加入从N张图片中选取的R个候选框。这R个候选框可以复用N张图片前5个阶段的网络特征。
实际选择N=2, R=128。

分类与位置调整

数据结构

第五阶段的特征输入到两个并行的全连层中(称为multi-task)。

  • cls_score层用于分类,输出K+1维数组p,表示属于K类和背景的概率。
  • bbox_prdict层用于调整候选区域位置,输出4*K维数组t,表示分别属于K类时,应该平移缩放的参数。

代价函数

loss_cls层评估分类代价。由真实分类u对应的概率决定:
Lcls=−logpuL_{cls}= -logp_{u}Lcls​=−logpu​
loss_bbox评估检测框定位代价。比较真实分类对应的预测参数tu和真实平移缩放参数为v的差别:
Lloc=∑i=14g(tiu−vi)L_{loc}= \sum_{i=1}^{4}g(t_{i}^{u}-v_{i})Lloc​=∑i=14​g(tiu​−vi​)
g为Smooth L1误差.

  • 总代价为两者加权和,如果分类为背景则不考虑定位代价。

毕设日志——Fast RCNN相关推荐

  1. 毕设日志——Faster RCNN

    https://blog.csdn.net/shenxiaolu1984/article/details/51152614 从RCNN到fast RCNN,再到本文的faster RCNN,目标检测的 ...

  2. R-CNN,Fast R-CNN,Faster R-CNN原理及执行与训练的实例+实现自己的目标检测(转)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/m0_37407756/article/details/80810364 一.原理篇 R-CNN的原理 ...

  3. Fast R-CNN

    Abstract 提出了一种基于区域卷积网络的快速目标检测方法(Fast R-CNN).Fast R-CNN基于之前的工作,使用深度卷积网络对object proposals进行有效分类.与之前的工作 ...

  4. Paper9:Fast RCNN

    code:s available under the open-source MIT License at https://github.com/rbgirshick/ fast-rcnn. 摘要: ...

  5. 重温目标检测--Fast R-CNN

    Fast R-CNN ICCV 2015 https://github.com/rbgirshick/fast-rcnn 本文在目标检测中起到一个承上启下的作用,从 R-CNN 经由 Fast R-C ...

  6. 目标检测 RCNN, SPPNet, Fast RCNN, Faster RCNN 总结

    RCNN CVPR 2014 Rich feature hierarchies for accurate object detection and semantic segmentation http ...

  7. fast rcnn,faster rcnn使用cudann加速问题

    之前在fast rcnn,faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速),编译会报错: 之所以会这样,是因为fast rcnn,faster ...

  8. RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础

    RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础 Abstract: 贡献主要有两点1:可以将卷积神经网络应用region proposal的策略,自底下上训练可以 ...

  9. Fast RCNN 训练自己的数据集(3训练和检测)

    Fast RCNN 训练自己的数据集(3训练和检测) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https ...

最新文章

  1. 关于登录记住密码使用cookie的详解
  2. php yii2自动给值,Yii2基于Ajax自动获取表单数据的方法
  3. nginx linux脚本,shell脚本之nginx自动化脚本
  4. XShell中浏览文件时上拉下拉
  5. 偷梁换柱做自己的封装系统
  6. JBoss EAP 7快速入门
  7. 官网下载旧版本的Xcode
  8. Windows服务器常用命令
  9. Flink Kafka Connector 与 Exactly Once 剖析
  10. 用计算机和电视机组成家庭影院,家庭影院怎么连接电脑_家庭影院连接电脑详解【图文】-太平洋IT百科...
  11. EasyBCD安装双硬盘的windows+Ubuntu16.04双系统,那些年我们一起踩过的那些坑
  12. Python读文件的三种方法对比
  13. 设计——免费PSD素材+设计网站+图标生成工具+自动标注
  14. 怎么判断一个数是奇数还是偶数?
  15. 第七章:OCP工具简介
  16. Keil MDK 安装pack包
  17. 深腾8800型超级计算机,深网|中国超级计算机TOP100榜单:联想曙光各39套并列第一...
  18. 东方博宜OJ 1231考试成绩的分布情况
  19. 李逵和李鬼,求求你,别在MySQL中使用UTF-8了!
  20. mysql可重复读_到底什么是mysql的幻读和不可重复读

热门文章

  1. Maven学习笔记5:Maven属性、profile和资源过滤
  2. swift 自定义TabBarItem
  3. Python md5 sha1 的使用
  4. php soap调用asp.net webservice
  5. SQL基础实例(学生课程系统)
  6. 性能测试之Jmeter 中 CSV 如何参数化测试数据并实现自动断言
  7. Servlet 编写过滤器
  8. Selenium API-WebDriver 属性
  9. python func函数用法_python教程:3个非常有用的内置函数
  10. python产生随机数并排序_中小学python教学案例:随机数按升序排列 输出