毕设日志——Fast RCNN
https://blog.csdn.net/shenxiaolu1984/article/details/51036677
同样使用最大规模的网络,Fast RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间。
Fast RCNN方法解决了RCNN方法三个问题:
- 问题一:测试时速度慢
RCNN一张图像内候选框之间大量重叠,提取特征操作冗余。
本文将整张图像归一化后直接送入深度网络。在邻接时,才加入候选框信息,在末尾的少数几层处理每个候选框。
- 问题二:训练时速度慢
原因同上。
在训练时,本文先将一张图像送入网络,紧接着送入从这幅图像上提取出的候选区域。这些候选区域的前几层特征不需要再重复计算。
- 问题三:训练所需空间大
RCNN中独立的分类器和回归器需要大量特征作为训练样本。
本文把类别判断和位置精调统一用深度网络实现,不再需要额外存储。
特征提取网络
基本结构
图像归一化为224×224直接送入网络。
前五阶段是基础的conv+relu+pooling形式,在第五阶段结尾,输入P个候选区域((图像序号×1+几何位置×4)
roi_pool层的测试(forward)
roi_pool层将每个候选区域均匀分成M×N块,对每块进行max pooling。将特征图上大小不一的候选区域转变为大小统一的数据,送入下一层。
roi_pool层的训练(backward)
网络参数训练
参数初始化
在ImageNet上训练1000类分类器。结果参数作为相应层的初始化参数。 其余参数随机初始化。
分层数据
在调优训练时,每一个mini-batch中首先加入N张完整图片,而后加入从N张图片中选取的R个候选框。这R个候选框可以复用N张图片前5个阶段的网络特征。
实际选择N=2, R=128。
分类与位置调整
数据结构
第五阶段的特征输入到两个并行的全连层中(称为multi-task)。
- cls_score层用于分类,输出K+1维数组p,表示属于K类和背景的概率。
- bbox_prdict层用于调整候选区域位置,输出4*K维数组t,表示分别属于K类时,应该平移缩放的参数。
代价函数
loss_cls层评估分类代价。由真实分类u对应的概率决定:
Lcls=−logpuL_{cls}= -logp_{u}Lcls=−logpu
loss_bbox评估检测框定位代价。比较真实分类对应的预测参数tu和真实平移缩放参数为v的差别:
Lloc=∑i=14g(tiu−vi)L_{loc}= \sum_{i=1}^{4}g(t_{i}^{u}-v_{i})Lloc=∑i=14g(tiu−vi)
g为Smooth L1误差.
- 总代价为两者加权和,如果分类为背景则不考虑定位代价。
毕设日志——Fast RCNN相关推荐
- 毕设日志——Faster RCNN
https://blog.csdn.net/shenxiaolu1984/article/details/51152614 从RCNN到fast RCNN,再到本文的faster RCNN,目标检测的 ...
- R-CNN,Fast R-CNN,Faster R-CNN原理及执行与训练的实例+实现自己的目标检测(转)
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/m0_37407756/article/details/80810364 一.原理篇 R-CNN的原理 ...
- Fast R-CNN
Abstract 提出了一种基于区域卷积网络的快速目标检测方法(Fast R-CNN).Fast R-CNN基于之前的工作,使用深度卷积网络对object proposals进行有效分类.与之前的工作 ...
- Paper9:Fast RCNN
code:s available under the open-source MIT License at https://github.com/rbgirshick/ fast-rcnn. 摘要: ...
- 重温目标检测--Fast R-CNN
Fast R-CNN ICCV 2015 https://github.com/rbgirshick/fast-rcnn 本文在目标检测中起到一个承上启下的作用,从 R-CNN 经由 Fast R-C ...
- 目标检测 RCNN, SPPNet, Fast RCNN, Faster RCNN 总结
RCNN CVPR 2014 Rich feature hierarchies for accurate object detection and semantic segmentation http ...
- fast rcnn,faster rcnn使用cudann加速问题
之前在fast rcnn,faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速),编译会报错: 之所以会这样,是因为fast rcnn,faster ...
- RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础
RCNN (Regions with CNN) 目标物检测 Fast RCNN的基础 Abstract: 贡献主要有两点1:可以将卷积神经网络应用region proposal的策略,自底下上训练可以 ...
- Fast RCNN 训练自己的数据集(3训练和检测)
Fast RCNN 训练自己的数据集(3训练和检测) 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https ...
最新文章
- 关于登录记住密码使用cookie的详解
- php yii2自动给值,Yii2基于Ajax自动获取表单数据的方法
- nginx linux脚本,shell脚本之nginx自动化脚本
- XShell中浏览文件时上拉下拉
- 偷梁换柱做自己的封装系统
- JBoss EAP 7快速入门
- 官网下载旧版本的Xcode
- Windows服务器常用命令
- Flink Kafka Connector 与 Exactly Once 剖析
- 用计算机和电视机组成家庭影院,家庭影院怎么连接电脑_家庭影院连接电脑详解【图文】-太平洋IT百科...
- EasyBCD安装双硬盘的windows+Ubuntu16.04双系统,那些年我们一起踩过的那些坑
- Python读文件的三种方法对比
- 设计——免费PSD素材+设计网站+图标生成工具+自动标注
- 怎么判断一个数是奇数还是偶数?
- 第七章:OCP工具简介
- Keil MDK 安装pack包
- 深腾8800型超级计算机,深网|中国超级计算机TOP100榜单:联想曙光各39套并列第一...
- 东方博宜OJ 1231考试成绩的分布情况
- 李逵和李鬼,求求你,别在MySQL中使用UTF-8了!
- mysql可重复读_到底什么是mysql的幻读和不可重复读