fast RCN论文笔记
- 训练是一个三阶段的pipeline:fine-tunes(ConvNet)+SVM(ConvNet features)+bounding-box regressors
- SVM和BB regressors从proposal中提取出来的特征需要存到硬盘上,费时费空间
- 测试阶段从图片中提取特征耗时太多
- an image通过深度网络产生一个conv feature map
- feature map与proposal是ROI projection存在映射关系,对于每一个proposal,从feature map中通过ROI pooling layer 提取固定大小的feature vector,传入一系列的FC层产生两个分支的输出层
- 两个输出层:一个是分类的estimate概率分数,另一个是每一种类别的四个值,用于调整refine位置。((a fully connected layer and softmax over K +1 categories and category-specific bounding-box regressors)
- 最后一个max pooling layer被RoI pooling layer替换(类似SPP),这个RoI pooling layer可以与网络的第一个FC兼容
- 网络最后的全连接层与softmax(原本是1000个类)被两个姐妹分支层替代(描述上面有)
- 网络被改成采取两个输入:N个图片和R个RoI
- 离散概率分布p=(p0,p1,p2,,,,pk) over K+1categories
- BB回归:,k表示类别的索引
- single-size training:在训练阶段和测试阶段,每一张图片都以一个提前定义好的大小进行处理。(博客:直接将image设置为某种scale,直接输入网络训练,期望网络自己适应这个scale,学习尺度不变性)
- multi scale training:生成一个图像金字塔,在训练阶段,每次从一张图像的金字塔尺寸随意采样,在测试阶段,对于每一个目标proposal,图像金字塔被用尺度归一化。(不是很懂)
- U是一个u x t的矩阵包括(comprise)W的前t个left的奇异向量 U is a u × t matrix comprising the first t left-singular vectors of W
- E 是一个对角矩阵,包含W中 t个最top的singular values
- V 类似上面两个,包含右
- 哪些层需要fine-tune
- 多任务训练的作用
- 避免了多阶段的流水线训练任务
- 提高了精度,准确率
- SVM outperform softmax?
- 并非proposal的数量越多越好,甚至会slightly hurt accuracy
fast RCN论文笔记相关推荐
- 最详细的Fast RCNN论文笔记
个人博客:http://www.chenjianqu.com/ 原文链接:http://www.chenjianqu.com/show-75.html 论文:Ross Girshick.Fast R- ...
- [论文笔记] Fast Quality Driven Selection of Composite Web Services (ECOWS, 2006)
Time: 4.0 hours Jae-Ho Jang, Dong-Hoon Shin, Kyong-Ho Lee, "Fast Quality Driven Selection of Co ...
- 论文笔记 SiamMask : Fast Online Object Tracking and Segmentation: A Unifying Approach
论文连接:[1812.05050] Fast Online Object Tracking and Segmentation: A Unifying Approach 论文连接:[1812.05050 ...
- Fast R-CNN论文阅读笔记
文章目录 Fast R-CNN论文阅读笔记2015 Abstract 1. Introduction 1.1 R-CNN and SPPnet 1.2 Contributions 2.Fast R-C ...
- Fast R-CNN论文原理+目标检测笔记(二)
文章目录 Fast R-CNN 1. SPPnets 2. ROI池化层 2.1 介绍 2.2 ROI池化层原理 3. Fast R-CNN的原理 Fast R-CNN 论文摘要:This paper ...
- 论文笔记:Autoregressive Tensor Factorizationfor Spatio-temporal Predictions
0 摘要 张量因子tensor factorization分解方法在时空数据分析领域很受欢迎,因为它们能够处理多种类型的时空数据,处理缺失值,并提供计算效率高的参数估计程序. 然而,现有的张量因子分解 ...
- Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
- 论文笔记 《Selective Search for Object Recognition》
论文笔记 <Selective Search for Object Recognition> 项目网址:http://koen.me/research/selectivesearch/ 一 ...
- cnn 句向量_深度学习目标检测Fast R-CNN论文解读
前言 我们知道,R-CNN存在着以下几个问题: 分步骤进行,过程繁琐.Selective Search生成候选区域region proposal->fine tune预训练网络->针对每个 ...
最新文章
- 绘制简单的正太分布图
- 内存与存储之边界迎来变革
- Django搭建简易博客教程(四)-Models
- o型圈沟槽设计_深圳综合O型密封圈ID544.4MM*8.6MM报价-星湖蓝海科技
- 【Linux】Linux基本命令(一)
- 【BZOJ - 3036】绿豆蛙的归宿(概率DAG图dp,拓扑排序,概率dp,期望的线性性)
- WinForm中导出Excel
- Linux下autoconf与automake
- SetLayeredWindowAttributes 设置窗口透明
- 『编程题全队』Alpha 阶段冲刺博客集合
- 时间序列-BP神经网络及与auo arima的比较
- 【优化算法】白头鹰搜索优化算法(BES)【含Matlab源码 1381期】
- c++ win10下 遍历文件夹的方式, dirent.h头文件缺失问题
- 证件照如何弄蓝白渐变色背景
- 昆明市盘龙区打造铸牢中华民族共同体意识盘龙江示范带
- VS Code 修改字体 + 取消注释斜体 + 修改注释颜色
- javaSE探赜索隐之四<final与抽象类>
- c++文件保存与读取
- 学习大数据有推荐的么
- win10系统安装到服务器失败怎么解决,windows10安装失败怎么办?解决win10安装失败的方法教程[多图]...