写在前面:

对于目标识别领域的发展,RCNN-FAST-FATER-YOLO-SSD-YOLO9000

对于rcnn和fast 二者使用selective search的算法进行图像的强硬分割,并将分割的图像作为提议选取进行cnn的网络训练。而faster进行了在原有的fast的基础上加入了rpn,现在分开来说说。

RCNN

对于rcnn使用svm进行分类,并使用bbox进行位置精修。网络结构示意图及训练过程如下

RCNN算法分为4个步骤

- 使用SS算法生成2k个提议选区
- 对每个提议选区进行深度网络的特征提取,可以使用(vgg,axlenet,googlenet等)
-将每个提议选区的特征送入每一类的SVM 分类器,判别是否属于该类,存在多少个类,对应多少个svm分类器
- 使用bbbox回归器精细修正候选框位置

详细点---------

  1. 使用selective search的方法在测试图片上提取2000个region propasals ,将每个region proposals归一化到227x227;
  2. 在CNN中正向传播,将最后一层得到的特征提取出来;
  3. 对于每一个类别,使用为这一类训练的SVM分类器对提取的特征向量进行打分,得到测试图片中对于所有region proposals的对于这一类的分数,再使用贪心的非极大值抑制去除相交的多余的框
  4. 非极大值抑制(NMS)先计算出每一个bounding box的面积,然后根据score进行排序,把score最大的bounding box作为选定的框,计算其余bounding box与当前最大score与box的IoU,去除IoU大于设定的阈值的bounding box
  5. 重复上面的过程,直至候选bounding box为空,然后再将score小于一定阈值的选定框删除得到一类的结果
  6. 合并规则

    优先合并以下四种区域:
    - 颜色(颜色直方图)相近的
    - 纹理(梯度直方图)相近的
    - 合并后总面积小的
    - 合并后,总面积在其BBOX中所占比例大的

第三条,保证合并操作的尺度较为均匀,避免一个大区域陆续“吃掉”其他小区域,保证合并后的形状规则。

rcnn的弊端:

  1. 使用ss得到提议选区,一张图可以得到2000个region proposal,这里面涉及到大量的重复计算
  2. 对图像分分类使用的是svm的方法,并且每一个分类对应一个svm来判断选区内是否为该种类,与深度学习格格不入

Fast rcnn

对比rcnn,fast主要针对rcnn存在的上述弊端进行了改进,

通过网络结构可以就看出,fast的的方法如下:

  1. .使用ss算法对图像产生2k个提议选区,得到选区的位置
  2. 将整张图像进行深度网络的特征提取,深度网络仍然采用vgg,alexnet或者Googlenet,并去除掉深度网络的最后面的全连接层,只保留最后一层feature map,一般情况下,该深度网络会事先在数据集上进行与训练,已缩短目标识别网络的训练时间;
  3. 使用第一步ss算法得到的位置,并使用roipooling的方法得到region proposal在该featuremap上的位置,并将该位置的feature map的信息作为后续网络结构的输入
  4. 将上一步region proposal 进行平铺
  5. 连接两个全连接层,分别进行分类和回归,对于分类,采用softmax;对于位置回归采用bbox损失函数计算。

损失函数

损失函数包含两部分,使用多任务损失函数的方式.

分类损失函数+回归损失函数

分类损失函数使用log损失函数:Lcls=-log Pu只判断正样本的损失损失函数

回归损失函数使用smoothL1损失函数:Lreg=R(t-t*),其中smoothL1 损失函数的定义如下

对于回归损失函数中的输入量t和t*表示的是预测的位置与ground truth的位置。

fast的弊端

对于fast的主要存在提议选区的问题,在原来的fast的基础上加入了rpn网络。

Summary:Fater Rcnn相关推荐

  1. Tensorflow2.0:Faster RCNN 代码详解(一)

    第一部分给出Fater RCNN文件的代码解析,主要是模型主体的执行过程,在此文件 引入下述几个文件的函数引用,对于backbones,necks和test_mixins文件来说,主要是用来构建模型结 ...

  2. Paper9:Fast RCNN

    code:s available under the open-source MIT License at https://github.com/rbgirshick/ fast-rcnn. 摘要: ...

  3. 深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD

    为什么80%的码农都做不了架构师?>>>    Faster R-CNN.R-FCN 和 SSD 是三种目前最优且应用最广泛的目标检测模型,其他流行的模型通常与这三者类似.本文介绍了 ...

  4. 基于深度学习的目标检测技术的演进:从R-CNN到Faster R-CNN

    导语 什么是Objection Detection?就是在给定的图片中精确的找到物体所在位置,并且标注出物体的类别.目标检测要解决的问题就是物体在哪里?是什么?这样的问题.然而,这个问题并不是那么容易 ...

  5. 抛弃Anchor box和NMS,目标检测新范式开源:Sparse R-CNN

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 作者丨孙培泽@知乎 来源丨https://zhuanlan.zhihu.com/p/31005 ...

  6. DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Faster R-CNN算法的简介(论文介绍) 1.实验结果 2.三者架构对 ...

  7. DL之FastR-CNN:Fast R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之FastR-CNN:Fast R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Fast R-CNN算法的简介(论文介绍) 1.实验结果 2.Fast R-CNN算 ...

  8. DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Mask R-CNN算法的简介(论文介绍) 0.实验结果 1.实例分割具有挑战性 2 ...

  9. 目标检测(R-CNN、Fast R-CNN、Fater R-CNN)

    目标检测(R-CNN.Fast R-CNN.Faster R-CNN) 1.目标检测(object detection) 图像识别是输入一张图像,输出该图像对应的类别.目标检测的输入同样是一张国像,但 ...

最新文章

  1. 【深度学习】一文看尽深度学习各领域最新突破
  2. 如何新建分支上传_Git分支策略及操作演示1|IDCF FDCC认证学员作品
  3. 【Python】蒙特卡罗方法计算圆周率及给定随机数种子
  4. Python的异常处理机制 -- (转)
  5. 到天宫做客(2017寒假培训测试压轴题)
  6. 表单提交enctype参数详解之:application/x-www-form-urlencode和multipart/form-data
  7. 网络安全之SQL注入
  8. mysql基础5-数据的操作
  9. Swift 拷贝文件夹,实现文件夹内容整体复制
  10. paip.undefined reference to MainWindow::xxx from moc_mainwindow.cpp错误解决
  11. SAP物料批次管理配置及操作手册
  12. oracle物理结构视频教学,教你轻松掌握Oracle数据库中的物理结构
  13. 搜狗输入法5.0_注意!月活超5亿的搜狗输入法向用户电脑植入病毒
  14. 金融知识入门之基金基础概念
  15. 美团小哥用计算机,美团回应大V与美团小哥争议一事:鲁莽不会让世界变好!...
  16. faster rcnn 代码与原理结合详解
  17. slack 开源系统_Slack团队聊天的5种开源替代品
  18. IDEA2016 license server 激活
  19. python股票分析-放量跌到底买入-涨了再卖
  20. SQL高级语句(一)

热门文章

  1. Android中View绘制各种状态的背景图片原理深入分析以及StateListDrawable使用
  2. 【解决方案】“博物馆热”背后,如何建设安防视频监控体系保障文物安全?
  3. 论文解读:基于深度相机的3D建模 2020最新综述
  4. pdf转html在线预览,PDF转html
  5. noip模拟赛 街灯
  6. Python 并发编程(进程)
  7. 28岁自学Python转行靠谱吗?入行晚吗?
  8. C++ 内存管理 - primitives - 侯捷
  9. printThis前端打印插件
  10. Win11远程协助灰色无法勾选?Win11远程协助不能选择的解决方法