这里的第二步已经不一样了,这里是把整个图像输入到网络中,roi pooling(感兴趣区域),

fast rcnn是先把整个图像输入得到特征图,然后根据候选框对整个图片的映射关系得到每个候选框的特征图了。

正样本指的是包含目标的样本,负样本指的是背景了。ss算法提取了2000个候选框,但是只拿64个,然后把和含目标的框的iou大于0.5的设置为正样本,在0.1到0.5的设置为负样本。

之后再使用roi pooling层。将各个候选框对应的特征图缩放到统一的尺寸。

假设左图是一个候选框对应的特征图,然后将他分为7*7的区域,然后对每一个区域实现最大池化下采样操作,如右图所示,右上角是0.1。注意这里只是一个channel。

softmax分类器会输出n+1个类别,

会输出(n+1)x4个节点,下面这个一维向量每4个一份。

黄色的框是初始,绿色的框是含目标的框,红色的是调整之后得到的框。

一共有两个损失值。

可以看到是交叉熵损失。

oi*只有在真实的位置才会是1,其余位置都是0。

那么它是一个平衡系数,平衡这两个损失值。

faster rcnn


有一个不同是使用RPN结构得到候选框,可以看成是RPN加上fast rcnn

RPN结构


先来解释anchor,在特征图上找一个点,等比例找到他在原图里的位置,然后以他为中心,创建多个矩形区域,就像右图里这些矩形,就是一个anchor,然后针对假如k个anchor,经过cls后得到2k个结果,一个是是目标的概率,一个是是背景的概率,同理,经过回归层可以得到4k个参数。

cls这个框里每2个一组,一个是是目标的概率(这里不是是汽车的概率),一个是是背景的概率。

三种尺度就是anchor的面积,每个尺度会有三个比例,可以在右图看到。所以每个位置有9个anchor。



只选取256个anchor,其中分为正样本和负样本。

有2种方法定义正样本:1.这个anchor与人工选的的iou大于0.7;2.与人工选取的anchor的iou最大的那个anchor。负样本是指与所有人工框的iou小于0.3的。其余丢弃。





fast rcnn和faster rcnn相关推荐

  1. fast rcnn,faster rcnn使用cudann加速问题

    之前在fast rcnn,faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速),编译会报错: 之所以会这样,是因为fast rcnn,faster ...

  2. 大话目标检测经典模型(RCNN、Fast RCNN、Faster RCNN)

    目标检测是深度学习的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤: 1.分类,识别物体是什么   2.定位,找出物体在哪里   除了对单个物体进行检测,还要 ...

  3. 目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN

    一. 从图像识别的任务说起   1.1 思路一:看做回归问题   1.2 思路二:取图像窗口 二. R-CNN横空出世 三. SPP Net 四.Fast R-CNN 五.Faster R-CNN 看 ...

  4. 《目标检测》R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN

    学习内容来自:https://www.bilibili.com/video/BV1m5411A7FD?p=2 类似的博文:https://blog.csdn.net/v_JULY_v/article/ ...

  5. 实例分割模型Mask R-CNN详解——从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN

    转载自 jiongnima 原文链接 https://blog.csdn.net/jiongnima/article/details/79094159 Mask R-CNN是ICCV 2017的bes ...

  6. 人工智能目标检测模型总结(一)——R-CNN、Fast R-CNN、Faster R-CNN

    前言 目标检测是人工智能的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤: 1.分类,识别物体是什么 2.定位,找出物体在哪里 除了对单个物体进行检测,还要能 ...

  7. R-CNN,Fast R-CNN,Faster R-CNN原理及执行与训练的实例+实现自己的目标检测(转)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/m0_37407756/article/details/80810364 一.原理篇 R-CNN的原理 ...

  8. CNN:RCNN、SPPNet、Fast RCNN、Faster RCNN、YOLO V1 V2 V3、SSD、FCN、SegNet、U-Net、DeepLab V1 V2 V3、Mask RCNN

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) CNN: 目标检测: RCNN SPPNet Fast RCN ...

  9. RCNN、Fast RCNN、Faster RCNN算法详细介绍

    目标检测是深度学习的一个重要应用,就是在图片中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤: 1.分类,识别物体是什么 2.定位,找出物体在哪里 除了对单个物体进行检测,还要能支持对 ...

  10. 实例分割模型Mask R-CNN详解:从R-CNN,Fast R-CNN,Faster R-CNN再到Mask R-CNN

    Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成果.在机器学习2017年的最新发展中,单任务的网络结构已经逐渐不再引人瞩目,取而代之的是 ...

最新文章

  1. awk命令中执行多条shell命令
  2. AI赌神升级!无惧bluff,6人局德扑完胜世界冠军,训练只用了8天
  3. 219. Contains Duplicate II
  4. [YTU]_2759( 字符串---统计元音)
  5. cad修改快捷键_超全CAD快捷键命令汇总!助你成为CAD大神!
  6. 粒子群 多目标 matlab_matlab 粒子群求解三角形垂心位置
  7. idea的英文是什么意思_德芙和多芬的英文都是Dove!“Dove”究竟是什么意思?
  8. dw显示云服务器的数据库,dw如何读取服务器数据库
  9. warning: setlocale: LC_ALL: cannot change locale (en_US.UTF-8): No such file or directory
  10. 安静的秋千 ,晚上不睡早晨不起精彩回帖汇总
  11. Android之BLE(低功耗)蓝牙开发
  12. 用python写一个股票提醒、并用邮件方式发送出去
  13. QT(5.12)+Qgis(3.10) 点图层及线图层渲染
  14. 数据平台建设的痛点,如何进行元数据治理?
  15. 如何画出专业的原型图?(上)
  16. 大学生必须掌握的计算机软件基础
  17. 二维码背后的隐忧:扫码点单之后,谁从餐桌上拿走了你的信息?
  18. mysql登录报错“Access denied for user ‘root‘@‘localhost‘ (using password: YES”的处理方法
  19. 生而为人,请善待每一个人
  20. PHPnow搭建指南

热门文章

  1. jmeter 连接mysql数据库
  2. Windows Qt设置环境变量
  3. 初学者学习数据库的三个方向
  4. CH340以及CH系列USB转串口驱动下载
  5. rinetd端口转发工具
  6. 安全生产知识竞赛答题小程序
  7. docker安装教程
  8. Linux epoll模型详解及源码分析
  9. PXE配置-Tftpd64
  10. 制造行业相关名词释义