RCNN系列的内容已经有非常多同学分享出来了,大多也非常详细。为了避免在长文中迷失方向,这里做个精简版的总结,记录个人的理解。主要是概括算法流程以及特点,方便回顾。先简单介绍下RCNN和Fast RCNN,在详细记录faster rcnn的RPN网络的理解。

RCNN:

  1. 流程
    (1). 采用传统方法Selective Search产生目标候选框
    (2). 对每个候选框,用深度卷积神经网络提取特征得到feature map
    (3). 每个框得到的feature map喂给SVM分类器,并通过线性回归调整bounding box的位置和大小,使得更接近 gt
  2. 缺点:
    (1)CNN网络参数不共享
    (2)采用SVM分类器,速度慢
    (3)产生后选框ROI的大小不一样,这样导致CNN输出与FC维度不统一

总的来说,RCNN比较笨,比较慢,进而提出SPP-net。SPP-net用CNN一次性提取特征,并利用空间金字塔池化(spatial pyramid pooling)将大小不一致的proposal变成大小一样的

FasterRCNN理解相关推荐

  1. FasterRcnn原理理解记录

    fasterRcnn总的结构图 图1 从图1可以看到,faster Rcnn的总体结构由以下几个部分组成: Conv layers Region Proposal Networks(RPN) RoI ...

  2. Faster-R-CNN算法理解

    faster-rcnn原理及相应概念解释 R-CNN --> FAST-RCNN --> FASTER-RCNN R-CNN: (1)输入测试图像: (2)利用selective sear ...

  3. Faster-rcnn中Anchor的理解

    文章目录 1,Anchor是如何生成的? 1.1 特征图如何得到 Anchor的生成过程 2,Anchor的作用是什么? 1,Anchor是如何生成的? 1.1 特征图如何得到 假设对于网络输入的图像 ...

  4. Faster-RCNN详解(个人理解)

    1. Faster-RCNN的四个主要内容 图1  Faster-RCNN基本结构 如上图所示,整个Faster-RCNN模型可以分为四个模块: 1) Conv layers,特征提取网络 输入为一张 ...

  5. 通俗理解faster-rcnn的rpn网络

    其实rpn网络非常简单,只是被各种五花八门的人解读的比较玄学,下图中虚线下面部分就是rpn网络: 虚线上面是几个卷积池化,说白了就是提特征,在虚线这一层的上面会得到C个H*W的特征图,这个特征图大小是 ...

  6. Linux终端运行fasterrcnn,对yolo与fasterrcnn anchors的理解

    嵌入式&iOS:回调函数(C)与block(OC)传 参/函数 对比 C的回调函数: callBack.h 1).声明一个doSomeThingCount函数,参数为一个(无返回值,1 ...

  7. 对yolo与fasterrcnn anchors的理解

    yolo: 通过聚类产生5个不同比例的anchors.最后一个特征层的输出(x,y,w,h)与这些不同比列的相乘,将网络层的输出转化为bbox(小尺寸),再通过(H,W)还原成原图大小.一共有5个bb ...

  8. fasterrcnn中ROI Pooling 与 SPP 理解

    介绍 ROI(Region of Interest) Pooling是Pooling的一种.在传统CNN中,Pooling层的作用主要有三个: 1.特征不变性,使模型更加关注是否存在某些特征而不是特征 ...

  9. 基于CNN目标检测方法(RCNN,Fast-RCNN,Faster-RCNN,Mask-RCNN,YOLO,SSD)行人检测,目标追踪,卷积神经网络

    一.研究意义 卷积神经网络(CNN)由于其强大的特征提取能力,近年来被广泛用于计算机视觉领域.1998年Yann LeCun等提出的LeNet-5网络结构,该结构使得卷积神经网络可以端到端的训练,并应 ...

  10. 目标检测之Faster-RCNN的pytorch代码详解(数据预处理篇)

    首先贴上代码原作者的github:https://github.com/chenyuntc/simple-faster-rcnn-pytorch(非代码作者,博文只解释代码) 今天看完了simple- ...

最新文章

  1. Spring(十八):Spring AOP(二):通知(前置、后置、返回、异常、环绕)
  2. Android Fragments 详细使用
  3. Rust 编程语言极简教程 --- 实例学习
  4. 点阵字体显示系列补记:将字库文件转换成数组形式
  5. mysql jdbc配置重连_Spring Boot 配置MySQL数据库重连的操作方法
  6. MYOP究竟能为站长提供哪些便利
  7. phoneGap、JQueryMobile 简介及中文API地址
  8. MYSQL数据库事务介绍
  9. VSC为_LCC 和 VSC (MMC) 的底层特性区别
  10. 摄氏度和开氏度的换算_开氏度和摄氏度
  11. A股退市公司名单及情况(1997-2020年)
  12. 计算机考试如何截屏,教你6种电脑截屏的小技巧-电脑怎么截图
  13. tex的bib引用时出现 empty ’thebibliography' environment
  14. BiERU: Bidirectional Emotional Recurrent Unitfor Conversational Sentiment Analysis(20.12.10)
  15. python招聘现状-前程无忧 Python 招聘岗位信息爬取和分析
  16. Unity 中摄像机跟踪的两种实现
  17. 一个汽车软件测试工程师的三年工作总结
  18. 台式电脑计算机被限制,gpedit.msc 无法运行 提示本次操作由于这台计算机的限制而被取消(超强解决方案)...
  19. 迅时MX8(FXO)8口语音网关连接Elastix+服务器配置
  20. 2015桐庐年会--奔跑吧,骚年

热门文章

  1. 微信小程序的图片上传及图片预览功能
  2. J2EE框架(StrutsHibernateSpring)的理解
  3. 浙江大学-西湖大学联合培养博士生
  4. photoshop标尺工具_RulersGuides.js – Web上的Photoshop样式标尺和指南
  5. window环境下Redies安装和服务启用
  6. 二维码图片处理换logo,加文字
  7. Unity3D插件大全
  8. 【数字水印】图像数字水印技术-含Matlab Gui界面-含文档【0100期】
  9. java CRC32
  10. 如何批量生成Code 128条形码