1. R-CNN


ps:在计算机视觉中,深度学习之前,分类器用的是SVM

2. 兴趣区域(RoI)池化层



目的是为了让每个锚框都可以变成一个自己想要的形状。

3. Fast RCNN


具体步骤如下:

  1. 对整张图片用CNN抽特征(ps:不是对锚框抽特征),并且抽特征不需要头,就得到7 x 7或者14 x 14的feature map
  2. 再用选择性搜索在原始图片中搜索到锚框,再把它映射到CNN的输出,CNN的输出是一个feature map,把原图的锚框在feature map中按比例映射。
  3. 再用RoI Pooling对每个锚框抽取特征,假设如图中所示,抽取之后变成两个长为4的向量。图中黄色框框区域可以把一张图片(100个锚框)变成一个100 x 4的向量,这里先不管通道数。
  4. 之后再进入全连接层,(注意这里100是100个样本),做分类预测和锚框预测

比之前R-CNN快的原因:不再是对每一个锚框抽取特征,是对整个图片进行特征抽取。

4. Faster R-CNN

使用一个区域提议网络(Region proposal network)来替代之前的启发式搜索来获得更好的锚框。

具体来说,区域提议网络的计算步骤如下:

  1. 使用填充为1的的3 x 3卷积层变换卷积神经网络的输出,并将输出通道数记为c。这样,卷积神经网络为图像抽取的特征图中的每个单元均得到一个长度为c的新特征。

  2. 以特征图的每个像素为中心,生成多个不同大小和宽高比的锚框并标注它们。

  3. 使用锚框中心单元长度为c的特征,分别预测该锚框的二元类别(含目标还是背景)和边界框。

  4. 使用非极大值抑制,从预测类别为目标的预测边界框中移除相似的结果。最终输出的预测边界框即是兴趣区域汇聚层所需的提议区域。

5. Mask R-CNN

如果有像素级别的标号,使用FCN来利用这些信息


Mask R-CNN是基于Faster R-CNN修改而来的。 具体来说,Mask R-CNN将兴趣区域汇聚层替换为了 兴趣区域对齐层,使用双线性插值(bilinear interpolation)来保留特征图上的空间信息,从而更适于像素级预测。 兴趣区域对齐层的输出包含了所有与兴趣区域的形状相同的特征图。 它们不仅被用于预测每个兴趣区域的类别和边界框,还通过额外的全卷积网络预测目标的像素级位置

RoI Pooling改成了RoI align,因为RoI Pooling对于像素级别不适用,会可能生成像素级的偏移,会导致在边界的地方是预测不准标号的。

RoI align 则是不像之前分割成4、2、2、1,而是直接在中间切开,沿着左右对称的对称轴切开,和上下对称的对称轴切开,这样会存在把一个像素分割的可能,然后再取出一个像素的一小部分。

6. 模型精度比较

从图中可以看出,Faster RCNN精度很高,但是处理很慢。

7. 总结

  • R-CNN是最早、也是最有名的一类基于锚框和CNN的目标检测算法
  • Faster/Faster R-CNN持续提升性能
  • Faster R-CNN和Mask R-CNN是在最求最高精度场景下的常用算法(Mask R-CNN在无人机中应用比较多)

66.物体检测算法:区域卷积神经网络(R-CNN)系列相关推荐

  1. 医学图像处理医学图像处理-卷积神经网络卷积神经网络_典型的深度学习算法(一):卷积神经网络(CNN)...

    通过上一篇文章,相信大家对深度学习的概念.原理已经有了大致了解,近期企通查将会对深度学习中的几种典型算法进行介绍. 在深度学习领域中,已经验证的典型成熟算法有卷积神经网络(CNN).循环神经网络(RN ...

  2. 自动驾驶感知——激光雷达物体检测算法

    文章目录 1. 基于激光雷达的物体检测 1.1 物体检测的输入与输出 1.2 点云数据库 1.3 激光雷达物体检测算法 1.3.1 点视图 1.3.1.1 PointNet 1.3.1.2 Point ...

  3. 碎片2:大白话讲解Mask R-CNN及常见物体检测算法

    文章目录 MASK R-CNN调研报告 1.Introduction 1.1 MASK R-CNN简介 1.2 直觉理解MASK R-CNN 2.Algorithm 2.1已有物体检测算法概述 2.1 ...

  4. GraspNet:一种用于低功耗器件抓取实时检测的高效卷积神经网络

    GraspNet: An Efficient Convolutional Neural Network for Real-time Grasp Detection for Low-powered De ...

  5. 动手学深度学习之物体检测算法R-CNN,SSD,YOLO

    区域卷积神经网络R-CNN R-CNN 首先是使用启发式搜索算法来选择锚框,选出很多锚框之后,对于每一个锚框当作一张图片,使用一个预训练好的模型来对他进行特征抽取,然后训练一个SVM来对类别进行分类. ...

  6. 中科院张士峰:基于深度学习的通用物体检测算法对比探索

    https://www.toutiao.com/a6674792954369933838/ 人工智能论坛如今浩如烟海,有硬货.有干货的讲座却百里挑一.由中国科学院大学主办,中国科学院大学学生会承办,读 ...

  7. 论文解析:人脸检测中级联卷积神经网络的联合训练

    论文解析:人脸检测中级联卷积神经网络的联合训练 商汤科技解析CVPR2016论文:人脸检测中级联卷积神经网络的联合训练 width="250" height="250&q ...

  8. 「取长补短」的RefineDet物体检测算法

    基于深度学习的物体检测算法可大致分为"一阶段"和"两阶段"两类.一般而言,以Faster RCNN为代表的两阶段检测器在准确度上有优势:而以SSD为代表的单阶段 ...

  9. CVPR 2016|商汤科技论文解析:人脸检测中级联卷积神经网络的联合训练

    论文:Joint Training of Cascaded CNN for Face Detection 论文作者:Hongwei Qin, Junjie Yan, Xiu Li, Xiaolin H ...

最新文章

  1. 电脑能安装吗_安装暖气片有要求吗,装好的房子能安装吗?
  2. 使用HttpWebRequest请求API接口以及其他网站资源
  3. 快递春节停运时间表刷屏,假的!但或涨价10-20元
  4. 德国同事Heiko开发的ABAP工具,能检测HANA数据库执行SQL的CPU time
  5. 通过phantomjs 进行页面截图
  6. AvtiveMQ与SpringBoot结合
  7. Satwe楼板能用弹性模计算吗_SATWE软件计算结果分析
  8. 数学教育与计算机教育ppt,计算机基础教育课件.ppt
  9. K3Cloud不重启IIS修改调试代码
  10. 三菱plc pwm指令_三菱PLC高速处理指令编程
  11. 记一次golang cpu 占用100%
  12. 生物信息学概论_英国爱丁堡大学生物相关硕士- 系统与合成生物学理学硕士详解+案例分享...
  13. 用sendcloud来发邮件
  14. 操作系统之进程管理习题
  15. python docx 提取图片_Python提取docx文档中所有嵌入式图片和浮动图片
  16. 超详细——手把手教你用threejs实现一个酷炫的模型发光扫描效果(一)
  17. 云短信使用——阿里云短信使用步骤
  18. 单灯闪烁c语言程序,51单片机,C语言编程,控制指示灯闪烁的频率
  19. Chapter2、HDR流水线
  20. 第六章第二十五题(将毫秒数转换成小时数、分钟数和秒数)(Convert milliseconds to hours, minutes, and seconds)

热门文章

  1. Python文件操作数据格式,简单简洁
  2. pycharm运行虚拟环境Django项目报错
  3. Java 开发实习经验
  4. 1688商品详情接口,1688详情页接口、商品主图
  5. 用DIV+CSS技术设计的非遗文化网页(网页制作课作业)
  6. 第五届“泰迪杯”数据分析技能赛
  7. Arduino--音乐频谱
  8. 主题酒店api,携程酒店信息查询
  9. 《C++语言基础》实践参考——复数模板类
  10. win10怎么关闭defender安全中心?Defender服务关闭方法详解