Mask RCNN:目标检测+实例分割

作用:可以完成目标分类,目标检测,语义分割,实例分割,人体姿态识别等多种任务。

1.实例分割与语义分割的区别和关系?

通常的目标分割是指语义分割,实例分割是从目标分割独立出来的一个小领域,两者相比实例分割更加复杂。
实例分割需要在语义分割的基础上对同类物体进行更加精细的分割。

2.算法主要思想
Mask rcnn算法是由faster rcnn 和语义分割算法FCN组成。前者完成目标检测任务,后者可以准确完成语义分割的任务。
主要思路:原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。
(发现了ROI Pooling中所存在的像素偏差问题,提出了对应的ROI Align策略,加上FCN精准的像素MASK,使得其可以获得高准确率。)

3.Mask R-CNN算法步骤

1.把图片输入到网络中获得对应的特征图;
2.然后把这个特征图中的每一点设定个ROI(感兴趣区域),从而获得多个候选ROI;
3.再把这些候选的ROI送入RPN网络中进行二值分类(前景或后景)和回归,过率掉一部分候选的ROI;
4.接着对这些剩下的ROI进行ROI Align操作(即先将原图和特征图的pixel对应起来,然后将特征图和固定的特征对应起来);
5.最后,再对这些ROI进行分类(多分类)、回归(BB)和MASK生成(在每一个ROI中进行FCN操作)

4.ROI Align 详解

ROI Align与ROI Pooling区分比较:

最大区别:ROI Pooling使用了两次量化(取整)操作,但是ROI Align没有采用量化操作,而是使用了线性插值算法。

ROI Pooling 技术

1.图像坐标----特征图坐标 出现小数后,取整,第一次量化
2.特征图坐标—ROI特征坐标 出现小数,取整,第二次量化, 两次量化导致特征像素出现丢失和偏差。

ROI Align 技术

未引入量化操作,使用双线性插值方法来解决像素浮点数问题。
双线性插值方法:利用原图中的虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值,即20.56浮点数像素值的虚拟位置点对应的像素值估计出来。

4.FCN 语义分割详解

FCN算法思想:首先对图像进行卷积和池化,不断减小其feature map,然后进行反卷积操作,即进行插值操作,增大其feature map,最后对每一个像素值进行分类。

[1]参考博客https://blog.csdn.net/WZZ18191171661/article/details/79453780

Mask RCNN算法详解(总结)相关推荐

  1. 目标检测 RCNN算法详解

    原文:http://blog.csdn.net/shenxiaolu1984/article/details/51066975 [目标检测]RCNN算法详解 Girshick, Ross, et al ...

  2. 【目标检测】Faster RCNN算法详解

    转载自:http://blog.csdn.net/shenxiaolu1984/article/details/51152614 Ren, Shaoqing, et al. "Faster ...

  3. Faster RCNN算法详解

    Ren, Shaoqing, et al. "Faster R-CNN: Towards real-time object detection with region proposal ne ...

  4. 【目标检测】RCNN算法详解

    转载自:http://blog.csdn.net/shenxiaolu1984/article/details/51066975 Girshick, Ross, et al. "Rich f ...

  5. 【目标检测】Fast RCNN算法详解

    转载自:http://blog.csdn.net/shenxiaolu1984/article/details/51036677 Girshick, Ross. "Fast r-cnn.&q ...

  6. 【目标检测】Fast RCNN算法详解(转)

    Girshick, Ross. "Fast r-cnn." Proceedings of the IEEE International Conference on Computer ...

  7. 目标检测算法之Fast R-CNN算法详解

    在介绍Fast R-CNN之前我们先介绍一下SPP Net 一.SPP Net SPP:Spatial Pyramid Pooling(空间金字塔池化) 众所周知,CNN一般都含有卷积部分和全连接部分 ...

  8. DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Mask R-CNN算法的简介(论文介绍) 0.实验结果 1.实例分割具有挑战性 2 ...

  9. 【百度飞浆】RCNN系列目标检测算法详解

    RCNN系列目标检测算法详解 目录 两阶段目标检测算法发展历程 R-CNN R-CNN网络结构 R-CNN网络效果 Fast R-CNN Fast R-CNN网络效果 Faster R-CNN Fas ...

最新文章

  1. 霍夫变换(直线检测、圆检测)
  2. 你也能与AlphaGo谈笑风生:AlphaGo教学工具上线,2万多变化,37万多步棋
  3. C语言 int 转单精度浮点,单精度浮点数与十六进制转换 C语言程序 单片机也可用...
  4. ARMV8-M学习笔记-入门
  5. glibc-2.23学习笔记(二)—— free部分源码分析
  6. Windows核心编程_判断是否管理员权限运行
  7. 【转】Linux配置使用SSH Key登录并禁用root密码登录
  8. LINUX C#开发教程
  9. 基于Windows Server 2008 R2的Failover Cluster(故障转移群集)部署Sql Server 2008 AA(主主) 模式群集(第一部分)
  10. 世界500强面试题(情商部分)
  11. aka鉴权 ims_宋月:IMS鉴权过程中各参数的用途
  12. Day13_01_Java中的加解密之Base64编码
  13. 自媒体多平台多账号群发工具开发日记:第1天 工具的统筹规划
  14. 锂矿降龙十八掌之时乘六龙
  15. 常用FPGA相关的网址资源
  16. VS中编译带Qt的他人项目,环境搭建及解决报错
  17. codemirror6教程
  18. TextView属性大全及跑马灯效果
  19. qdialog 圆角_Qt 的一些心得(背景设置,圆角,半透明)
  20. 开源节流之《延禧攻略》

热门文章

  1. RockChip MPP
  2. 四川大学计算机科学与技术考研复试,四川大学2018计算机学院研究生初试复试成绩公示...
  3. [nodemcu-esp32s]记录02————Esp32 LVGL的移植
  4. android 夜间模式设置
  5. Frameset打印frame的问题(downmoon)
  6. Mongoose 数组
  7. 开源项目学习方法[转]
  8. U3D Image Effects实践(1)——去除红色通道
  9. C/C++游戏项目:《扫雷》
  10. 有1~n个数字,它们能组成多少个互不相同且无重复数字的三位数?都是多少?