目标检测和语义分割技术通过强大的目标检测框架和语义分割框架取得显著进步,这些方法提供了灵活性、鲁棒性,快速的训练。

对象分割要求正确检测图像中所有目标的同时精确地分割每个实例。因此,结合对象检测的经典计算机视觉任务的元素,其中的目标是分类单个对象和使用边界框定位每个对象和语义分割,目标是将每个像素分类为一组固定的类别,不区分对象实例。何恺明团队证明了这一点一个非常简单、灵活和快速的系统Mask R-CNN可以超越它先前最先进的实例分割结果。

该方法,称为Mask R-CNN。

文章传送门:https://arxiv.org/abs/1703.06870

“家喻户晓”的Mask R-CNN是图像分割领域中非常经典的实例分割(Instance segmentation)算法。Mask R-CNN不仅在实例分割任务中表现优异,还是一个非常灵活的框架,可以通过增加不同的分支完成目标分类、目标检测、语义分割、实例分割、人体姿势识别等多种不同的任务。

Mask R-CNN扩展了Faster R-CNN通过添加一个分支来预测分割掩码在每个感兴趣区域(RoI)上,与现有分支并行进行分类和边界框回归。

Mask R-CNN

本质上,Mask R-CNN是一种直观的延伸Faster R-CNN,但构建掩模分支正确是取得好结果的关键。最重要的是,更快的RCNN不是为网络输入和输出之间的像素对像素对齐而设计的。这一点在RoIPool是处理实例的实际核心操作,它如何执行粗空间量化特征提取。为了解决这个问题,我们提出了一个简单的,无量化的层,叫做RoIAlign忠实地保留精确的空间位置。

尽管看似很小的变化,RoIAlign却有很大的影响:

提高掩模精度10%到50%,显示在更严格的标准下获得更大的收益。有必要解耦掩码和类预测,为每个类单独预测一个二进制掩码,而不依赖于网络的投资回报率分类分支预测类别。

基本结构——two-state结构:一阶段网络找出RPN;对RPN找到的每个RoI进行分类、定位、并找到binary mask。Mask Representation:结构中没有采用全连接层,而使用了RoIAlign,并是在一个小feature map上做分割。RoIAlign:为从RPN网络确定的ROI中导出较小的特征图。RPN网络会提出若干RoI的坐标,然后输入RoI Pooling,输出供分类和定位使用的特征图。

效果:Mask RCNN的分割效果好于FCIS,尤其在目标重合的部分。

Mask RCNN精度高于Faster RCNN。Mask RCNN的分割任务得分与定位任务得分相近。

Mask R-CNN预测效果:

文章传送门:https://arxiv.org/abs/1703.06870

Mask R-CNN为什么“家喻户晓”相关推荐

  1. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  2. 在OpenCV中使用Mask R-CNN

    本文翻译自:https://www.pyimagesearch.com/2018/11/19/mask-r-cnn-with-opencv/ 在本教程中,您将学习如何在OpenCV中使用Mask R- ...

  3. CVPR2020:三维实例分割与目标检测

    CVPR2020:三维实例分割与目标检测 Joint 3D Instance Segmentation and Object Detection for Autonomous Driving 论文地址 ...

  4. 自动驾驶任务|基于概率的3D多模态多目标跟踪(ICRA2021)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 标题:Probabilistic 3D Multi­Modal,Multi­Object Tracki ...

  5. 对象检测目标小用什么模型好_[目标检测] YOLO4论文中文版

    点击上方 蓝字 关注我呀! [目标检测] YOLO4论文中文版 文章目录 YOLO4论文中文版 摘要 1.介绍 2.相关工作 2.1.目标检测模型 2.2.Bag of freebies 2.3.Ba ...

  6. 【AI视野·今日CV 计算机视觉论文速览 第160期】Wed, 25 Sep 2019

    AI视野·今日CS.CV 计算机视觉论文速览 Wed, 25 Sep 2019 Totally 39 papers ?上期速览✈更多精彩请移步主页 Interesting: ?Interactive ...

  7. 【今日CV 计算机视觉论文速览 143期】Mon, 15 Jul 2019

    今日CS.CV 计算机视觉论文速览 Mon, 15 Jul 2019 Totally 24 papers ?上期速览✈更多精彩请移步主页 Interesting: ?***图像操作解耦网络, 研究人员 ...

  8. 【今日CV 计算机视觉论文速览 第131期】Mon, 17 Jun 2019

    今日CS.CV 计算机视觉论文速览 Mon, 17 Jun 2019 Totally 44 papers ?上期速览✈更多精彩请移步主页 Interesting: ?综述:基于图像的深度重建, 基于单 ...

  9. 【今日CV 计算机视觉论文速览 第127期】Fri, 7 Jun 2019

    今日CS.CV 计算机视觉论文速览 Fri, 7 Jun 2019 Totally 41 papers ?上期速览✈更多精彩请移步主页 Interesting: ?*****Mesh R-CNN, 研 ...

  10. 【今日CV 计算机视觉论文速览 第122期】Fri, 31 May 2019

    今日CS.CV 计算机视觉论文速览 Fri, 31 May 2019 Totally 50 papers ?上期速览✈更多精彩请移步主页 Interesting: ?基于条件GANs的图像去水印方法, ...

最新文章

  1. c 语言set用法,使用
  2. [SinGuLaRiTy] 贪心题目复习
  3. 优秀的缓存工具Memcached
  4. git拉取单个文件_Git拿来就用
  5. 图形图像处理_c/c++
  6. 【office学习网站】
  7. [征求意见]团队发展、技术交流主题、团队机构
  8. journal of systems science and complexity
  9. Qt Creator使用3D材质
  10. mysql share mode_mysql锁:mysql lock in share mode 和 select for update
  11. 办公自动化-python编写ppt-创建第一页-主标题与内容的编写
  12. Android真机没有sqlite3数据库的解决办法
  13. 使用Origin从图片中准确提取数据
  14. 使用FastReport报表工具生成标签打印文档
  15. 操作系统面试知识点总结
  16. 全国省份及城市按字母顺序进行排序js文件
  17. mapabc 地图失效不能进行任何操作
  18. java web整合开发pdf_Java Web整合开发王者归来.pdf
  19. android简单计算器源码
  20. 装饰公司如何做seo

热门文章

  1. boost::mpl模块实现partition相关的测试程序
  2. GDCM:gdcm::LTComp的测试程序
  3. GDCM:DICOM文件转储飞利浦ECHO的测试程序
  4. GDCM:独特的uid测试程序
  5. Boost::context模块fiber的throw测试程序
  6. 基于Boost::beast模块的协程HTTP服务器
  7. ITK:计算代码点之间的时间
  8. DCMTK:OFStack类的测试程序
  9. VTK:可视化算法之DecimateFran
  10. VTK:PolyData之CellTreeLocator