点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自AI公园

作者：Kayo Yin

编译：ronghuaiyang

导读

只使用1349张图像训练Mask-RCNN，有代码。

代码：https://github.com/kayoyin/tiny-inst-segmentation

介绍

计算机视觉的进步带来了许多有前途的应用，如自动驾驶汽车或医疗诊断。在这些任务中，我们依靠机器的能力来识别物体。

我们经常看到的与目标识别相关的任务有4个：分类和定位、目标检测、语义分割和实例分割。

在分类和定位中，我们感兴趣的是为图像中目标的分配类标签，并在目标周围绘制一个包围框。在这个任务中，要检测的目标数量是固定的。

物体检测不同于分类和定位，因为这里我们没有预先假设图像中物体的数量。我们从一组固定的目标类别开始，我们的目标是分配类标签，并在每次这些类别中的一个目标出现在图像中时绘制边界框。

在语义分割中，我们为每个图像像素分配一个类标签：所有属于草的像素被标记为“grass”，属于羊的像素被标记为“sheep”。值得注意的是，例如，这个任务不会对两只羊产生区别。

我们的任务是实例分割，它建立在目标检测和语义分割之上。在目标检测中，我们的目标是在预定义的类别中标记和定位目标的所有实例。但是，我们没有为检测到的目标生成边界框，而是进一步识别哪些像素属于该目标，就像语义分割一样。与语义分割不同的是，实例分割为每个目标实例绘制一个单独的掩码，而语义分割将为同一类的所有实例使用相同的掩码。

在本文中，我们将在一个很小的Pascal VOC数据集上训练一个实例分割模型，其中只有1349张图像用于训练，100张图像用于测试。这里的主要挑战是在不使用外部数据的情况下防止模型过拟合。

数据处理

标注采用COCO格式，因此我们可以使用pycocotools中的函数来检索类标签和掩码。在这个数据集中，共有20个类别。

下面是一些训练图像和相关mask的可视化显示。mask的不同阴影表示同一目标类别的多个实例的不同掩码。

图像的大小和长宽比各不相同，因此在将图像输入模型之前，我们调整每个图像的尺寸500x500。当图像尺寸小于500时，我们对图像进行优化，使最大边的长度为500，并添加必要的零以获得正方形图像。

为了使模型能够很好地泛化，特别是在这样一个有限的数据集上，数据增强是克服过拟合的关键。对于每一个图像，以0.5的概率水平翻转，以0.9到1倍的尺度进行随机剪裁，以0.5的概率进行高斯模糊，标准差为随机，对比度随机调整尺度为0.75和1.5之间，亮度随机调整尺度在0.8和1.2之间，以及一系列随机仿射变换如缩放、平移、旋转，剪切。

Mask-RCNN

我们使用matterport实现的Mask-RCNN进行训练。虽然结果可能会很好看，但我们不会用MS COCO的预训练权重来展示我们如何只用1349张训练图像就能得到好的结果。

Mask-RCNN是在2017年Mask-RCNN论文中提出的，是同一作者对Faster-RCNN的扩展。Faster-RCNN被广泛应用于目标检测，模型在被检测物体周围生成包围盒。Mask-RCNN进一步生成了目标的mask 。

我将在下面简要介绍模型体系结构。

首先，我们使用一个主干模型从输入图像中提取相关的特征。在这里，我们使用ResNet101架构作为骨干。图像由张量(500,500,3)转换为特征图(32,32,2048)。

然后将之前获得的特征输入到一个区域建议网络(RPN)中。RPN扫描feature map的区域，称为anchors，并尝试确定包含目标的区域。这些anchor的尺寸和纵横比各不相同。RPN为每个anchor分配一个类别：前景(正样本anchor)或背景(负样本anchor)。中性anchor是指不影响训练的anchor。

正样本anchors（左），中性anchors（中），负样本anchors（右）

建议层然后挑选最有可能包含目标的anchor，并优化anchor框以更接近目标。当太多anchor点重叠时，只保留前景分数最高的那个(非最大抑制)。这样，我们就得到了感兴趣的区域 (ROI)。

对于每个由ROI分类器选中的目标区域，模型生成28x28的mask。在训练过程中，将 ground truth mask缩小，用预测的mask计算损失，在推理过程中，将生成的mask放大到ROI的边界框大小。

迁移学习

特别是在数据有限的情况下，更快更好地训练模型的关键是迁移学习。Imagenet数据集是一个巨大的自然图像语料库，类似于我们的图像。因此，我们可以将Resnet101骨干模型的权值初始化为在Imagenet上预先训练的权值。这将提高我们得到的特征图的准确性，从而提高整个模型。

为了微调在Imagenet上预训练的模型，我们首先只训练model heads。然后我们在剩下的epochs中训练从ResNet level 4和以上的层。这个训练方案也有助于最小化过拟合。我们可以不去微调第一层，因为我们可以重用模型从自然图像中提取特征的权重。

结果 & 检测pipeline可视化

我们的测试集上获得的mAP为0. 53650。下面是随机选择测试图像的模型输出的一些可视化结果：

我们还可以看到算法不同步骤的输出。下面，我们有在边界框细化之前的top anchors的得分。

接下来，我们有了细化的边界框和非最大抑制后的输出。这些建议然后被输入分类网络。注意，在这里，我们有一些框框住了一些目标，比如标志，这些目标不属于我们定义的目标类别。

在建议区域上运行分类网络，得到正样本的检测，生成类概率和边界框回归。

在得到边界框并对其进行细化后，实例分割模型为每个检测到的目标生成mask。mask是soft masks(具有浮点像素值)，在训练时大小为28x28。

最后，预测的mask被调整为边界框的尺寸，我们可以将它们覆盖在原始图像上以可视化最终的输出。

—END—

英文原文：https://towardsdatascience.com/overcome-overfitting-during-instance-segmentation-with-mask-rcnn-32db91f400bc

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目31讲

在「小白学视觉」公众号后台回复：Python视觉实战项目31讲，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

下载4：leetcode算法开源书

在「小白学视觉」公众号后台回复：leetcode，即可下载。每题都 runtime beats 100% 的开源好书，你值得拥有！

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

使用Mask-RCNN在实例分割应用中克服过拟合相关推荐

收藏 | 使用Mask-RCNN在实例分割应用中克服过拟合
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达转载于:作者:Kayo Yin 编译:ronghuaiyang | AI公园导读只使 ...
收藏 | 使用 Mask-RCNN 在实例分割应用中克服过拟合
点上方蓝字计算机视觉联盟获取更多干货在右上方 ··· 设为星标 ★,与你不见不散仅作学术分享,不代表本公众号立场,侵权联系删除转载于:作者 | Kayo Yin 编译 | ronghuaiyan ...
Mask R-CNN：实例分割与检测算法
摘要目的:对象实例分割(区别出不同的对象) 提出:Mask R-CNN(扩展的FasterR-CNN)--通过在每个RoI处添加用于预测分割的mask(小的FCN),与用于分类和边界框回归的Fast ...
详解何恺明团队4篇大作 !（附代码）| 从特征金字塔网络、Mask R-CNN到学习分割一切
来源:新智元作者:krish 本文5000字,建议阅读10+分钟. 本文介绍FAIR何恺明.Tsung-Yi Lin等人的团队在计算机视觉领域最新的一些创新,包括特征金字塔网络.RetinaNet. ...
基于mask rcnn的三维物体分割
原文地址:http://siligence.ai/article-446-1.html 前言最近迷上了mask rcnn,也是由于自己工作需要吧,特意研究了其源代码,并基于自己的数据进行训练~ 本博 ...
maskrcnn用于目标检测_用自己的数据训练Mask R-CNN目标检测/分割模型
摘要: 本文讲述了如何使用Mask-CNN对图像中的大量数据进行目标识别与目标分割. 计算机非常擅长数字运算,但对分析图像中的大量数据束手无策.直到最近找到了解决方法,即创建图像处理单元库,利用数千个 ...
神经网络 | Mask Scoring R-CNN：实例分割综述
博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 神经网络 | TensorMask ...
pascal行人voc_在一个很小的Pascal VOC数据集上训练一个实例分割模型
只使用1349张图像训练Mask-RCNN,有代码. 代码:https://github.com/kayoyin/tiny-inst-segmentation 介绍计算机视觉的进步带来了许多有前途的 ...
利用边缘监督信息加速Mask R-CNN实例分割训练
(欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 今天跟大家分享一篇有意思的arXiv上新出的论文,作者来自德国宝马汽车公司(BMW Car IT GmbH,Ger ...

使用Mask-RCNN在实例分割应用中克服过拟合

介绍

数据处理

Mask-RCNN

迁移学习

结果 & 检测pipeline可视化

使用Mask-RCNN在实例分割应用中克服过拟合相关推荐

最新文章

热门文章