Mask Scoring R-CNN论文解读

    人工智能大神何凯明的Mask R-CNN对实例分割做出了巨大的贡献,在2019年的CVPR会议中,一个基于Mask R-CNN的一个名为Mask Scoring R-CNN的网络提高了实例分割性能。
    大多数实例分割方法中,实例蒙板(instance mask)的分数与box-level的分类置信度共享,该置信度由运用在提议特征的分类器所预测。用分类置信度来评估蒙板质量是不合适的,因为它只服务于区分提议中的语义类别,并且不能意识到实例蒙板的实际质量和完整性。
    实例分割假设得到准确的box-level定位结果和很高的分类分数,但是对应的蒙板是不准确的。显然,用这样的分类分数来为蒙板打分会降低评价结果。本文为每个蒙板打分,称作mask score。
maskscore=MaskIoU×classificationscoremask\ score = MaskIoU\times{classification\ score}mask score=MaskIoU×classification score
在 Mask R-CNN框架的基础上,采用了一个叫做MaskIoU Head 的MaskIoU预测网络。
    MaskIoU head 利用mask head的输出和ROI特征作为输入并用简单的回归损失来进行训练。
    本文的主要贡献总结如下:
1.提出了第一个解决实例分割假设得分问题的名为Mask Scoring R-CNN的框架。考虑到实例蒙板的完整性。如果蒙板不够好却有一个很高的分数时,将降低实例蒙板的分数。
2.MaskIoU头非常简单和有效。

检测分数校正

    在其他方法中,大多是通过bounding box 和ground truth之间的IoU值来校正检测分数,而本文提出的MaskIoU head可以注意到实例蒙板的完整性,是针对mask的,相比bounding box更准确。最终的蒙板分数可以反映实例分割假设实际的分割质量。

动机

    目前的Mask R-CNN的检测假设是由分类分数中最大的事物决定的。因为背景聚类和咬合的问题,可能导致分类分数很高,而mask质量很低。如图1.所示
    本文为了在数量上分析这个问题,作者对比了原始版本的Mask R-CNN的mask分数和预测得到的mask与ground truth mask之间的IoU值作比较,得到如图2.的结果,说明Mask R-CNN中classification score和MaskIoU的相关性不是很好。

    在大多数实例分割验证协议中如COCO,拥有高的检测分数和低的MaskIoU,对于一个检测假设是有害的,确定一个检测结果是可信的还是不可信的是非常重要的。所以本文的动机是根据每一个检测假设的MaskIoU得到一个已校准的mask score。所以作者在Mask R-CNN的基础上添加了一个MaskIoU head来学习经过MaskIoU校准后的mask score。

Mask scoring

     作者将预测mask的分数定义为smasks_{mask}smask​。理想的smasks_{mask}smask​等于预测mask和其匹配的ground truth mask的像素级IoU,之前被称作MaskIoU。因为一个mask 只属于一个类,因此理想的smasks_{mask}smask​对于ground truth 类别应该具有正值,对于其他类别应该为零。这需要mask分数在两个方面具有很好的特性:将mask分为正确的类;将提案的MaskIoU回归为前景对象类别(就是既要稳又要准)。
    仅仅用一个函数来训练两个任务是很困难的。为了简化,作者将mask分数学习任务分解为mask分类和IoU回归,对于所有的类别表示为:smask=scls⋅sious_{mask}=s_{cls}\cdot{s_{iou}}smask​=scls​⋅siou​,sclss_{cls}scls​专注于将提议分类到它属于的类,sious_{iou}siou​专注于回归MaskIoU。
    对于sclss_{cls}scls​,在R-CNN阶段的分类任务中就已经完成。所以可以直接采用对应的分类分数。回归的sious_{iou}siou​是这篇文章的目标。

MaskIoU Head

    回归预测mask和它的ground truth mask之间的IoU值。Mask Scoring R-CNN用RoIAlign层的特征和预测mask的级联作为MaskIoU Head的输入。级联时,我们采用核大小为2,stride为2的最大池化来让预测mask和RoI特征有相同的空间尺寸。我们仅选取ground truth类回归MaskIoU(对于测试阶段,我们选取预测类)而不是所有类。MaskIoU Head由4个卷积层和3个全连接层组成。对于4个卷积层,我们跟随Mask Head设置所有卷积层的卷积核大小为3,过滤器个数为256。对于3个全连接层,我们跟随RCNN Head将前两个全连接层的输出设置为1024,随后一层的输出为类别数。网络结构如图3所示:

training

    为了训练MaskIoU Head,我们采用区域提议网络作为训练样本。该训练样本需要提案框和对应的ground truth 框的IoU值大于0.5,这和Mask R-CNN的Mask head的训练样本一样。为了产生每一个训练样本的回归目标,首先我们得到目标类别的预测mask,然后利用阈值0.5将预测mask二值化。作者利用得到的二值mask和对应的ground truth的MaskIoU作为目标MaskIoU。采用l2l_2l2​正则化损失回归MaskIoU,损失权重设置为1。

Inference

     在inference阶段,仅用MaskIoU Head校准R-CNN产生的分类分数。特别地,标准的Mask R-CNN的inference程序是,从Mask R-CNN的R-CNN阶段输出了N个bounding box,通过SoftNMS(soft非极大抑制)方法选择了其中前k个box,然后将这前k个box喂入Mask Head来产生多类别mask。作者也采用了Mask R-CNN这种程序喂入前k个目标mask来预测MaskIoU,然后与分类分数相乘得到校准后的mask score作为最后的mask置信度。

Mask Scoring R-CNN论文解读相关推荐

  1. Mask Scoring Rcnn论文解读《Mask Scoring R-CNN》

    参考链接: 论文链接<Mask Scoring R-CNN> Github 地址 Mask Scoring RCNN 在大多数实例分割框架中,实例分类的置信度被用作MASK质量分数. MA ...

  2. cnn 句向量_深度学习目标检测Fast R-CNN论文解读

    前言 我们知道,R-CNN存在着以下几个问题: 分步骤进行,过程繁琐.Selective Search生成候选区域region proposal->fine tune预训练网络->针对每个 ...

  3. 论文解读:Factual Probing Is [MASK]: Learning vs. Learning to Recall

    论文解读:Factual Probing Is [MASK]: Learning vs. Learning to Recall   先前一系列Prompt方法基于搜索策略获得Prompt的templa ...

  4. 语义分割算法Mask RCNN论文解读

    论文名称:Mask R-CNN 论文地址:https://arxiv.org/abs/1703.06870 代码地址:https://github.com/matterport/Mask_RCNN s ...

  5. CVPR2020论文解读:CNN合成的图片鉴别

    CVPR2020论文解读:CNN合成的图片鉴别 <CNN-generated images are surprisingly easy to spot- for now> 论文链接:htt ...

  6. CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪

    作者丨左育莘 学校丨西安电子科技大学 研究方向丨计算机视觉 图像去噪是low-level视觉问题中的一个经典的话题.其退化模型为 y=x+v,图像去噪的目标就是通过减去噪声 v,从含噪声的图像 y 中 ...

  7. Mask Scoring R-CNN论文阅读

    为了以后的学习方便,把几篇计算机视觉的论文翻译放上来,仅为自己的学习方便,本文仅将自己感兴趣部分简单翻译.排版对手机端不友好,欢迎各位指正. 为提高实例分割的性能,该论文寻找了一个新的方向--对生成的 ...

  8. cnn生成图像显著图_CVPR2020论文解读:CNN合成的图片鉴别

    CVPR2020论文解读:CNN合成的图片鉴别 <CNN-generated images are surprisingly easy to spot... for now> 论文链接:h ...

  9. 感知算法论文(四):Mask Scoring R-CNN (2019)译文

    文章目录 摘要 1. 引言 2. 相关工作 2.1 实例分割 2.2 检测得分校正 3. 方法 3.1 动机 3.2 Mask scoring in Mask R-CNN 4. 实验 4.1 实验细节 ...

最新文章

  1. Android studio快捷键
  2. C语言手撸搜索(查找)二叉树---创建,插入,删除
  3. sklearn自学指南(part6)--使用手册的目录
  4. linux ap程序,ubuntu(linux)无线网卡开启/关闭wifi(AP)
  5. [LeetCode]题解(python):062-Unique Paths
  6. 编写监控脚本,监控集群内所有服务存活状态,内存、磁盘剩余率检测,异常则发送报警邮件...
  7. mysql 建前缀索引_MySQL_前缀索引_建立
  8. 终面后拿offer几率_战绩 | 恭喜VIP学员斩获德勤(北京)风险分析师全职Offer!...
  9. 【渝粤教育】国家开放大学2018年秋季 2711T花卉栽培技术 参考试题
  10. 前端实现video播放
  11. 新西兰计算机科学专业排名,2020年新西兰计算机科学专业排名榜
  12. 520评论点赞活动开奖
  13. Properties综合应用,冲冲冲
  14. 关于hibernate的见解
  15. PC817做IO输出使用方法
  16. input和textarea设置placeholder属性的颜色、字体大小
  17. (四)C语言零基础入门 --- C语言之入门课程
  18. 常见seo名词解释二(网站SEO常见术语说明)-从SEO到优化实战大师
  19. sqlmap之sqlmapapi
  20. Stata:跨国投入产出分析-icio

热门文章

  1. OL4叠加显示天地图地图服务之XYZ实例
  2. 学习笔记 java 集合(三)
  3. iMindMap思维导图V2020.12提示许可证激活使用的次数过多解决教程
  4. vmware虚拟机ubuntu18.04桌面版安装教程
  5. 郎凤娥谈山西蓝天煤粉工业锅炉的技术及性能优势
  6. Speed up resilver
  7. android天天理财项目构建思路代码和总结知识点--1
  8. FZU2167:大王叫我来巡山呐
  9. 计算机组成原理简单模型机实验,计算机组成原理简单模型机实验.doc
  10. 洞悉数据管理先机,尚德电力勇当光伏行业数字化先行者!