(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
今天跟大家分享一篇有意思的arXiv上新出的论文,作者来自德国宝马汽车公司(BMW Car IT GmbH,Germany)的两位实习生。

Mask R-CNN是实例分割的经典模型,作者通过在Mask R-CNN框架上附加一个新任务,达到更快的网络收敛速度。
该文对MaskR-CNN添加了一个新的预测任务,称为Edge Agreement Head(也许可以翻译为“边缘协定预测端”?),它的灵感来自人工实例标注的方式。当人们对实例进行像素级标注的时候,仅仅会关注实例的边缘部分,而实例内部则只需要简单的复制边缘的标注信息就可以了。所以实例的mask边缘非常有用,它们很好地表征了实例。Edge Agreement Head的作用即鼓励深度网络训练时预测的实例mask边缘与groundtruth的边缘相似。

算法思想

作者通过观察Mask R-CNN训练前期输出的预测图像,发现很多时候边缘都不在点上,很显然,神经网络在走弯路。
请看下面的例子:

这是Mask R-CNN深度网络训练前期的一些预测的Mask,发现它并没有像人类一样先把边缘找出来,甚至缺失的很离谱(你可以预测的不很精细准确,但至少要表现出在向这个方向努力吧!)。
为了避免神经网络走弯路,作者把实例的边缘信息作为一种监督的指引,即将groundtruth进行边缘滤波,让神经网络同时去预测实例的边缘。指了条明路。
Mask R-CNN的多任务损失函数:

具体的做法是,增加一个新分支,预测边缘并与groundtruth的边缘相比较,请看下图

作者仅是对每个实例28*28大小区域内(所以增加的计算量有限)进行上述操作,通过添加简单的3*3边缘检测计算预测和groundtruth的边缘,因为边缘检测往往和图像平滑一起用,所以右边的图增加了平滑的步骤。
上图中Lp代表计算两者差异的方式,如下:

p代表像素差值的幂次方参数。

作者尝试了普通的Sobel滤波和Laplacian滤波检测边缘。

作者通过Edge Agreement Head方式增加了一个损失函数,模型复杂度略微增加,没添加任何额外的需要训练的模型变量,训练的计算成本增加很小,而网络推断时不增加计算量。

实验结果
作者在MS COCO 2017数据集上做了实验,比较训练达到160k steps时基准模型和提出的模型的COCO AP metrics精度。

Table 1说明当训练达到160k steps时,使用Edge Agreement Head的模型训练达到了更高的精度,尤其是使用Soble边缘算子的模型。
Table 2表明不使用图像平滑加速更加明显,达到更高的精度。
预测结果比较图示:


Table 4表明,拉长训练时间,使用Edge Agreement Head仍然获得了更高的精度。

该文没有开源代码。

总结
这篇论文很简单,但给出的结论很有意思,Edge Agreement Head相当于提供了更多的监督信息,为深度网络指了一个方向,少走一些弯路。尤其在训练早期,网络更容易迷茫的时候就更需要指条明路。
尤其值得一提的是,很显然边缘信息可以有助于所有图像像素级理解的应用,比如深度估计、光流计算等,大家不妨一试。

最后推荐一篇52CV君之前分享过的一篇论文,利用边缘信息大幅改进了人脸对齐,如果你还没读,非常值得一读!

重磅!清华&商汤开源CVPR2018超高精度人脸对齐算法LAB

论文地址:
https://arxiv.org/abs/1809.07069v1

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

利用边缘监督信息加速Mask R-CNN实例分割训练相关推荐

  1. Mask R-CNN:实例分割与检测算法

    摘要 目的:对象实例分割(区别出不同的对象) 提出:Mask R-CNN(扩展的FasterR-CNN)--通过在每个RoI处添加用于预测分割的mask(小的FCN),与用于分类和边界框回归的Fast ...

  2. IRNet:弱监督实例分割 | 步步为营,隔山打牛

    本文作者:Uno Whoiam 链接:https://zhuanlan.zhihu.com/p/246105364 本文仅供学习参考,如有侵权,请联系删除! 论文地址: https://openacc ...

  3. mask rcnn算法分析_实例分割综述(单阶段/两阶段/实时分割算法汇总)

    作者:Danny明泽 来源:公众号@3D视觉工坊 链接:实例分割综述(单阶段/两阶段/实时分割算法汇总) 简介 目标检测或定位是数字图像从粗到细的一个渐进过程.它不仅提供了图像对象的类,还提供了已分类 ...

  4. RefineMask:实例分割,使用细粒度信息增强性能

    标题:RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained Features 论文:https://arxi ...

  5. 实例分割:Mask RCNN

    Mask RCNN 学习目标 说明Mask RCNN的结构特点 掌握Mask RCNN的RoIAlign方法 掌握Mask RCNN的mask原理 知道Mask RCNN的损失函数 上图是MaskRC ...

  6. 完美替代Mask RCNN!BlendMask:实例分割新标杆

    点击我爱计算机视觉标星,更快获取CVML新技术 今天新出的论文BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation,提出一种自顶向 ...

  7. 【转】自然语言系列学习之表示学习与知识获取(八)利用远程监督多实例的关系抽取

    下面介绍下如何利用远程监督多实例进行关系抽取.前文有提到到当利用文本进行关系抽取,基本思想是利用知识图谱中,如(下图)任意两个实体同时在句子中出现: 我们把句子当成是两个实体关系训练得样例,这样就可以 ...

  8. MG-BERT:利用无监督原子表征学习进行分子性质预测

    MG-BERT:利用无监督原子表征学习进行分子性质预测 MG-BERT: leveraging unsupervised atomic representation learning for mole ...

  9. MIT博士生、北大校友,利用自监督算法,解决了数据集中这一常见的“难题”...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 萧箫 转载整理自 杨宇喆 量子位 报道 | 公众号 QbitAI 训 ...

最新文章

  1. Windows Phone 7 XNA开发之关于图形的配置
  2. 31.绿豆蛙的归宿(拓扑排序)
  3. 计算机教育应用3t模式,[信息技术教育应用作业.doc
  4. python接口测试第二期_python2 接口测试一般方法.
  5. Asp.net(C#)-显示所有缓存 清除所有缓存
  6. Matlab 画图字体,字号的设定,图片大小和比例
  7. 连续型切片与离散加减的思路学习
  8. Python英语单词查询
  9. 整数规划_教学 | 线性(整数)规划的若干建模技巧
  10. 麦咭萌app送智伴机器人_国内儿童陪伴机器人品牌盘点
  11. 网络蜘蛛的基本原理--转载
  12. python会自动释放内存吗_没白熬夜,终于把Python的内存管理机制搞明白了
  13. python 区块链_python与区块链
  14. 一线工程师告诉你嵌入式真实现状与发展前景
  15. Android源码 app预制带so和assets文件的aar包(sdk)
  16. 桌面视频录制软件有哪些?怎么简单又快地录制视频?
  17. Ubuntu桌面版以太网无法设置IP
  18. 挂载WINDOWS虚机镜像
  19. nodejs 视频教程《一起学nodejs》
  20. 使用Python调用百度地图的API在地图上添加标记

热门文章

  1. HTML,CSS,JavaScript学习笔记--导航
  2. mysql 有索引 不被使用方法_MySQL教程100-索引在什么情况下不会被使用?
  3. matlab进行sg滤波,Matlab,SG滤波器
  4. python rabitmq_python使用rabbitmq实例二,工作队列
  5. python的基础字典_python 基础之字典一
  6. 如何调整标题字体大小_软网推荐:找回调整Windows 10字号功能
  7. python二级考试选择题公共基础知识_计算机二级Python易忘考点整理
  8. ssm框架解读oracle,分页查询显示action的笔记SSM框架分页oracle数据库
  9. melogin.cn主页登录_melogin.cn登录官网
  10. Linux中errno的含义