这是专栏《图像分割模型》的第11篇文章。在这里,我们将共同探索解决分割问题的主流网络结构和设计思想。

本文介绍了用于实例分割任务的模型结构——DeepMask。

作者 | 孙叔桥

编辑 | 言有三

本期论文:《Learning to Segment Object Candidates》

1 实例分割

区别于本系列之前介绍的语义分割任务,实例分割任务有其自己的任务需求与度量矩阵。简单来讲,语义分割只分割视野内目标的类型,而实例分割则不仅分割类型,同时还需要分割同类型的目标是否为同一个实例。

举个例子,下面图片中所有的目标都是“猫”,但只有蓝色的那只是你家的,其他都是借来拍照凑数的。那么,拍照结束回家时,只能分辨眼前的目标是否是“猫”已经不够了,还需要能够知道哪只是自己的。否则,别家的主人可能会请你喝茶。

由此可以看出,在某些应用场景下,我们需要对视野内相同实例进行区别标注,比如cat1,cat2,等。这时就可以用到实例分割的网络,比如本文中会介绍的DeepMask。

2 DeepMask

DeepMask网络其实实现了三个任务:前背景分割、前景语义分割与前景实例分割。这三个任务是基于同一个网络结构进行的,只是各自有单独的分支。下图是DeepMask的网络模型概况:

与大部分分割网络相同,DeepMask同样应用了VGG模型作为特征提取的主要模块,在训练中也用了ImageNet下训练得到的VGG参数初始化这一部分模型。

随后,DeepMask用两条分支来分别实现分割任务和前景目标识别任务。下面我们来具体看一下这两个分支:

(1) 分割部分

分割部分要实现的是对图块内场景的类别的识别,由一个1x1卷积层后接分类层实现。这里的分类是稠密的,也就是对每一个像素都有其对应的标注。

这里需要注意的是,为了实现实例分割,分割部分的分支必须能够看到输入图块的所有信息,从而在多个目标同时存在时判断是否属于同一个我们需要的目标。比如下图中有多头大象:

但是我们只希望标注出其中的一头:

(2) 前景Score部分

网络的第二个分支要完成的任务是,判断一个图块是否满足下面两个要求:

  • 目标位于图块的正中心附近
  • 目标完整存在于图块中(在某一尺度范围内)

这一部分由一个2x2的最大池化层,后接两个全连接层组成。最终的输出是一个目标score,用来显示该目标是否满足上面的要求。

3 训练细节

DeepMask的训练过程对于分割任务是很有借鉴意义的。这里,网络的两个分支共同训练,损失函数如下:

除了基本的分割要求,DeepMask还做了一个限定,使得在测试推理阶段,网络会尝试对所有的图块都进行分割,即使该图块中不存在目标。为了实现这个目的,其采用的策略是,对于不存在目标的图块,只训练分割分支。

下图是DeepMask的训练输入,包括图块(左图)、是否是目标(右图)和目标类型(颜色框)。

网络与VGG-A相同,接收的RGB输入尺寸为3x224x224,生成的特征尺寸为512x14x14。由于网络结构导致输出尺寸小于原始尺寸(分割分支为1/16,目标分支为1/32),因此需要应用双线性插值将结果恢复成原始尺寸。这么做的原因是考虑到网络的体量和计算量。这个设定下,DeepMask约包含75M的参数。

4 实验结果

DeepMask在MS COCO数据集下进行了测试,下图是测试结果:

这里选择的学习率为0.001,batch size为32,动量0.9,权重下降0.00005,训练需要5天左右。

下表是分割结果比较:

本专栏文章:

第一期:【图像分割模型】从FCN说起

第二期:【图像分割模型】编解码结构SegNet

第三期:【图像分割模型】感受野与分辨率的控制术—空洞卷积

第四期:【图像分割模型】快速道路场景分割—ENet

第五期:【图像分割模型】以RNN形式做CRF后处理—CRFasRNN

第六期:【图像分割模型】多感受野的金字塔结构—PSPNet

第七期:【图像分割模型】全局特征与局部特征的交响曲—ParseNet

第八期:【图像分割模型】多分辨率特征融合—RefineNet

第九期:【图像分割模型】用BRNN做分割—ReSeg

第十期:【图像分割模型】BRNN下的RGB-D分割—LSTM-CF

第十一期:【图像分割模型】实例分割模型—DeepMask

第十二期:【图像分割模型】全景分割是什么?

线性插值改变图像尺寸_【图像分割模型】实例分割模型—DeepMask相关推荐

  1. 线性插值改变图像尺寸_图像分割--gt;上采样的那些事

    在图像分割中,因为FCN的提出,上采样操作成为了分割中不可或缺的部分.上采样就是将提取到的feature map还原到原始分辨率大小的操作,但是这里要注意的是上采样不是下采样的逆过程,也就是说上采样输 ...

  2. 线性插值改变图像尺寸_数码相机的成像原理、显示屏尺寸、像素的介绍

    阅读本文前,请您先点击上面的"蓝色字体",再点击"关注",这样您就可以继续免费收到文章了.每天都会有分享,都是免费订阅,请您放心关注. 注:本文转载自网络,不代 ...

  3. 线性插值改变图像尺寸_数码图像插值算法

    插值,有时也称为"重置样本",是在不生成像素的情况下增加图像像素大小的一种方法,在周围像素色彩的基础上用数学公式计算丢失像素的色彩.插值是根据中心像素点的颜色参数模拟出周边像素值的 ...

  4. 线性插值改变图像尺寸_Photoshop从入门到精通:修改画布尺寸旋转,改变图像大小分辨率...

    修改和调整图像 一.调整画布的尺寸 画布指的是容纳文件内容的区域,是有最初建立或者打开的文件像素决定的.而改变画布的大小是从绝对尺寸上来改变的. 对于画布大小的改变,可以执行①"图像-画布大 ...

  5. 【图像分割模型】实例分割模型—DeepMask

    这是专栏<图像分割模型>的第11篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 本文介绍了用于实例分割任务的模型结构--DeepMask. 作者 | 孙叔桥 编辑 | ...

  6. PS改变图像尺寸和分辨率保存为tif图片颜色变成黑色-解决办法

    论文投稿时改变图像尺寸和分辨率将其保存为tif格式,发现图片背景变为黑色: 例如:原图在ps中打开显示为这样: 设置图片大小和分辨率后: 点击保存为: 选中格式为tif格式: tif选项选择默认不变的 ...

  7. pascal行人voc_在一个很小的Pascal VOC数据集上训练一个实例分割模型

    只使用1349张图像训练Mask-RCNN,有代码. 代码:https://github.com/kayoyin/tiny-inst-segmentation 介绍 计算机视觉的进步带来了许多有前途的 ...

  8. [深度学习概念]·实例分割模型Mask R-CNN详解

    实例分割模型Mask R-CNN详解 基础深度学习的目标检测技术演进解析 本文转载地址 Mask R-CNN是ICCV 2017的best paper,彰显了机器学习计算机视觉领域在2017年的最新成 ...

  9. 在英特尔独立显卡上部署YOLOv5 v7.0版实时实例分割模型

    作者:贾志刚 英特尔物联网创新大使 目录 1.1 YOLOv5实时实例分割模型简介 1.2 英特尔®消费级锐炫™ A 系列显卡简介 1.3  在英特尔独立显卡上部署YOLOv5-seg模型的完整流程 ...

最新文章

  1. 斯坦福2021版图机器学习课程完结,视频、PPT全放送,大神主讲
  2. python处理流程-Python异常处理大全(二)
  3. BCS和ECCS等合并系统简单对比
  4. Luogu P4709 信息传递 (群论、生成函数、多项式指数函数)
  5. 网易云信与极客邦科技联合,发起抗击疫情行动,百家企业贡献资源
  6. php删除字段某个字段,php数如何组删除某个字段
  7. FileInputStream 把文件作为字节流进行读操作
  8. HTML5和Intersection Observer的响应式图像优化简介
  9. python网址太长_python中url太长怎么解决
  10. 小学计算机辅导计划,【小学信息技术培优补差计划】_小学信息技术培优补差计划...
  11. 第二章 如何在VS2008里面编译CG
  12. 21. 面向服务的体系架构(SOA)
  13. 5.一个非常好用的扒站工具IDM
  14. 基于Linux下的Nand (Nor) Flash读写速度测试
  15. 怎么查询显卡hdmi接口版本_HDMI接口基础知识大扫盲
  16. 2019年全国大学生电子设计竞赛赛题分享与浅析
  17. 井口综合安检-解决方案
  18. 【小程序】微信小程序自定义导航栏及其封装
  19. java基于springboot+Vue+nodejs的高校网上二手闲置跳蚤市场 element
  20. c语言112页答案,沪科版七年级下册数学书答案

热门文章

  1. mysql的索引缺点_「缺点有哪些」数据库索引是什么 有什么优缺点 - seo实验室
  2. 大话存储pdf 百度网盘_学用系列|亲身体验百度网盘内测在线文档,有遗憾也有期待...
  3. angularjsl路由_HTML5模式下的AngularJS路由404错误
  4. 查看电脑wifi密码
  5. java冒泡排序_Java专题(二):Java中常见的排序算法有哪些?---冒泡排序
  6. php实现栏目三种类型,WordPress后台edit-tags.php里无限栏目分类实现
  7. python自助电影售票机_Spring Cloud版——电影售票系统六使用 Spring Cloud Config 统一管理微服务配置...
  8. 冒烟的意思_冒烟测试是什么?
  9. 计算机专业学的东西其实很少,为什么计算机专业的学生要学习使用Linux系统?...
  10. php通配符是什么,通配符*和?有什么区别