【实例分割】cvpr2021_Look Closer to Segment Better
文章目录
- 一、背景
- 二、动机
- 三、方法
- 3.1 Boundary Patch Extraction
- 3.2 Boundary Patch Refinement
- 3.3 Learning and Inference
- 四、实验
Paper: https://arxiv.org/abs/2104.05239
Code: https://github.com/tinyalpha/BPR
一、背景
实例分割:
- 给图片中的每个目标生成一个带有类别信息的 pixel-wise 的 mask
- 目前比较流行的是 Mask RCNN 系列,也就是使用 Faster-RCNN 检测目标,然后使用 mask 分支来对box内部进行二类别的分割。
现有的实例分割的mask的质量仍然不尽如人意(图1左),边界很粗糙,而且没有对齐目标边界。原因主要有两个
- 特征图的分辨率太小,mask rcnn 的是 28x28,[38][43]的是输入图像的1/4,导致细小的边界都消失了,预测出来的都是粗糙或不明确的。
- 边界像素所占的比例太少,少于 1% [18],而且本来就很难分类,所以,同等的看待所有的pixels可能会导致优化偏向于目标内部区域,边界区域效果较差。
如果能提升目标边界附近的效果,那么可以较大的提升实例分割的效果。
作者做了一个上限实验,在边界附近特定距离时(1px/2px/3px),使用真实的标签来代替预测的结果,AP 有较大的提升。
二、动机
现有方法中,也有很多通过引入边界分支来提升对边界分割的效果,但这些也依赖于对边缘的准确预测,作者认为实例的边界预测和实例分割的复杂度是不相上下的。
受启发于分割真值的标注,标注人员在标注局部细小边界时,需要放大原图进行标注,在标注大边缘时,不需要放大即可标注。
故本文提出了一个在概念上很简单,但很有效的方法:crop-then-refine。
- 得到一个粗糙的mask后,首先沿着 boundaries 抽取一系列的子块
- 将mask的patch和抽取出来的boundaries patch进行concat,共同送入 refinement 网络(BPR, boundary patch refinement)。
上述方法可以解决:
- 1、小的patch就可以保存高分辨率
- 2、小的patch中的边界像素占比会提升,缓解之前的极度不平衡
三、方法
3.1 Boundary Patch Extraction
作者使用 sliding window 的方法提取边界 patch,即以边界为中心,密集的生成正方形框,然后使用 NMS 滤掉部分框
3.2 Boundary Patch Refinement
Mask Patch:
Boundary Patch Refinement Network:
该网络的目的是实现对每个 boundary patch 的二类分割,只要使用任意一个语义分割网络,实现输入4路(RGB+1 binary mask patch),输出2类即可。
作者选择了 HRNetV2 来作为 refinenet,可以保证高分辨率的保持。
Reassembling: refine 之后,使用这些patch来代替没有refine之前的patch,对于重叠的相邻区域,对其取均值后,使用阈值判断,如果大于0.5则判断为前景,否则判断为背景。
3.3 Learning and Inference
训练时,作者仅仅抽取那些预测的mask和gt的iou大于0.5的实例的boundary patch。但所有预测的实例在 inference 阶段都会保留。
模型输出是被从 gt 中提取出的 mask patch 监督的,之后做逐点的二分类cross-entropy损失。
训练时,作者的 NMS 阈值设置为 0.25,inference 时会根据速度的需要来选择不同的阈值。
四、实验
经过消融实验后,作者使用如下的超参数:
使用mask patch
boundary patch 抠图大小为 64x64,且无 padding
送入 refinement network 的patch被resize为 256x256的效果最好
NMS:0.55时取得了好的效果
【实例分割】cvpr2021_Look Closer to Segment Better相关推荐
- “先粗后精”的实例分割,BPR:使用Crop-then-Refine的性能提高方法
题目:Look Closer to Segment Better:Boundary Patch Refinement for Instance Segmentation 论文:https://arxi ...
- CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)
CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020) 目标检测:FCOS(CVPR 2019) 目标检测算法FCOS(FCOS: ...
- 何恺明团队推出Mask^X R-CNN,将实例分割扩展到3000类
翻译 | AI科技大本营(ID:rgznai100) 参与 | shawn,刘畅 今年10月,何恺明的论文"Mask R-CNN"摘下ICCV 2017的最佳论文奖(Best Pa ...
- 【每周CV论文】初学实例分割需要读哪些文章?
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 实例分割(Instance Segmenta ...
- 【图像分割模型】实例分割模型—DeepMask
这是专栏<图像分割模型>的第11篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 本文介绍了用于实例分割任务的模型结构--DeepMask. 作者 | 孙叔桥 编辑 | ...
- 实例分割:MaskXRCnn 与Visual Genome数据集
一.VG数据集 机器学习领域的突破突然让计算机获得了以未曾有的高精度识别图像中物体的能力--几乎达到了让人惊恐的程度.现在的问题是机器是否还能更上层楼,学会理解这些图片中所发生的事件. Visual ...
- 语义分割和实例分割_一文读懂语义分割与实例分割
以人工智能为导向的现代计算机视觉技术,在过去的十年中发生了巨大的变化.今天,它被广泛用于图像分类.人脸识别.物体检测.视频分析以及机器人及自动驾驶汽车中的图像处理等领域.图像分割技术是目前预测图像领域 ...
- 线性插值改变图像尺寸_【图像分割模型】实例分割模型—DeepMask
这是专栏<图像分割模型>的第11篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 本文介绍了用于实例分割任务的模型结构--DeepMask. 作者 | 孙叔桥 编辑 | ...
- 在英特尔独立显卡上部署YOLOv5 v7.0版实时实例分割模型
作者:贾志刚 英特尔物联网创新大使 目录 1.1 YOLOv5实时实例分割模型简介 1.2 英特尔®消费级锐炫™ A 系列显卡简介 1.3 在英特尔独立显卡上部署YOLOv5-seg模型的完整流程 ...
最新文章
- react问答 项目开发
- 短信认证方案,用手机短信进行上网认证如何实现?
- 阿里云交通数据中台解决方案打造“数字化生产力”
- 多线程:CopyOnWriteArrayList
- 使java代码更干净_java如何使用Lombok更优雅地编码
- LVM 的创建,扩展,缩减及建立快照
- 高科技公司的 CEO 要写代码吗?
- 巴伦变压器电路图_一文看懂巴伦(功能原理、性能参数、基本类型)
- word文档左下方竟然出现无法删除的小横线???
- Linux学习之安装配置VM虚拟机
- PT站的做种和魔力值是如何增加换算的?
- php百度编辑器demo,百度编辑器 Laravel Ueditor | 码农软件 - 码农网
- 数据库mongodb效率测试
- Windows系统目录及常用快捷键
- 什么是黑盒测试和白盒测试、灰盒测试?
- 很多年之后,我才知道关于互联网营销的很多说法都是无稽之谈
- 安卓键盘加上数字_安卓键盘键值对照表
- bash(CVE-2014-6271) shellshock-破壳漏洞复现
- [MM32生态]EVB-L0136开发学习分享
- 无需开通网银---银联快捷支付
热门文章
- fixed在微信下的BUG
- Django学习(第四天:ORMModel)
- centos6.4 源码安装mysql5.5
- Hadoop详细配置
- Linux下百度云盘报 获取bdstoken失败
- 花鱼儿家的家常小菜~~~~~~丁香鱼炒花菜
- [C++基础]032_常用的字符串处理函数(strcat,strcpy,strcmp,strupr,strlwr,strlen)...
- dedecms在linux主机下的一个奇怪错误
- 浏览器兼容性问题解决方案· 总结
- linux的ftp下载假死,记一次commons-net FTP上传下载卡死