点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

我们提出了一个简单而有效的框架,用于实例和全景分割,称为CondInst(条件卷积的实例和全景分割)。在文献中,最优秀的实例分割方法通常遵循Mask R-CNN范式,并依赖ROI操作(通常是ROIAlign)来处理每个实例。相反,我们建议使用动态条件卷积处理实例。我们不是使用实例明智的roi作为固定权重的实例掩码头的输入,而是设计动态的实例感知掩码头,以要预测的实例为条件。CondInst有三个优点:实例和全景分割被统一到一个完全卷积的网络中,消除了对ROI的裁剪和特征对齐的需要。2)。消除ROI裁剪也显著提高了输出实例掩模的分辨率。3)。由于动态生成的条件分布的能力大大提高,面具头非常紧凑(如3 conv.层,每个只有8频道),导致更快推理每个实例,使整体推理时间几乎不变,与实例的数量无关。我们演示了一种更简单的方法,可以在实例和全景分割任务上实现更高的精度和推理速度。在COCO数据集上,我们优于一些最先进的方法。我们希望CondInst可以成为一个强大的基线,例如全景分割。

代码链接:https://git.io/AdelaiDet

论文创新点

我们将我们的主要贡献总结如下。

  • 我们尝试从一个新的角度来解决实例分割问题,即使用动态掩模头。与现有的Mask R-CNN等方法相比,这一新的解决方案获得了更好的实例分割性能。据我们所知,这是第一次一个新的实例分割框架在精度和速度上超过了最近的国家最先进的水平。

  • CondInst是完全卷积的,并且避免了前面提到的许多现有方法中使用的调整大小操作,因为CondInst不依赖于ROI操作。不需要调整特征地图的大小,就可以得到具有更精确边缘的高分辨率实例掩码。

  • 由于CondInst中的掩码头非常紧凑,与box检测器FCOS相比,CondInst只需要10%的计算时间就可以获得掩码结果,即使在处理每张图像的最大实例数(即100个实例)时也是如此。总的推断时间也是稳定的,因为它不依赖于映像中的实例数量。

  • 通过额外的语义分割分支,CondInst可以很容易地扩展到全景分割,从而为实例和全景分割任务生成统一的全卷积网络。

  • CondInst实现了最先进的性能,在实例和全景分割任务,同时是快速和简单的。我们希望CondInst能够成为实例和全景分割任务以及其他实例级识别任务(如关键点检测)的强大替代方案。

框架结构

CondInst的整体架构。C3、C4、C5为骨干网(如ResNet-50)的特征图。P3到P7是FPN的特征映射,如[26],[43]。Fbottom为底部分支s的输出,其分辨率与P3相同。在[6]之后,底部的分支聚合了功能映射P3、P4和P5。Fbottom是通过连接相对坐标到Fbottom得到的。分类头预测目标实例在位置(x, y)处的分类概率px,y,与FCOS相同。控制器为实例生成掩模头的滤波器参数θx,y。与FCOS类似,也有与控制器并行的中心度和盒头(为了简单起见,图中没有显示)。注意,虚线框中的头重复应用于P3···P7。蒙版头部是实例感知的,在F底部的应用次数为图像中实例数的多少。

通过附加一个语义分割分支来实现全景分割的CondInst插图。语义分割分支在[22]之后。从实例分割和分割的结果分割分支结合在一起使用相同的后处理在[23]。

实验结果

城市景观的定性结果。值得注意的是,CondInst可以很好地歪曲细节(最好在屏幕上观看)。

在COCO数据集上的全景分割结果(在屏幕上看得更好)。颜色编码类别和实例。正如我们所看到的,CondInst表现得很好。

实验结果

我们提出了一个新的和简单的实例分割框架,称为CondInst。与之前的Mask R-CNN等方法不同,前者使用固定权重的掩码头,将掩码头限定在实例上,并动态生成掩码头的过滤器。这不仅减少了掩模头的参数和计算复杂度,而且消除了ROI操作,从而得到了一个更快、更简单的实例分割框架。据我们所知,CondInst是第一个框架,可以在准确性和速度上超过Mask R-CNN,无需更长的训练时间表。我们相信CondInst可以成为一个新的强大的替代屏蔽R-CNN实例分割。

论文链接:https://arxiv.org/pdf/2102.03026.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

使用条件卷积进行实例和全景分割相关推荐

  1. ECCV 2020 Oral | 沈春华团队新作,将条件卷积引入实例分割

    2020-07-18 01:26:06 本文解读的是ECCV 2020 Oral 论文<Conditional Convolutions for Instance Segmentation> ...

  2. ECCV 2020 oral | CondInst:沈春华团队新作,将条件卷积引入实例分割

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 这是沈春华团队在实例分割领域的又一力作,被收录于ECCV2020 oral. 论文地址:https:/ ...

  3. ECCV 2020 实例分割+全景分割论文大盘点(14篇论文)

    前言 计算机视觉Daily 正式系列整理 ECCV 2020的大盘点工作,本文为第三篇:实例分割和全景分割方向. 前两篇详见: ECCV 2020 目标检测论文大盘点(49篇论文) ECCV 2020 ...

  4. 一文尽览!弱监督语义/实例/全景分割全面调研(2022最新综述)

    后台回复[ECCV2022]获取ECCV2022所有自动驾驶方向论文! 论文链接:https://arxiv.org/pdf/2207.01223.pdf 汽车人的碎碎念 分割,作为最基础的视觉感知任 ...

  5. Facebook AI新架构:全景FPN,同时完成图像实例与语义分割 | 极客头条

    参加「CTA 核心技术及应用峰会」,请扫码报名 ↑↑↑ 整理 | 刘旭坤.Jane 出品 | AI科技大本营(id:rgznai100) 实例分割和语义分割长期以来都是运用不同的神经网络架构来完成的, ...

  6. Facebook人工智能实验室提出「全景分割」,实现实例分割和语义分割的统一

    原文来源:arxiv 作者:Alexander Kirillov.Kaiming He1.Ross Girshick.Carsten Rother.Piotr Dollar 「雷克世界」编译:嗯~阿童 ...

  7. 图像分类、目标检测、语义分割、实例分割和全景分割的区别

    1.Image Classification(图像分类) 图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person).羊(sheep).狗(dog)和猫(cat)四种,图 ...

  8. 速度提升一倍,无需实例掩码预测即可实现全景分割

    点击我爱计算机视觉标星,更快获取CVML新技术 本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载. 选自arXiv 作者:Daan de Geus等 机器之心编译 参 ...

  9. 港中文旷视提出PanopticFCN:用于全景分割的全卷积网络

    表现SOTA!性能优于Panoptic-DeepLab.AdaptIS和PCV等网络,代码现已开源! 注1:文末附[计算机视觉细分垂直方向]交流群(含检测.分割.跟踪.医疗.GAN.Transform ...

最新文章

  1. Java魔法堂:深入正则表达式API
  2. linux配环境,一个操作系统的实现linux下环境搭配
  3. ML之FE:数据处理—特征工程的简介、使用方法、案例应用之详细攻略
  4. `Caused by: java.lang.ClassNotFoundException: javax.xml.bind.DatatypeConverter
  5. spring 登录提示 Bad credentials
  6. 界面原型设计工具Balsamiq、墨刀、Axure、Mockplus
  7. 第61课 查分程序 《小学生C++趣味编程》
  8. android ratingbar星星显示
  9. 这个沙盒游戏建立在数字时代,你能通关吗?
  10. 开课吧python小课学了有用吗-Python学得好,升职加薪下班早
  11. 用金蝶kis记账王批量审核会计凭证的方法
  12. 【回归预测】基于matlab Logistic混沌映射改进的麻雀搜索算法优化BP神经网络回归预测【含Matlab源码 1552期】
  13. 数学4如何用计算机画正切函数图像,《正切函数的图像与性质》示范公开课教学设计【高中数学必修4(北师大版)】.doc...
  14. 地理图例大全整理初中
  15. Spring 事务和事务传播机制
  16. 图片像素低,图片模糊怎么变清晰?
  17. 计算机主机hdmi接口是什么意思,hdmi接口有什么用,教您电脑hdmi接口有什么用
  18. php input type属性,input标签是什么?input标签属性有哪些
  19. 取消计算机触摸板,笔记本电脑触摸板,教您笔记本电脑触摸板怎么关闭
  20. mac安装pillow

热门文章

  1. TIOBE 5 月编程语言排行榜:Python、C++竞争白热化,Objective-C已沦为小众语言
  2. Go开发者路线图2019,请收下这份指南
  3. 程序员拯救乐坛?OpenAI用“逆天”GPT2.0搞了个AI音乐生成器
  4. 代码测试意味着完全消灭了Bug?
  5. 人工智能灵魂注入,燃烧你的卡路里——2018,你AI了吗!?
  6. AI如何落地企业?UCloud三步走战略:Build,Train,Deploy
  7. 如何成为一名对话系统工程师
  8. 顶配版阿里大佬面试笔记+300道硬核面试题,跪着啃完了。。。。
  9. 5分钟实现SpringBoot整合Dubbo构建分布式服务
  10. 必须要掌握的 InterruptedException 异常处理