视频分割全面探究:从视频物体分割到视频全景分割
前言
图像分割大家可能都耳熟能详,近年来,图像分割的研究已经取得了显著成果,而视频分割的研究仍在起步阶段。
视频分割由简到繁可分为三类:视频物体分割、视频语义分割和视频全景分割。视频物体分割是指从视频所有图像中把感兴趣的物体区域完整的分割出来;视频语义分割则要求给视频中所有图像上的每一个像素赋予一个带有语义的标签;视频全景分割的目标是精确定位整个视频的所有语义和实例边界,并为这些分割的视频管分配正确的标签。
目前,视频分割任务主要面临两大挑战:第一,在视频序列中,随着时间的推移,视频在不断变化,光照、视角、遮挡和图像噪声等因素为视频分割带来的影响;第二,怎样将视频中的空间局部特征与时序信息相结合,在视频序列之间建立信息传播机制。因此,如何提取更有效的特征以及高效地利用时序信息成为是视频分割任务的研究重点。
研究
1、视频分割任务的研究与挑战
分割是计算机视觉领域的一个基础任务,图像分割更是被大家所熟知,而现实应用中,接触更多的是视频分割,像自动驾驶、AR、视频剪辑等。与图像分割不同,视频分割有空间信息和时序信息,而图像分割只有静态的空间信息。根据复杂程度,视频分割可分为:视频物体分割、视频语义分割和视频全景分割。
2、利用前后帧像素相似性的视频物体分割
视频物体分割有半监督视频物体分割、无监督视频物体分割和交互式视频物体分割三个子类。其中,半监督视频物体分割需要在视频序列仅有初始掩膜(mask)的情况下,分割目标物体;无监督视频物体分割是指没有初始掩膜,模型自动预测要分割的目标物体;交互式视频物体分割需要给出目标物体的简单标注,根据标注,分割出视频中对应的所有物体。下面图片讲解将围绕半监督视频物体分割和交互式视频物体分割,介绍如何利用前后帧像素相似性,获得视频中一个或多个物体获得分割结果。
3、基于长距离时序上下文信息的视频语义分割
目前,视频语义分割的数据集是比较有限的,比如Cityscapes,它的每个视频序列中只标注一帧,严格意义上说,它是图像分割的数据集,且仅关注一个场景;NYUv2只关注室内场景;CamVid包含时序信息,但标注率比较低,且规模较小,这限制了视频语义分割的发展。
VSWP数据集是最新发布的大规模室外数据集,它包括251632个pixel-level标注帧,536个视频,视频长度约为5秒,超96%的视频帧率是在720P到4K之间。这个数据集的提出,也带来了新的挑战与应用,即如何利用时序信息提升视频分割的准确性和时效性。视频语义分割的内容在苗嘉旭博士发表的CVPR 2021论文《VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild》 中有明确体现。
4、视频全景分割方法及未来展望
视频全景分割比较复杂,它不仅要给出每个pixel的类,而且对每个instance都要识别出来。目前,这方面的内容只有一篇CVPR 2020论文。 未来,针对视频物体分割的研究会集中在交互式视频物体分割和利用语言实现视频物体分割;对于视频语义分割,将会更注重利用时序信息;而视频全景分割还是一个全新的研究方向,需要我们更多的关注。
【注:以上内容参考智东西公开课公众号文章(已授权)】
视频分割全面探究:从视频物体分割到视频全景分割相关推荐
- CVPR 2020 论文大盘点-全景分割与视频目标分割篇
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 今天的内容关注于全景分割(Panoptic Segmentation)和视频目标分割(Video Ob ...
- Transformer霸榜全景分割任务,南大、港大提出一种通用框架!
来源:机器之心 本文中,来自南大.港大.英伟达等机构的研究者提出了一个使用 transformer 进行端到端全景分割的通用框架,不仅为语义分割与实例分割提供了统一的 mask 预测工作流程,而且使得 ...
- 【深度学习】Panoptic FCN:真正End-to-End的全景分割
在计算机视觉中,所有视觉可见的事物都可以描述成thing和stuff两种形式(thing指的是可数物体如人.动物.工具,stuff指的是具有相似结构或材料的非晶态区域如草.天空.道路),从而延申出了两 ...
- Panoptic SegFormer:全景分割第一名!南大港大英伟达提出新算法,霸榜全景分割...
点击下方卡片,关注3D视觉工坊公众号 3D视觉干货第一时间送达 今日分享论文『Panoptic SegFormer』全景分割第一名!由南大&港大&NVIDIA 联合提出 Panopti ...
- 全景分割相关论文写作与准备笔记
第一次写论文,把一些自己在写论文时收集的资料和阅读心得等零零碎碎记录下来.(写作方向是全景分割.) CVPR经典论文introduction写法 VPS introduction: 全景分割的起源-& ...
- 拿transformer做E2E全景分割,这个通用框架霸榜挑战赛,南大、港大联合提出
视学算法报道 机器之心编辑部 本文中,来自南大.港大.英伟达等机构的研究者提出了一个使用 transformer 进行端到端全景分割的通用框架,不仅为语义分割与实例分割提供了统一的 mask 预测工作 ...
- Panoptic SegFormer:全景分割第一名!南大港大英伟达提出新算法,霸榜全景分割
今日分享论文『Panoptic SegFormer』全景分割第一名!由南大&港大&NVIDIA 联合提出 Panoptic SegFormer,霸榜全景分割. 话不多说,先放Leadb ...
- 全景分割(Panoptic Segmentation)(CVPR 2019)
全景分割(Panoptic Segmentation)(CVPR 2019) 摘要 1. 导言 2. 相关工作 3. 全景分割格式 4. 全景分割度量 4.1 片段匹配 4.2 PQ计算 4.3 与现 ...
- SWideRNet:全景分割新标杆!
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 导读 本文是DeepLab系列作者"Liang-Chie ...
- 使用条件卷积进行实例和全景分割
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家 ...
最新文章
- TCP/IP详解--第十章
- cisco网络故障处理手册
- javascript严格模式
- 数据集制作_轻松学Pytorch自定义数据集制作与使用
- 数据结构与算法--递归(Recursion Algorithm)
- r语言去除字符串两端多余空格
- aws ssh 证书配置_在AWS Lambda中运行netflix bless ssh证书颁发机构
- 信噪比与雷达探测距离之间关系
- 恒生电子软件工程师面试
- linux bond服务是什么,linux 查看bond
- 记录问题/usr/bin/yum: /usr/bin/python: bad interpreter: No such file or directory 解决
- Linux: sd 0:0:1:0: timing out command, waited 1080s, 访问磁盘错误
- 软件工程计算机水平 推荐表,软件工程就业推荐表2014届.doc
- 租房系统源码(仅供参考)
- Android源码:2、如何下载源码详解(二)(支持移动硬盘、mac)—亲测成功
- Python内置函数——最值与求和
- Pbootcms自定义分页样式,适用于多种环境
- 如果由你来设计 12306.cn,你会怎么设计?
- 全球5G城市接近2000座,中国以356座居首,美国排第二,菲律宾第三 | 美通社头条...
- Unity 2D 游戏学习笔记(1)