摘要: 一份关于语义分割的基本概述,涵盖语义分割的特征和可能的用途,包括地质检测、自动驾驶、面部识别等。

近年来,以深度学习为中心的机器学习技术引起了人们的关注。比如自动驾驶汽车已经逐渐成为可能,但在整个深度学习过程,需要算法识别和学习作为原始数据提供的图像,在这一过程中,应用到了语义分割技术。下面让我们来看看语义分割的需求是如何演变的。

早期,计算机视觉的初始应用需求只是识别基本元素,例如边缘(线和曲线)或渐变。然而,仅仅通过全像素语义分割的创造来理解像素级的图像,它将属于同一目标的图像部分聚集在一起,从而扩展了语义分割的应用场景。

识别每个像素或分组像素一起分配类别的过程可以通过以下过程:

图像分类(image classification)——识别图像中存在的内容;

物体识别和检测(object recognition and detection)——识别图像中存在的内容和位置(通过边界框);

语义分割(semantic segmentation) ——识别图像中存在的内容以及位置(通过查找属于它的所有像素)

下面进入本文的主要内容:

什么是语义分割?

语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(例如,平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。许多人使用术语全像素语义分割(full-pixel semantic segmentation),其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。

早期的计算机视觉问题只发现边缘(线条和曲线)或渐变等元素,但它们从未完全按照人类感知的方式提供像素级别的图像理解。语义分割将属于同一目标的图像部分聚集在一起来解决这个问题,从而扩展了其应用领域。

注意,与其他基于图像的任务相比,语义分割是完全不同的且先进的,例如,

图像分类:识别图像中存在的内容。

物体识别和检测 :识别图像中的内容和位置(通过边界框)。

语义分割: 识别图像中存在的内容以及位置(通过查找属于它的所有像素)。

你设计的机器学习模型是否需要识别输入原始平面图像中的每个像素?在这种情况下,全像素语义分割标注是机器学习模型的关键。全像素语义分割根据其所属的感兴趣对象分配图像中的每个像素具有的类别ID。

下面定义语义分割的类型,以便更好地理解其相关概念。

语义分割的类型

标准语义分割(standard semantic segmentation)也称为全像素语义分割,它是将每个像素分类为属于对象类的过程;

实例感知语义分割(instance aware semanticsegmentation)是标准语义分割或全像素语义分割的子类型,它将每个像素分类为属于对象类以及该类的实体ID。

下面探索语义分割的一些应用领域,以便更好地理解这种过程的需要。

语义分割的特征

为了理解图像分割的特征,我们还要与其他常见的图像分类技术相比较。

这一次将介绍以下三类技术领域,包括图像分割:

1)图像分类:识别图像是什么;

2)图像检测和识别:识别图像中的位置;

3)图像分割:理解图像的意义;

1.图像分类

这类技术主要是识别图像。例如,例如分类数字手写体,例如“手写一个数字,这个数字是0~9中的哪一个数字”。最初从亚马逊发布的Amazon Rekognition也属于此图像分类,需要反区分“杯子、智能手机和瓶子”等,但现在,亚马逊Rekognition已经将杯子和咖啡杯作为整个图像的标签,这样处理后,它将不能用于分类图像中有多个物体的场景。在这种情况下,应该将使用“图像检测”技术。

2.图像检测

这类技术主要是识别图像中“有什么”和“它在哪里”。

3.图像分割

这类技术主要是识别图像区域。称为语义分割的图像分割标记由每个像素的像素指示的含义,而不是检测整个图像或图像的一部分。

下面,让我们看看语义分割具体的使用例子:

语义分割的应用

1.地质检测——土地使用

语义分割问题也可以被认为是分类问题,其中每个像素被分类为来自一系列对象类中的某一个。因此一个使用案例是利用土地的卫星影像制图。土地覆盖信息是重要的各种应用,如监测地区的森林砍伐和城市化等。

为了识别卫星图像上每个像素的土地覆盖类型(例如,城市、农业、水等区域),土地覆盖分类可以被视为多级语义分割任务。道路和建筑物检测也是交通管理,城市规划和道路监测的重要研究课题。

目前,几乎没有大规模公开可用的数据集(例如:SpaceNet),数据标记始终是分割任务的瓶颈。

2.用于自动驾驶

自动驾驶是一项复杂的机器人任务,需要在不断变化的环境中进行感知、规划和执行。由于其安全性至关重要,因此还需要以最高精度执行此任务。语义分割提供有关道路上自由空间的信息,以及检测车道标记和交通标志等信息。

3.用于面部分割

面部的语义分割通常涉及诸如皮肤、头发、眼睛、鼻子、嘴巴和背景等的分类。面部分割在计算机视觉的许多面部应用中是有用的,例如性别、表情、年龄和种族的估计。影响人脸分割数据集和模型开发的显著因素是光照条件、面部表情、面部朝向、遮挡和图像分辨率的变化等。

4.时尚——分类服装

由于服装数量众多,服装解析与其他服务相比是一项非常复杂的任务。这与一般的物体或场景分割问题不同,因为细粒度的衣物分类需要基于衣服的语义、人体姿势的可变性和潜在的大量类别的更高级别判断。服装解析在视觉领域中得到了积极的研究,因为它在现实世界的应用程序即电子商务中具有巨大的价值。Fashionista和CFPD数据集等一些公开的数据集促进了服装领域的语义分割研究。

5.精准农业

精确农业机器人可以减少需要在田间喷洒的除草剂的数量,作物和杂草的语义分割可以帮助他们实时触发除草行为,这种先进的农业图像视觉技术可以减少对农业的人工监测,提高农业效率和降低生产成本。

本文作者:【方向】

本文为云栖社区原创内容,未经允许不得转载。

场景解析和语义分割区别_语义分割概念及应用介绍相关推荐

  1. 场景解析和语义分割区别_精准安防场景理解及语义分割

    原标题:精准安防场景理解及语义分割 前20位报名的朋友,可以立减200元学费 第21-50位报名的朋友,可以立减100元学费 课程简介: 继人脸识别之后,场景理解和语义分割正在成为人工智能的下一个风口 ...

  2. java split 分割字符串_字符串分割--java中String.split()用法

    在java.lang包中有String.split()方法,返回是一个数组. 一. "."和"|"都是转义字符,必须得加"\\"; 若是用& ...

  3. ECCV 2020 论文大盘点-场景解析篇

    场景解析是一种特殊的语义分割,对整幅场景图像进行语义像素标注,典型应用是自动驾驶领域的道路环境的语义分割. 本文盘点 ECCV 2020 中所有场景解析(Scene Parsing)相关的3篇论文. ...

  4. 超强语义分割算法!基于语义流的快速而准确的场景解析

    论文地址:https://arxiv.org/abs/2002.10120 代码地址:https://github.com/donnyyou/torchcv 该论文提出了一种有效且快速的场景解析方法. ...

  5. 道路场景语义分割综述_王飞龙

    挖坑:暂时还没有理解的定义或者方法,但因为暂时不重要留到后面看 论文结构 一.引言 1.道路场景语义分割定义 针对道路场景进行语义分割是对采集到的道路场景图像中的每个像素都划分到对应的类别,实现道路场 ...

  6. 制作自己的segnet数据集_语义分割【论文解读】经典网络SegNet 值得仔细反复阅读...

    摘要: 提出了一种新颖而实用的深度全卷积神经网络结构用于语义像素分割称为SegNet.这个核心的可训练分割引擎包括一个编码器网络,一个相应的解码器网络,以及一个像素级的分类层.编码器网络的架构与VGG ...

  7. ECCV2020 oral | 基于语义流的快速而准确的场景解析

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 论文地址:https://arxiv.org/abs/2002.10120 代码地址:https:// ...

  8. camvid数据集介绍_语义分割的数据集

    背景 语义分割指的是把图像中的每个像素都划分到某一个类别上. 实现算法上,有传统时代的grab cut.ML时代的TextonForest.DL时代的FCN .SegNet .Dilated Conv ...

  9. ECCV 2020 oral | 基于语义流的快速而准确的场景解析,在Cityscapes上达到80.4%mIoU,26 FPS...

    论文地址: https://arxiv.org/abs/2002.10120 代码地址: https://github.com/donnyyou/torchcv 该论文提出了一种有效且快速的场景解析方 ...

最新文章

  1. adb 连接不上电脑怎么办?
  2. spring IOC和DI
  3. mysql中的merge into,SQL Server 2008中利用merge into关键实现insert/update自动匹配(类似于MySQL中的For Update关键字)...
  4. 50道mysql笔试题目及答案_50道SQL练习题及答案与详细分析!!!
  5. 利用Cydia Substrate进行Android HOOK (1)
  6. 启明云端分享| 小明实测优化后的ESP32-S2点 3.92寸分辨率为320*320的彩屏刷新帧率
  7. tomcat 轮询_用Spring长轮询Tomcat
  8. Android中的webview详细使用
  9. php安装redis扩展模块,[教程]为PHP安装phpRedis扩展模块
  10. php是什么电荷,科学网—蛋白质的表面静电势、ζ-电位和表面电荷 - 朱俊向的博文...
  11. vim 全局替换_高效操作:vim 快速删除空行和注释
  12. Xbox360游戏收藏
  13. 手游php,PHP响应式手游APP软件游戏中心下载网站整站源码(自适应手机移动端) dedecms内核...
  14. h5学习笔记:写一个小表格
  15. 二调建设用地地类代码_二调地类代码表[1]
  16. SUDA歌单管理软件,支持Spotify\Tidal\QQ\网易云导入导出歌单
  17. CY2荧光染料,Cy2@NHS酯基本染料,Cy2DIGE NHS ester的物化性质及光谱特性
  18. 测试2年6.5K,每天“911”,我的心酸经历只有我自己知道···
  19. POI读取Excel 各种特殊数字和类型的转换
  20. 好心情:跌落凡间的星星天使,爱终将弥补一切

热门文章

  1. mount 挂载 img
  2. 第十四次CCF CSP认证心得
  3. uniapp页面导出pdf
  4. paddleocr学习笔记(一)从官网开始
  5. 学堂在线-清华大学-操作系统实验Lab1【练习5-6】
  6. 【QTdesigner】课时37.按钮控件(QPushButton)【pyqt5+QTdesigner模式】
  7. 程序员十二星座行为大赏
  8. 国外问卷调查,一个不错的网上兼职项目
  9. 【HTML5初涉】H5与H4的区别
  10. map和multimap的用法详解