https://www.toutiao.com/a6643650465147912712/

2019-01-07 15:16:54

1. 图像分割

从图像中将某个特定区域与其他部分进行分离并提取出来的处理就是图像分割。因为图像分割处理实际上就是区分图像中的“前景目标”和“背景”,所以通常又称之为图像的二值化处理。图像分割在图像分析、图像识别、图像检测等方面占有非常重要的低位。

在计算机视觉领域,图像分割(Segmentation)指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像分割通常用于定位图像中的物体和边界(线,曲线等)

更精确的,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。图像分割的结果是图像上子区域的集合(这些子区域的全体覆盖了整个图像),或是从图像中提取的轮廓线的集合(例如边缘检测)。一个子区域中的每个像素在某种特性的度量下或是由计算得出的特性都是相似的,例如颜色、亮度、纹理。邻接区域在某种特性的度量下有很大的不同。

在图像分割的处理中,其实可以将图像视作是由像素组成的有序集合,而图像分割就是将此集合按照某种规则划分出若干子集的过程。

图像分割的方法依照分割时所依据的图像特征不同,大致可以分为三大类:

1)阈值方法:这种方法是根据图像的灰度值分布特性来确定某个阈值来进行图像分割;

2)边界分割法:这种方法是通过检测出封闭某个区域的边界来进行图像分割的。通俗的讲,这类方法实际上就是沿着闭合的边缘线将其包围的区域剪切出来;

3)区域提取方法:这类方法的特点是根据特定区域与其他背景区域特性上的不同来进行图像分割。

2. 欧氏距离( Euclidean Distance)

通常我们总是习惯在相应的起点和终点之间用直线段相连, 并求取相应的直线距离, 即欧氏距离。

但是, 这种方法并非对所有的情况都有效, 当两点间的直线段有一部分不落在所考虑的区域之内时(如小船在湖泊中航行的例子), 欧氏距离对所讨论的问题实际上是没有意义的, 这就是欧距离在 空间分析过程中的局限性。其原因在于定义区域中两点间的距离时, 没有考虑到区域的连通性, 只考虑了起点和终点间的抽象距离。

3. 测地距离(Geodesic Distance)

测地距离是数学形态学中的一个重要概念,主要用于流域分割(流域又称集水区域,是指流经其中的水流和其它物质从一个公共的出水口排出从而形 成一个集中的排水区域)。

如下图一连通图形所示,A、B是其中两点,按通常欧式距离( Euclidean distance)也称欧几里得距离,它是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离)的定义,A、B间的距离应为直线段AB的长度,但是有时线段AB的一部分可能会不包括在连通图形X内,如在下图中线段AB就有一段没有包含在连通的图形中,因此这种距离有其不合理的一面。现用如下方法重新定义A、B之间的距离:由于下图是连通的,故在所给图一的连通图形中至少有一条线路可以连接A、B两点,如下图一所示,所有这些线中最短的一条称为A、B间的测地弧。测地弧的长度称为A、B间的测地距离,记为D(A-B)。

4. SIFT特征

SIFT(Scale-invariant feature transform):尺度不变特征变换,是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。

SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、微视角改变的容忍度也相当高。基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认。使用SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIFT物体特征就足以计算出位置与方位。在现今的电脑硬件速度下和小型的特征数据库条件下,辨识速度可接近即时运算。SIFT特征的信息量大,适合在海量数据库中快速准确匹配。

4.1 SIFT算法的特点

SIFT算法具有如下一些特点:

1)SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性;

2)独特性(Distinctiveness)好:信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配;

3)多量性:即使少数的几个物体也可以产生大量的SIFT特征向量;

4)高速性:经优化的SIFT匹配算法甚至可以达到实时的要求;

5)可扩展性:可以很方便的与其他形式的特征向量进行联合。

4.2 SIFT特征检测编辑

SIFT特征检测主要包括以下4个基本步骤:

1)尺度空间极值检测

搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。

2)关键点定位

在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。

3)方向确定

基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。

4)关键点描述

在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。

4.3 SIFT特征匹配

SIFT特征匹配主要包括2个阶段:

第一阶段:SIFT特征的生成,即从多幅图像中提取对尺度缩放、旋转、亮度变化无关的特征向量。

第二阶段:SIFT特征向量的匹配。

5. BOW (bag of words) 词袋模型

SIFT特征虽然也能描述一幅图像,但是每个SIFT矢量都是128维的,而且一幅图像通常都包含成百上千个SIFT矢量,在进行相似度计算时,这个计算量是非常大的,通行的做法是用聚类算法(如K-means)对这些矢量数据进行聚类,然后用聚类中的一个簇代表BOW中的一个视觉词,将同一幅图像的SIFT矢量映射到视觉词序列生成码本,这样每一幅图像只用一个码本矢量来描述,这样计算相似度时效率就大大提高了。

6. Haar-like特征

Haar-like特征:Haar特征值反映了图像的灰度变化情况。最早是由Papageorgiou等应用于人脸表示。

Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。

例如:脸部的一些特征能由矩形特征简单的描述,如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。

7. DPM特征(可变部件模型)

DPM(Deformable Part Model):可变部件模型

DPM是一个非常成功的目标检测算法,连续获得VOC(Visual Object Class)07,08,09年的检测冠军。目前已成为众多分类器、分割、人体姿态和行为分类的重要部分。2010年Pedro Felzenszwalb被VOC授予"终身成就奖"。DPM可以看做是HOG(Histogrrams of Oriented Gradients)的扩展,大体思路与HOG一致。先计算梯度方向直方图,然后用SVM(Surpport Vector Machine )训练得到物体的梯度模型(Model)。有了这样的模板就可以直接用来分类了,简单理解就是模型和目标匹配。DPM只是在模型上做了很多改进工作。

8. 计算机视觉基本任务

计算机视觉的三个基本任务:

1)对象检测(object detection)

2)对象跟踪(object tracking)

3)对象分割(object segmentation)

学习计算机视觉你需要知道这关键的八点相关推荐

  1. AI:人工智能领域主要方向(技术和应用)、与机器学习/深度学习的关系、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)

    AI:人工智能领域主要方向(技术和应用).与机器学习/深度学习的关系.数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系) 目录 人工智能主要领 ...

  2. 深度学习计算机视觉理论基础(PyTorch)

    深度学习计算机视觉理论基础(PyTorch) 1 神经网络与cv 1.1 经典的人工神经元模型:M-P 模型 1.2 感知机(Perceptron)的诞生 1.3 计算机视觉 2 深度神经网络基础 2 ...

  3. 如何具体学习计算机视觉

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:深度学习自然语言处理 导读 这两年,计算机视觉似乎火了起 ...

  4. 直播赠书丨如何高效学习计算机视觉?

    计算机视觉是人工智能的一个热门方向,很多人想要入门,但是却找不到方向. 对于初学者来说,最快的入门方法是边实践边学习,也就是要掌握计算机视觉的开发工具. 但其实对初学者来说并不太友好,主要有几个原因: ...

  5. 深度学习计算机视觉常见的29道面试题及解析

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 作者丨我要鼓励娜扎@知乎 来源丨https://zhuanlan.zhihu.com/p/89 ...

  6. AI:一个20年程序猿的学习资料大全—人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛——只有你不想要的,没有你找不到的

    AI:一个20年程序猿的学习资料大全-人工智能之AI/机器学习/深度学习/计算机视觉/Matlab大赛--只有你不想要的,没有你找不到的 目录 (有偿提供,替朋友转载,扫描下方二维码提问,或者向博主扫 ...

  7. 【百家稷学】深度学习计算机视觉生产实习(山西农业大学暑期实训)

    继续咱们百家稷学专题,本次是有三AI在山西农业大学开设的为期10天的正式暑期专业课程.百家稷学专题的目标,是走进100所高校和企业进行学习与分享. 本次主题 本次实训是在山西农业大学进行,主题是< ...

  8. 【直播课】有三AI直播答疑服务上线,如何学习计算机视觉与准备面试直播限时免费...

    2021年工作正式开启了,今年我们开启一个重要服务,即有三AI技术团队直播答疑服务,今年的目标是举办100场以上的直播,每周都会有1-3次固定的时间.固定的主题答疑,下面是关于该服务的具体细节介绍. ...

  9. 【直播】如何学习计算机视觉各大方向,言有三6大直播集中上线

    有三AI专注于AI领域原创知识的分享,尤其是在深度学习与计算机视觉领域输出了大量的免费和付费内容,其中免费内容以公众号的各类技术专栏为代表,而付费内容以有三AI的CV季划为代表,本周末白天和晚上我们将 ...

最新文章

  1. java使用数据库连接池连接MySQL/MariaDB--DBCP2
  2. anaconda切换python版本及对应环境,太方便
  3. Xcode:dyld: Library not loaded: @rpath/libswiftAVFoundation.dylib
  4. Cypress 等待某个 HTTP put 请求得到 200 状态码后,再执行下一步的操作代码
  5. php遍历一个目录 并重命名
  6. IntelliJ idea学习资源
  7. fpgrowth算法实战 mlib_【spark】41.Spark Mlib:FPGrowth算法
  8. java 动态加载控件_JS动态添加节点后渲染为EasyUI控件,EasyUI动态渲染解析解决方案...
  9. vsftp 具体操作
  10. javascript之BOM对象总结
  11. laravel项目安装与重要目录文件说明(一)
  12. 计算机不觉晓,人工智能知多少
  13. ZZULIOJ.1137: 查找最大元素
  14. 2017 上海车牌(沪牌)标书购买攻略
  15. 嵌入式工程师必备开发工具
  16. JS 0.1+0.2的理解
  17. pychram+python 看源码: 按住crtl,点击函数
  18. 2017年年终总结 韩俊强的博客
  19. 600岁的故宫,已经越来越飘了!
  20. linux wine运行效率,Linux 使用 Wine 运行 TIM 简明教程

热门文章

  1. 使用Harry过程中FAQ(问题解答)
  2. 直播|俄勒冈州立大学李伏欣:从热点图到对深度网络的结构化解释
  3. 5.29 相约杭州!云原生 Meetup 第二期杭州站报名开启!
  4. 书评 | 如何让开发中的各种文档变活?《活文档》阅读总结
  5. 用《R数据科学》学习一套数据处理语法
  6. 【连载】高效程序员的45 个习惯(不断更新中。。。)
  7. 生成对抗网络(GAN)的理论与应用完整入门介绍
  8. OpenCV Python教程(2、图像元素的访问、通道分离与合并)
  9. AlphaCode到底强在哪儿?清华博士后十分钟视频详细解析
  10. Yoshua:深度学习AI迈向人类水平的挑战(附PPT下载)