文章目录

  • 数字图像基础
    • 1. 基本概念
    • 2. 视觉感知要素
      • 2.1 人眼结构中的成像要素
      • 2.2 人眼成像的参考意义
    • 3. 图像的获取、取样、量化
      • 3.1 图像的感知和获取
      • 3.2 图像取样和量化
        • 3.2.1 数字图像表示
        • 3.2.2 空间和灰度级分辨率
        • 3.2.3 放大和收缩数字图像
    • 4. 像素间的基本关系
      • 4.1 相邻像素
      • 4.2 邻接性、连通性、区域和边界
      • 4.3 距离度量
  • 总结

数字图像基础

1. 基本概念

取样:数字化坐标值。
量化:数字化幅度值。

k比特图像:一副数字图像的灰度级为2^k。

动态范围:系统中最大可度量灰度与最小可检测灰度之比。
饱和度:超过这个值的灰度级将被减掉的一个最高值。
对比度:最高和最低灰度级间的灰度差。

空间分辨率是图像中可辨别的最小细节的度量。

线对:假设有一幅宽度为W的垂直线的图,在线间还有宽度为W的线。线 对就是由这样的两条线组成的,其宽度为2W,并且每单位距离有1/2W对线。
图像分辨率:单位距离内可分辨的最大线对数量。

灰度级分辨率:在灰度级别中可分辨的最小变化,指用于量化灰度的比特数。

内插:用已知数据来估计未知位置的数值的处理。

邻接:像素的相邻仅说明了两个像素在位置上的关系,若再加上取值相同或相近,则称两个像素邻接。
通路:从具有坐标(x, y)的像素p到具有坐标(s, t)的像素q的通路是特定像素序列,其坐标为(x0, y0), (x1, y1), ···, (xn, yn)。其中(x0, y0) = (x, y), (xn. yn) = (s, t),且像素(xi, yi)和(x i-1, y i-1)是邻接的。这种情况下,n是通路的长度。

连通性:若S是图像中的一个像素子集,对任意的p, q∈S,如果存在一条由S中像素组成的从p到q的通路,则称p在图像集S中与q连通,连通也分为4连通和8连通。
区域:R是图像的像素子集,若R是连通集,则R为一个区域。
边界:一个区域的边缘或轮廓线。

2. 视觉感知要素

虽然数字图像处理是建立在数学和概率统计表示法的基础上的,但人的感知也起着很大的作用。

2.1 人眼结构中的成像要素

当人类眼球适当的聚焦时,来自眼睛外部的光在视网膜上成像。在视网膜表面分布的分离光接收器提供了图案视觉。

 这种光接收器分为两类:锥状体和杆状体。锥状体提供亮视觉,对光线敏感,还具有一定的颜色感知能力。杆状体提供暗视觉,没有色彩感觉,对低照明度敏感。

2.2 人眼成像的参考意义

我们将晶状体看成一个具有自适应调节能力得到凸透镜,故人眼的成像模型可以用来描述照相机等图像采集设备的成像。

 在我们实际图像处理的应用中,也可以用人眼成像的模型来计算所观测的目标在照相机上成像的高度,可以利用此来计算照相机拍到的图像对于原始场景有着怎样的物理意义上的分辨率。

人的视觉系统能够适应的光强度级别范围是很宽的。从夜视阈值到强闪光约有10^10量级。

 但人的视觉绝对不能同时在整个范围内工作(不能同时对很强和很弱的光产生视觉),确切的说,它是利用改变视网膜上的接收器(锥状体和杆状体)的灵敏度来完成的,即亮度适应现象。

人体视觉系统对亮度的感知并不是简单的强度函数。

 例如马赫带现象和同时对比现象。

我们感受到的可见光的彩色范围占电磁波的一小部分。

 在原理上,如果可以开发出一种传感器,它可以检测由一种电磁波谱发射的能量,就可以在那一波段上对感兴趣的事件成像。

3. 图像的获取、取样、量化

3.1 图像的感知和获取

我们感兴趣的各类图像都是由“照射”源和形成图像得到“场景”元素对光能的反射或吸收相结合而产生的。

简单的图像形成模型:用二维函数形式f(x, y)表示图像,在特定的坐标(x, y)处,f的值或幅度是一个正的标量,其物理意义由图像源决定。

 当一幅图像从物理过程产生时,它的值正比于物理源的辐射能量。因此,f(x, y)一定是非零和有限的,即:0 < f(x, y) < ∞

函数f(x, y)可由两个分量来表征:
(1)入射到观察场景的光源总量,即入射分量i(x, y);
(2)场景中物体反射光的总量,即反射分量r(x, y);

 两个函数合并后形成f(x, y):f(x, y) = i(x, y) r(x, y)0 < i(x, y) < ∞, 0 < r(x, y) < 1注:i(x, y)在物理意义上表示一个圆,r(x, y)在物理意义上也不会出现完全的反射,故限制在0(全吸收)和1(全反射)之间。

3.2 图像取样和量化

一幅连续图像的x和y坐标及幅度可能都是连续的,为了把它转换为数字图像,必须在坐标和幅度上都做数字化操作,即取样和量化。

取样和量化的结果是一个实际矩阵。我们可以用矩阵形式表示一幅数字图像,也可以用变量和幅值都是整数的二维函数表示。

3.2.1 数字图像表示

我们把一个数字图像取样为二维阵列时,该阵列包含有M行N列。

 数字化过程对M和N除了必须取整数外没有其他要求。然而出于处理、存储和取样的硬件考虑,灰度值典型的取值是2的整数次幂。对于一副大小为M * N,灰度级L = 2^k的数字图像,所需存储空间为b = M * N * k。即每个像素的灰度级为2^k,则有k比特空间,共M * N个像素点,故所需空间b的计算如上。

同时需要注意的是,数字图像的原点位于左上角,其中正x轴向下延伸,正y轴向右延伸。此种表示基于如下事实:

  • 许多图像显示扫描都是从左上角开始的,然后一次向下移动一行。
  • 矩阵的第一个元素按惯例应在阵列的左上角,因此将f(x, y)的原点选择在左上角数学上行得通。

3.2.2 空间和灰度级分辨率

取样值是决定一幅图像空间分辨率的主要参数。基本上,空间分辨率是图像中可辨别的最小细节。我们在这里讨论线对,就是为了说明反映原始场景中细节的能力。

 举例来说,我们对一个场景成像,假设图像1mm有100个线对,即1mm中有一百根黑线,还有100根在黑线之间的白线,若要判断我们对场景的成像能反映其中的100条线对,那就要根据成像模型来计算。意味着1mm成像的话就要取样出200个像素,才能取样出原场景中的100个线对,即每一个线对要取样一个白色像素和一个黑色像素。

灰度级分辨率是一个相当主观的一个过程。
当没有必要对涉及像素的物理分辨率进行实际度量和在原始场景中分析细节等级时,通常就把大小为M * N,灰度为L级的数字图像称为空间分辨率为M * N像素、灰度级分辨率为L级的数字图像。

我们通过以下两种方式,比较图像尺寸和灰度分辨率对分辨细节的影响:

 改变图像的取样数目,即删除行删除列的方式,可以实现对图像的放大和缩小。通过复制行复制列的方式使抽样后的图像复原到原来的大小,会造成细节的损失,产生颗粒。其局限性在于,例如我们采用删除行/列的方式,从1024 * 1024的图像减小成512 * 512的图像,只能成整数倍的操作,而不能使用任意数值。保持取样数的恒定,只改变灰度级,会使像素点的取值范围减小(使本身不同的灰度级具有了相同的灰度级),会失去某些特征并且出现伪轮廓。

3.2.3 放大和收缩数字图像

这两种操作与取样量化一幅数字图像之间的关键区别是放大和收缩适用于数字图像。

放大和收缩数字图像要求执行两步操作:

  1. 计算新的像素在原图的对应位置
  2. 为这些对应位置赋灰度值

又我们找到的位置可能不在坐标点上,故需插值,有三种方法:

  1. 最近邻法

  2. 双线性插值

  3. 更多邻点的内插

    双线性内插不是一种线性内插方法,因为包含xy项。
    比较常用的方法是双线性内插,可以得到相对满意的结果,在计算上的花费也可以接受。
    

4. 像素间的基本关系

4.1 相邻像素

对于坐标(x, y)的一个像素p有4个水平和垂直的相邻像素,这个像素集称为p的4邻域。

p的4个对角邻像素称为p的D邻域。

4邻域和D邻域合成一起称为p的8邻域。

4.2 邻接性、连通性、区域和边界

令V是用于定义邻接性的灰度值集合。考虑三种类型的邻接性:

  • 4邻接:若q在p的4邻域中,具有V中数值的两个像素p和q是4邻接的。
  • 8邻接:若q在p的8邻域中,具有V中数值的两个像素p和q是8邻接的。
  • m邻接:若q在p的4邻域中,或q在p的D邻域中,且p的4邻域和q的4邻域的交集中没有来自V中数值的像素,则具有V中数值的两个像素p和q是m邻接的。
    图1 邻接性图示

如图1所示,b, d与p为4邻接,b, c, d, f, h与p为8邻接,b, d, h是p的m邻接。

 m邻接是8邻接的改进,为了消除8邻接产生的二义性。如图1,8邻接中有两条p到c的通路,采用m邻接避免了多条通路的问题,只可以通过p到b再到c的路径。

如图1所示,hpbc为一条通路,通路的长度为3。

 若(x0, y0) = (xn, yn),则通路是闭合通路。

4.3 距离度量

距离度量函数:对于像素点p(x, y), q(s, t), z(v, w)若满足下列条件,则D为距离度量函数。

  • D(p, q) ≥ 0,正定性(D(p, q) = 0,当且仅当p = q)
  • D(p, q) = D(q, p),对称性
  • D(p, z) ≤ D(p, q) + D(q, z),距离三角不等式

p和q间的距离定义分为:欧氏距离,街区距离和棋盘距离。

 欧氏距离:距点(x, y)的距离小于等于某个值r的像素,是中心在(x, y)且半径为r的圆平面。街区距离:距点(x, y)的街区距离小于等于某个值r的像素,是中心在(x, y)的菱形。棋盘距离:距点(x, y)的棋盘距离小于等于某个值r的像素形成中心在(x, y)的方形。

p和q间的距离Dm定义为最短m通路的长度。

 值得注意的是,街区距离和棋盘距离与任何通路无关。Dm距离则要讨论连通性的问题。

图2 距离的度量

如图2所示,p到q的街区距离为5,棋盘距离为3, Dm距离为4。

总结

在这一章,我们学到了数字图像处理的很多基本知识,为之后接下来的几章学习做了一个铺垫。在像素间的基本关系这部分,邻域处理方法是许多图像增强和复原的核心,同时可以采取邻域操作对图像进行形态学的处理和图像分割。故而邻域问题贯穿了数字图像处理的始终,必须牢牢掌握。

数字图像处理——第二章 数字图像基础相关推荐

  1. 数字图像处理 第二章数字图像基础

    第二章 数字图像基础 本章全都不是重点,了解就好 目标 人体视觉感知 光和电磁波谱 成像模型 图像取样与量化 一些基本概念和数学处理方法 人体视觉感知 人眼结构 上图为人眼剖面图. 人眼是一个直径约为 ...

  2. 数字图像处理第二章——数字图像基础

    目录 一.视觉感知要素: 1. 图像形成 2.亮度适应与鉴别 二.图像的形成 2.1 图像的感知与获取 2.1.1感知 2.1.2 图像的形成模型 2.2 取样与量化 2.2.1取样与量化的概念 2. ...

  3. 数字图像处理 第二章 数字图像基础

    1.视觉感知要素 ①人眼剖面简图 ②锥状体与杆状体 视网膜有两类感光器:锥状体和杆状体.锥状体视觉成为白昼视觉或亮视觉.,对颜色高度敏感.而且每个锥状体都连接到神经末梢,人可以充分地分辨图像细节. 杆 ...

  4. 数字图像处理第二章----数字图像基础

    文章目录 1.三原色基础 2.人眼视觉特性 3. 图像数字化 3.1 定义 3.2 采样 3.3.量化 4.数字图像性质 4.1 分辨率 4.2 像素深度 4.3 位面数量 5.像素间的基本关系 5. ...

  5. 数字图像处理--冈萨雷斯第4版--第二章 数字图像基础

    数字图像处理--冈萨雷斯版--第二章 第二章 数字图像基础 2.1 视觉感知要素 2.1.1 人眼的结构 2.1.2 人眼中图像的形成 2.1.3 亮度适应与辨别 2.2 光和电磁波谱 2.3 图像感 ...

  6. 《数字图像处理》第二章-数字图像基础 笔记

    参考文章: 数字图像处理(冈萨雷斯第三版)学习笔记 - Chapter 1 Introduction(1) 数字图像处理(冈萨雷斯第三版)学习笔记 - Chapter 1 Introduction(2 ...

  7. 数字图像处理笔记 第二章 数字图像基础 第一节 人眼视觉特性

    第二章 数字图像基础 第一节 人眼视觉特性 一.光与电磁波 可见光谱:380mm - 780mm 光谱图: 可见光范围内,不同波长的光给人不同的色彩感觉,不同强度的光及不同强度分布的光刺激人眼,在人脑 ...

  8. 数字图像识别学习笔记(第二章-数字图像基础(1))

    title: 数字图像识别学习笔记(第二章 数字图像基础(1)) categories: 数字图像识别 tags: 数字图像识别 date: 2020/9/30 21:22 mathjax: true ...

  9. 数字图像处理第二章——空间滤波

    数字图像处理第二章 数字图像处理---灰度变换与空间滤波 (四)空间滤波 4.1线性空间滤波 4.1.1 相关 4.1.2 卷积 4.1.3 imfilter函数 4.2 非线性空间滤波 (五)图像处 ...

最新文章

  1. Matlab与数据结构 -- 求向量或矩阵的最大值
  2. R语言ggplot2可视化:使用dplyr包计算每个分组个数的比例(对计算获得的百分比进行近似,值保留整数部分)、使用ggplot2可视化条形图(bar plot)、并在条形图上添加百分比标签
  3. linux修改权限重启恢复,Linux错误执行:chmod 777 .*或chown -R * 的补救方法
  4. 在CentOS7上配置Open vSwitch和VXLAN
  5. 用HTML和CSS和JS构建跨平台桌面应用程序的开源库Electron的介绍以及搭建HelloWorld
  6. 七个你没用过的炫酷开发工具推荐
  7. 【分享】java反射获取、设置、打印对象属性,对象转map基础工具
  8. 总被审稿人提起的多重假设检验校正是什么?
  9. 被扎克伯格销毁的笔记本,暗藏 Facebook 所有成败
  10. linux下多线程断点下载工具-axel
  11. 开源医学图像处理平台NiftyNet介绍
  12. python 模拟鼠标键盘_如何用 python 模拟鼠标和键盘的操作
  13. 怎样更改计算机文件图标,文件夹图标怎么改?电脑更换文件夹图标的方法
  14. 0X00000000指令引用的0x00000000内存该内存不能为read或written
  15. 遗传算法最通俗的讲解案例
  16. JAVA音程_桌面应用|与 Linux 一起学习:学习音乐
  17. Linux 添加开机启动项的三种方法
  18. 回天转债,莱克转债上市价格预测
  19. 6个理由告诉你为什么要用NAS
  20. 常用英语食品词汇- 蔬菜类

热门文章

  1. 沿着“云云协同”的桥梁,奔赴全面云化的产业之海
  2. Linux 5.19 迎来首个候选版本,Linus:多平台 Linux 内核“差不多完成了”
  3. 常见排序算法时间复杂度和空间复杂度
  4. 程序员,你应该读读这些书(豆瓣高分8.0 )
  5. 迈巴赫S480升级原厂H17全车钢琴木饰板,五座改四座,电动后门
  6. 【KiCad镜像】下载与安装
  7. 在python中get是什么意思_python get函数有什么作用?示例解析
  8. 电脑录制的音频文件如何转换为MP3格式
  9. Excel#整体增加相同行高的宏命令#
  10. 解决阿里云redis监听6379,配置规则也将6379端口开放,但是外网仍无法连接6379的问题。