学习高级图像处理课程,以及《数字图像处理》书本的内容总结

第一章 绪论

  • 模拟图像就是生活中接触到的各类图像,照相机所拍的照片、医学所用的光底片一类的光学图像以及眼睛所看到的一切景物图像等,它们都是由连续的各种不同的颜色、亮度的点组成的。这类图像无法用数字计算机直接进行处理
  • 要使模拟图像在数字计算机中进行处理,就必须将模拟
    图像转换为用一系数据所表示的图像,这就是所谓的数字图像
    将模拟图像转换成数字图像的过程,称为图像数字化
  • 图像处理是一个从图像到图像的过程。
    图像分析是一个从图像到数据的过程。

图像处理->图像分析->图像理解


第二章 数字图像基础

一丶亮度适应和鉴别

主观亮度(即由人的视觉系统感知的亮度)是进入人眼的光强的对数函数。
人眼的视觉系统能适应的光的亮度等级从可以看见的昏暗到炫目相差达到 101010^{10}1010等级,但是人眼并不能同时在那么大的范围内看清物体,而只能在同一时间内适应一个小的亮度变化范围 10610^6106。在一定条件下,一个视觉系统当前的敏感度叫亮度适应级。
在实验中,逐渐增加照射分量ΔI\Delta IΔI,形成一个持续时间很短的闪烁,该闪烁以均匀广场中央的圆形方式出现,如下图所示:

如果ΔI\Delta IΔI不够亮,则目标不变,表明没有可觉察的变化,当ΔI\Delta IΔI逐渐加强时,目标会给出肯定的响应,指出是一个可查觉的变化。最后当ΔI\Delta IΔI足够强时,目标将始终给出肯定的响应。ΔIc/I\Delta I_c/IΔIc​/I成为韦伯比,其中ΔIc\Delta I_cΔIc​是在背景照明为I时可辩别照明增量的50%。
ΔIc\Delta I_cΔIc​值较小意味着可辩别强度较小的百分比变化,这表明亮度辨别能力较好。
ΔIc\Delta I_cΔIc​值较大意味着要求有较大的强度的百分比变化,这表示亮度辨别能力弱。

这一曲线表明,在低照明级别,亮度辨别较差(韦伯比大),且它会随着背景照明强度的增加该明显改善(韦伯比逐渐降低),曲线中两个分支表明,在地照明水平下视觉有杆状体执行,高照明水平下由锥状体执行,表示有较好的辨别能力。

二丶感知亮度并不是强度的简单函数

  1. 视觉系统往往会在不同强度区域的边界处出现“上冲”或“下冲”现象,如上图所示,虽然条带的强度恒定,但在靠近边界处我们实际上感知到了带有毛边的亮度模式,这种带有毛边的带称为马赫带

  2. 同时对比现象:感知区域的亮度并不简单地取决其强度。

    所有中心方块都有相同的亮度,然而随着背景变得更亮,他们在眼睛里会变得更暗。

  3. 主观错觉

三丶图像感知和获取

对于单色图像f的取值范围称为灰度级
f(x,y)=i(x,y)r(x,y)f(x,y)=i(x,y)r(x,y)f(x,y)=i(x,y)r(x,y)
其中 0<i(x,y)< , 0<r(x,y)<1,i(x,y) 是入射的光照总量,r(x,y) 是反射率(透射率)。

四丶图像的取样和量化


上图中显示了一副连续图像f,为将它转换为数字形式,必须对坐标和幅度都进行取样操作(沿着直线AB等间隔取样)。对坐标值进行数字化称为取样,对幅值数字化称为量化

数字图像表示:

     由一幅图像的坐标张成的实平面部分称为空间域,x和y称为空间变量或空间坐标。

  1. 对比度:最高(饱和度)和最低(噪声)灰度级间的灰度差。
  2. 存储空间:b = M ×\times× N ×\times× k
    当一幅图像有2k2^k2k个灰度级时,实际上通常称该图像为一幅“k比特图像”。

    灰度级数一般取2的整数次幂 L=2kL=2^kL=2k
    空间和灰度分辨率:空间和灰度分辨率直接影响图像质量

    • 灰度分辨率:灰度2k2^k2k灰度级,k比特
    • 空间分辨率:矩阵M×N。

考虑空间和灰度分辨率变化对图像主观质量有何影响?


妇女脸庞图像是包含较少细节的代表性图像,摄像师图像包含了中等程度的细节,人群图像相比之下包含有大量的细节。通过改变N(空间分辨率)和k(灰度分辨率),生成三种类型的一组图像,要求观察者主观的按图像质量对图像排序,得到等偏爱曲线。

  • 等偏爱曲线

    从上图中可以得到什么结论?
    当图像中的细节增加时,等偏爱曲线会变得更加垂直,这一结果表明,对于有大量细节的图像,可能只需要较少的灰度级,这类图像(人群)的感觉质量与所用灰度级数近似无关。
    k值减小倾向于对比度(最大像素值/最小像素值)增加,人们通常感受到图像质量改善了视觉效果

  • 图像插值 (图像缩放本质可以看出是数值插值)
    最近邻插值、双线性插值、双三次插值
    博客:https://blog.csdn.net/caomin1hao/article/details/81092134

五丶 像素间关系:邻接性、连通性、区域和边界

p邻接性
四邻域:如果q在N4(p)N_4(p)N4​(p)集中,具有V中数值的两个像素p和q是4邻接的。
八邻域:如果q在N8(p)N_8(p)N8​(p)集中,具有V中数值的两个像素p和q是8邻接的。
m邻域(混合邻接):如果(i)q在N4(p)N_4(p)N4​(p)中,或者(ii)q在ND(p)N_D(p)ND​(p)中且集合N4(p)⋂N4(q)N_4(p) \bigcap N_4(q)N4​(p)⋂N4​(q)没有V值的像素,则具有V值的像素p和q是m邻接的。
连通性
关于连通性的几个定义: 通路、通路长度、闭合通路、连通分量、连通集
区域:一个连通集称为一个区域
邻接区域、非邻接区域
*注意确定是否是邻接区域要事先定义采用何种邻接
边界
区域R的边界是这样的点的集合,这些点与R的补集中的点邻接。
*注意采用何种邻接
内边界、外边界
如果R是整幅图像,那么用四周边缘作为边界

六丶 距离度量

对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q,z,如果对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q,z,如果对于坐标分别为(x,y),(s,t)和(v,w)的像素p,q,z,如果
1.D(p,q)>=0[D(p,q)=0,当且仅当p=q]1. D(p,q) >=0 [D(p,q)=0,当且仅当p=q]1.D(p,q)>=0[D(p,q)=0,当且仅当p=q]
2.D(p,q)=D(q,p)且D(p,z)<=D(p,q)+D(q,z)2. D(p,q) =D(q,p)且 D(p,z)<=D(p,q)+D(q,z)2.D(p,q)=D(q,p)且D(p,z)<=D(p,q)+D(q,z)
则D是距离函数或度量

  • 欧氏距离

D4(p,q)=[(x−s)2+(y−t)2]1/2D_4(p,q)=[(x-s)^2+(y-t)^2]^{1/2}D4​(p,q)=[(x−s)2+(y−t)2]1/2

  • 街区距离

D4(p,q)=∣x−s∣+∣y−t∣D_4(p,q)=|x-s|+|y-t|D4​(p,q)=∣x−s∣+∣y−t∣

  • 棋盘距离

D4(p,q)=max(∣x−s∣,∣y−t∣)D_4(p,q)=max(|x-s|,|y-t|)D4​(p,q)=max(∣x−s∣,∣y−t∣)


第三章 灰度变换与空间滤波

一丶基础知识

空间域:直接在图像像素上操作。
频率域:在变换空间中操作。
二者关系:空间域与频率域可互相转换。在频率域中可以引用已经很成熟的频率域技术,处理的一般步骤为:
①对图像施行二维离散傅立叶变换或小波变换,将图像由图像空间转换到频域空间。
②在频率域中对图像的频谱作分析处理,以改变图像的频率特征。即设计不同的数字滤波器,对图像的频谱进行滤波。
空间域处理可由下式表示:
g(x)=T[f(x,y)]g(x)=T[f(x,y)]g(x)=T[f(x,y)]
式中,f(x,y)f(x,y)f(x,y)是输入图像,g(x,y)g(x,y)g(x,y)是处理后的图像,T是在点(x,y)(x,y)(x,y)的邻域上定义的一种算子。

点处理技术: 结果仅仅取决于一个点的灰度。

邻域处理技术

其中邻域与预定义的操作一起称为空间滤波器(也称空间掩膜、核、模板、窗口)。

二丶一些基本的灰度变换函数

1. 图像反转

适用于增强嵌入在一幅图像的暗区域中的白色或灰色细节。
s=L−1−rs=L-1-rs=L−1−r
可得到灰度级范围为[0,L−1][0,L-1][0,L−1]的一幅图像的反转图像。
这种类型处理特别适用于增强嵌入图像暗色区域中的白色或灰色细节,特别是当黑色面积在尺寸上占主导低位时。

2. 对数变换

对数变换的通用形式为
s=clog(1+r)s=clog(1+r)s=clog(1+r)
式中c是常数,并假设r≥0r\geq0r≥0,下图中对数曲线形状表面,对数变换将输入中范围较窄的低灰度值映射为输出中范围较宽的灰度值,或将输入中范围较宽的高灰度值映射为输出中范围较窄的灰度值。 我们使用这种类型的变换来扩展图像中的暗像素值。同时压缩更高灰度级的值

对数函数有一个重要特征,即它压缩像素值变化较大的图像的动态范围。

3.幂律(伽马)变换

幂律变换的基本形式为
s=crγs=cr^{\gamma}s=crγ
对于不同的γ\gammaγ值,s和rs和rs和r的关系曲线如下图所示。与对数变换的情况类似, γ\gammaγ值的幂律曲线将较窄范围的暗色输入值映射为较宽范围的输出值,或将较宽范围的高灰度级输入值映射为较窄范围的输出值。

我们看到。γ>1\gamma >1γ>1的值所生成的曲线和γ<1\gamma <1γ<1的值所生成的曲线的效果完全相反,在c=γ=1c=\gamma=1c=γ=1时简化成了恒等变换。

用于校正幂律现象的处理称为伽马校正。 为什么要进行伽马校正??

  • 使用幂律变换对低灰度级的扩展:随着伽马值从0.6减小到0.4,更多的细节变得可见。

  • 使用幂律变换对高灰度级的压缩:要处理的图像有“冲淡”的外观,表明需要进行灰度级压缩。

4.分段线性变换函数

利用分段线性函数对不同的灰度级范围采用不同的变换,其主要缺点是其技术说明要求用户输入。

  • 对比度拉伸
    对比度拉伸即对图像灰度级动态范围进行处理,但分段变换在处理动态范围时,不同的灰度级范围采用了不同的变换函数。

    点(r1,s1)和点(r2,s2)(r_1,s_1)和点(r_2,s_2)(r1​,s1​)和点(r2​,s2​)的位置控制变换函数的形状,若r1=s1且r2=s2r_1=s_1且r_2=s_2r1​=s1​且r2​=s2​则变换为线性函数,产生没有变化的灰度级。
  • 灰度级分层
    目的:突出图像中特定灰度范围的亮度,其应用包括增强某些特征。
    方法:
    ①二值法:将感兴趣的范围内的所有灰度值显示为一个值(譬如白色),而将其他灰度值显示为另一个值(譬如黑色)。

②分段变化突出灰度级:使感兴趣范围的灰度变亮(或变暗),而保持图像中其他的灰度级不变。