OpenCV与图像处理学习七——传统图像分割之阈值法(固定阈值、自适应阈值、大津阈值)

  • 一、固定阈值图像分割
    • 1.1 直方图双峰法
    • 1.2 OpenCV中的固定阈值分割
  • 二、自动阈值图像分割
    • 2.1 自适应阈值法
    • 2.2 迭代法阈值分割
    • 2.3 Otsu大津阈值法

前面的笔记介绍了一些OpenCV基本的图像处理,后面将学习使用OpenCV的传统的图像分割方法,这次笔记的内容是阈值法进行图像分割。

图像分割是指将图像分成若干具有相似性质的区域的过程,主要有基于阈值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割实例分割。下图是一个实例分割的例子,与语义分割不同的地方在于,它能将同类别的物体的每个个体都区分开,如下图中每个人的轮廓都被分割开:


分割的原则就是使划分后的子图在内部保持相似度最大,而子图之间的相似度最小,将G = (V, E) 分成两个子集A,B,使得:

一、固定阈值图像分割

即设定一个固定的阈值,整张图片的每个像素的像素值都与该值进行比较,若小于该阈值则将像素值改为一个固定的值(常用0),若大于该阈值则将像素值改为另一个固定的值(常用255),则可以将图像进行二值分割,得到一张二值图。

1.1 直方图双峰法

六十年代中期提出的直方图双峰法(也称mode法)是典型的全局单阈值分割方法。

基本思想:假设图像中有明显的目标和背景,则其灰度直方图呈双峰分布,当灰度级直方图具有双峰特性时选取两峰之间的谷对应的灰度级作为阈值,大于阈值的作为前景,小于的作为背景。

缺点:对图像的要求太高,很多图像的直方图并不满足双峰的分布。

1.2 OpenCV中的固定阈值分割

在OpenCV中的函数:

retval, dst  = cv2.threshold( src, thresh, maxval, type[, dst] )

参数:

  1. src:输入图像,单通道或四通道图像。
  2. thresh:设定的固定阈值。
  3. maxval:当type参数设置为THRESH_BINARY时,表示像素值大于阈值时设置的值,或设置为THRESH_BINARY_INV时,表示像素值小于阈值时设置的值。
  4. type:阈值类型,如下图所示,前五种类型是基本类型,最后两种(大津阈值和三角形阈值)与前面的基本类型结合可以实现特殊的阈值分割:

这里也需要注意一下这个函数的输出:

  1. retval:第一个参数返回的是阈值,在使用五种基本类型时就等于你设置的阈值,而在使用大津阈值法和三角形阈值法时将会得到它计算出来的阈值,一般用的不多。
  2. dst:第二个参数返回的才是分割之后的图像。

下面看几个例子:

# 加载opencv和matplotlib
import cv2
import matplotlib.pyplot as plt# 灰度图读入
img = cv2.imread('./image/thresh.png', 0)
threshold = 127
# 阈值分割
ret, th = cv2.threshold(img, threshold, 255, cv2.THRESH_BINARY)
print(ret)cv2.imshow('Original', img)
cv2.imshow('thresh', th)
cv2.waitKey(0)
cv2.destroyAllWindows()

结果如下:

返回的第一个参数就是设置的阈值:

127.0

即像素值低于127的都被赋予0,高于的都被赋予255,得到一张二值化的图像。

再来看一下五种基本的阈值分割方法的区别

# 导入第三方包
import cv2
from matplotlib import pyplot as plt
# opencv读取图像
img = cv2.imread('./image/person.png',0)
# 5种阈值法图像分割
ret1, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret2, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret3, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret4, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret5, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
# 使用for循环进行遍历,matplotlib进行显示
for i in range(6):plt.subplot(2, 3, i+1)plt.imshow(images[i], cmap='gray')plt.xticks([])plt.yticks([])plt.suptitle('fixed threshold')
plt.show()

结果为:

注意:除了前两种方法是二值化图像,后三种并不是,因为它们会保留一部分的原像素值。

如果这个图不够直观,将输入图像换成上一个例子里的渐变灰度图,结果如下:

二、自动阈值图像分割

2.1 自适应阈值法

很明显,设置一个固定阈值对全局像素进行分割是不合理的,如果这张图片的光照角度不好,一边比较亮一边比较暗,但是我们想分割图里的细节,只用一个固定阈值的话很可能会出现下面的结果:

而自适应阈值分割则将图像分成很多个小块(region),对每个小块单独计算其阈值,然后用这个计算得到的阈值对该小块进行分割,这样的好处是,即使受到光照影响,某一块较暗或较亮,但是可以单独计算这一块的合理阈值来进行分割而不用使用全局的固定阈值,换句话说,亮的小块对应的阈值较大,暗的小块对应的阈值较小,从而可以达到很好的分割效果。

函数:

dst  = cv2.adaptiveThreshold( src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst] )

参数:

  1. src:输入图像,只能是单通道灰度图。
  2. maxValue:最大阈值,即小块计算的阈值不能超过这个值,一般设置为255.
  3. adaptiveMethod:计算小块阈值的方法,包括cv2.ADAPTIVE_THRESH_MEAN_Ccv.ADAPTIVE_THRESH_GAUSSIAN_C,即求小块内的均值或高斯加权求和:
  4. thresholdType:阈值方法,这里只能是THRESH_BINARYTHRESH_BINARY_INV,即
  5. blockSize:小块的尺寸,如11就是11×11。
  6. C:最终阈值等于小区域计算出的阈值再减去这个常数。

看一下刚刚用固定阈值分割效果很差的那个图用自适应阈值来分割的效果:

# 自适应阈值与固定阈值对比
import cv2
import matplotlib.pyplot as plt
img = cv2.imread('./image/paper2.png', 0)# 固定阈值
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# 自适应阈值
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 4)
th3 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 4)
# 全局阈值,均值自适应,高斯加权自适应对比
titles = ['Original', 'Global(v = 127)', 'Adaptive Mean', 'Adaptive Gaussian']
images = [img, th1, th2, th3]
for i in range(4):plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')plt.title(titles[i], fontsize=8)plt.xticks([]), plt.yticks([])
plt.show()


可以看出效果还是很好的,相比之下,高斯方法的自适应阈值能获得更好的效果,其噪点更少。

2.2 迭代法阈值分割

步骤:

  1. 求出图像的最大灰度值和最小灰度值,分别记为Zmax和Zmin,另初始阈值为T0 = (Zmax + Zmin) / 2。
  2. 根据阈值Tk将图像分割为前景和背景,分别求出两者的平均灰度值Zo和Zb。
  3. 求出新的阈值Tk+1 = (Zo + Zb) / 2。
  4. 若Tk == Tk+1,则即为所求的阈值,否则转到步骤2继续迭代。
  5. 使用计算后的阈值进行阈值分割。

其实迭代法就是将固定阈值分割里手动给定阈值改为了迭代计算阈值,可以适用的范围更多一些,但是本质还是固定阈值变换。

看个例子:

import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cmdef best_thresh(img):# step 1: 设置初始阈值img_array = np.array(img).astype(np.float32)    # 转化成数组I = img_arrayzmax = np.max(I)zmin = np.min(I)tk = (zmax+zmin)/2# step 2: 根据阈值将图像进行分割为前景和背景,分别求出两者的平均灰度zo和zbb = 1m, n = I.shape;while b == 0:ifg = 0ibg = 0fnum = 0bnum = 0for i in range(1, m):for j in range(1, n):tmp = I(i, j)if tmp >= tk:ifg = ifg + 1fnum = fnum + int(tmp)  # 前景像素的个数以及像素值的总和else:ibg = ibg+1bnum = bnum + int(tmp)  # 背景像素的个数以及像素值的总和# step 3: 计算前景和背景的新平均值zo = int(fnum / ifg)zb = int(bnum / ibg)# step 4: 比较tk是否等于新平均值if tk == int((zo+zb) / 2):b = 0else:tk = int((zo+zb)/2)# step 5: 返回的就是迭代计算后的阈值return tkimg = cv2.imread("./image/bird.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
img = cv2.resize(gray, (200, 200))  # 大小
yvzhi = best_thresh(img)
ret1, th1 = cv2.threshold(img, yvzhi, 255, cv2.THRESH_BINARY)
print(ret1)
plt.imshow(th1, cmap=cm.gray)
plt.show()

结果为:

2.3 Otsu大津阈值法

大津法:也叫最大类间方差法,1979年日本学者大津提出,是一种基于全局阈值的自适应方法。

图像分为前景和背景,当取最佳阈值时,两部分之间的差别应该是最大的,衡量差别的方法为最大类间方差。

直方图有两个峰值的图像,用大津法求得的阈值近似为谷底,如下图所示,即代替了手动输入阈值。

大津法中类间方差是需要最大化的目标函数,那么它的定义如下图所示:

在OpenCV中大津阈值法只是在固定阈值法的函数cv2.threshold的阈值方法type这个参数后加上cv2.THRESH_OTSU,同时将参数2thresh忽视(设置多少无所谓,一般使用0),例如:

ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

看一个例子:

import cv2
from matplotlib import pyplot as pltimg = cv2.imread('./image/noisy.png', 0)
# 固定阈值法
ret1, th1 = cv2.threshold(img, 100, 255, cv2.THRESH_BINARY)
# Otsu阈值法
ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)# 先进行高斯滤波,再使用Otsu阈值法
blur = cv2.GaussianBlur(img, (5, 5), 0)
ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
images = [img, 0, th1, img, 0, th2, blur, 0, th3]
titles = ['Original', 'Histogram', 'Global(v=100)','Original', 'Histogram', "Otsu's",'Gaussian filtered Image', 'Histogram', "Otsu's"]for i in range(3):# 绘制原图plt.subplot(3, 3, i * 3 + 1)plt.imshow(images[i * 3], 'gray')plt.title(titles[i * 3], fontsize=8)plt.xticks([]), plt.yticks([])# 绘制直方图plt.hist, ravel函数将数组降成一维plt.subplot(3, 3, i * 3 + 2)plt.hist(images[i * 3].ravel(), 256)plt.title(titles[i * 3 + 1], fontsize=8)plt.xticks([]), plt.yticks([])# 绘制阈值图plt.subplot(3, 3, i * 3 + 3)plt.imshow(images[i * 3 + 2], 'gray')plt.title(titles[i * 3 + 2], fontsize=8)plt.xticks([]), plt.yticks([])
plt.show()

这里比较了固定阈值法、大津阈值法和加上高斯滤波的大津阈值法,效果如下所示:

相比之下,高斯滤波加大津阈值法的效果是最好的,也是实际使用中最常用的。

以上就是基于阈值的传统图像分割中常用的几种阈值分割方法。

OpenCV与图像处理学习七——传统图像分割之阈值法(固定阈值、自适应阈值、大津阈值)相关推荐

  1. OpenCV与图像处理学习十二——图像形状特征之HOG特征

    OpenCV与图像处理学习十二--图像形状特征之HOG特征 一.图像特征理解 1.1 颜色特征 1.2 纹理特征 1.3 形状特征 1.4 空间关系特征 二.形状特征描述 2.1 HOG特征 2.1. ...

  2. OpenCV与图像处理学习十一——分水岭算法(含代码)

    OpenCV与图像处理学习十一--分水岭算法(含代码) 一.分水岭算法概要 二.分水岭算法步骤 三.代码应用 一.分水岭算法概要 任意的灰度图像可以被看做是地质学表面,高亮度的地方是山峰,低亮度的地方 ...

  3. OpenCV与图像处理学习十——区域生长算法(含代码)

    OpenCV与图像处理学习十--区域生长算法(含代码) 一.区域生长算法概要 二.区域生长算法原理 三.代码应用 一.区域生长算法概要 区域生长是一种串行区域分割的图像分割方法.区域生长是指从某个像素 ...

  4. OpenCV与图像处理学习九——连通区域分析算法(含代码)

    OpenCV与图像处理学习九--连通区域分析算法(含代码) 一.连通区域概要 二.Two-Pass算法 三.代码实现 一.连通区域概要 连通区域(Connected Component)一般是指图像中 ...

  5. OpenCV与图像处理学习八——图像边缘提取(Canny检测代码)

    OpenCV与图像处理学习八--图像边缘提取(Canny检测代码) 一.图像梯度 1.1 梯度 1.2 图像梯度 二.梯度图与梯度算子 2.1模板卷积 2.2 梯度图 2.3 梯度算子 2.3.1 R ...

  6. OpenCV与图像处理学习六——图像形态学操作:腐蚀、膨胀、开、闭运算、形态学梯度、顶帽和黑帽

    OpenCV与图像处理学习六--图像形态学操作:腐蚀.膨胀.开.闭运算.形态学梯度.顶帽和黑帽 四.图像形态学操作 4.1 腐蚀和膨胀 4.1.1 图像腐蚀 4.1.2 图像膨胀 4.2 开运算与闭运 ...

  7. OpenCV与图像处理学习一——图像基础知识、读入、显示、保存图像、灰度转化、通道分离与合并

    OpenCV与图像处理学习一--图像基础知识.读入.显示.保存图像.灰度转化.通道分离与合并 一.图像基础知识 1.1 数字图像的概念 1.2 数字图像的应用 1.3 OpenCV介绍 二.图像属性 ...

  8. OpenCV数字图像处理学习平台

    原始图像1-1 处理中的图像1-2 处理结果1-3(检测到所有圆) OpenCV数字图像处理学习平台,是一款可视化.交互式方式学习OpenCV的工具软件,由资深计算机视觉专家精心打造,花费近两年整理成 ...

  9. OpenCV与图像处理学习十七——OpenCV人脸检测(含代码)

    OpenCV与图像处理学习十七--OpenCV人脸检测(含代码) 一.人脸识别概要 1.1 人脸检测 1.2 人脸对齐(Face Alignment) 1.3 人脸特征提取(Face Feature ...

最新文章

  1. 黄聪:NaviCat通过Http方式连接服务器的MySQL数据库(转)
  2. 调制的缺点_电光调制与声光调制原理和应用领域
  3. 【Android工具】Cx文件管理器,Cx File Explorer安卓samba客户端
  4. 模拟一:STEMA 考试选择题模拟练习试卷(初级组)及答案 + 自我解题笔记
  5. webpack从入门到精通(二)开发环境的基本配置
  6. php判断几维数组的方法,php如何判断数组是几维
  7. MATLAB字符串转换函数
  8. pytorch线性回归代码_[PyTorch 学习笔记] 1.3 张量操作与线性回归
  9. 用同一uuid作为两个字段的值_这两个小技巧,让SQL语句不仅躲了坑,还提升了 1000 倍...
  10. java windows 下载_Windows环境下JDK的下载与安装
  11. 前台一键备份数据库+PHP实现方式
  12. penpyxl 格式_【上海校区】数据集.npy格式与png格式互换
  13. C# devexpress gridcontrol 分页 控件制作
  14. 支付网关清算及退款流程
  15. 爬虫之异步爬虫asyncio
  16. 【备战秋招系列-3】Java高频知识点——排序、设计模式、JavaSE、JVM
  17. 解决微信网页授权:出现errcode:40163
  18. MarkDown语法学习--字体,分割线,删除线,下划线
  19. 网站备案常见词汇解释汇总
  20. 职场技巧:高效实用的四象限法则

热门文章

  1. java 反射的弊端_java反射机制的一些学习心得小结
  2. php raabitmq中间件_rabbitMQ消息中间件环境配置及原理了解
  3. 我不看好data2vec这类多模态融合的研究
  4. 【小马哥】Spring Cloud系列讲座
  5. 即时配送的ETA问题之亿级样本特征构造实践
  6. 美团外卖Android Lint代码检查实践
  7. 我对Spring的理解
  8. pycharm插件之SonarLint
  9. Android官方开发文档Training系列课程中文版:添加ActionBar之ActionBar浮层效果
  10. 知识图谱最新权威综述论文解读:实体发现