使用 OpenCV 和 Python 识别数字

本文演示如何使用 OpenCV 和 Python 识别图像中的数字。

在本教程的第一部分,我们将讨论什么是七段显示器,以及我们如何应用计算机视觉和图像处理操作来识别这些类型的数字(不需要机器学习!)

七段显示

您可能已经熟悉七段显示器,即使您不认识特定术语。 这种显示的一个很好的例子是您的经典数字闹钟:

闹钟上的每个数字都由一个七段组件表示,如下所示:

七段显示器总共可以呈现 128 种可能的状态:

我们只对其中的 10 个感兴趣——数字 0 到 9:

我们的目标是编写 OpenCV 和 Python 代码来识别图像中的这十个数字状态中的每一个。

设计OpenCV 数字识别器

我们将使用恒温器图像作为输入:

识别的步骤:

步骤 1:定位恒温器上的 LCD。 这可以使用边缘检测来完成,因为塑料外壳和 LCD 之间有足够的对比度。

步骤2:提取 LCD。 给定一个输入边缘图,我可以找到轮廓并寻找矩形的轮廓——最大的矩形区域应该对应于 LCD。 透视变换会给我一个很好的 LCD 提取。

步骤3:提取数字区域。 一旦我有了 LCD 本身,我就可以专注于提取数字。 由于数字区域和 LCD 背景之间似乎存在对比,我相信阈值和形态操作可以实现这一点。

步骤4:识别数字。 使用 OpenCV 识别实际数字将涉及将数字 ROI 划分为七个部分。 从那里我可以在阈值图像上应用像素计数来确定给定的片段是“开”还是“关”。

所以看看我们如何使用 OpenCV 和 Python 完成这个四步过程来进行数字识别,继续阅读。

使用计算机视觉和 OpenCV 识别数字

让我们继续开始这个例子。新建一个文件,将其命名为 identify_digits.py ,并插入以下代码:

# import the necessary packages
from imutils.perspective import four_point_transform
from imutils import contours
import imutils
import cv2
# define the dictionary of digit segments so we can identify
# each digit on the thermostat
DIGITS_LOOKUP = {(1, 1, 1, 0, 1, 1, 1): 0,(0, 0, 1, 0, 0, 1, 0): 1,(1, 0, 1, 1, 1, 1, 0): 2,(1, 0, 1, 1, 0, 1, 1): 3,(0, 1, 1, 1, 0, 1, 0): 4,(1, 1, 0, 1, 0, 1, 1): 5,(1, 1, 0, 1, 1, 1, 1): 6,(1, 0, 1, 0, 0, 1, 0): 7,(1, 1, 1, 1, 1, 1, 1): 8,(1, 1, 1, 1, 0, 1, 1): 9
}

导入我们所需的 Python 包。 引入mutils,这是我的一系列便利函数,可以更轻松地使用 OpenCV + Python。 如果您还没有安装 imutils,现在应该花一点时间使用 pip 在您的系统上安装该软件包: 使用 OpenCV 和 Python 识别数字

pip install imutils

定义一个名为 DIGITS_LOOKUP 的 Python 字典。 他们对表的关键是七段数组。 数组中的 1 表示给定的段已打开,零表示该段已关闭。 该值是实际数字本身:0-9。

一旦我们识别了恒温器显示器中的段,我们就可以将数组传递到我们的 DIGITS_LOOKUP 表中并获得数字值。 作为参考,该词典使用与上面图 2 中相同的段顺序。 让我们继续我们的例子:

# load the example image
image = cv2.imread("example.jpg")
# pre-process the image by resizing it, converting it to
# graycale, blurring it, and computing an edge map
image = imutils.resize(image, height=500)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 50, 200, 255)

加载我们的图像。

然后我们通过以下方式预处理图像:-

  • 调整大小。
  • 将图像转换为灰度。
  • 使用 5×5 内核应用高斯模糊以减少高频噪声。
  • 通过 Canny 边缘检测器计算边缘图。

应用这些预处理步骤后,我们的边缘图如下所示:

注意 LCD 的轮廓是如何清晰可见的——这完成了步骤 #1。 我们现在可以继续第 2 步,提取 LCD 本身:

# find contours in the edge map, then sort them by their
# size in descending order
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)
displayCnt = None
# loop over the contours
for c in cnts:# approximate the contourperi = cv2.arcLength(c, True)approx = cv2.approxPolyDP(c, 0.02 * peri, True)# if the contour has four vertices, then we have found# the thermostat displayif len(approx) == 4:displayCnt = approxbreak

为了找到 LCD 区域,我们需要提取边缘图中区域的轮廓(即轮廓)。

然后我们按面积对等高线进行排序,确保将面积较大的等高线放在列表的前面。

给定我们排序的轮廓列表,逐个循环它们并应用轮廓近似。

如果我们的近似轮廓有四个顶点,那么我们假设我们已经找到了恒温器显示。 这是一个合理的假设,因为我们输入图像中最大的矩形区域应该是 LCD 本身。

获得四个顶点后,我们可以通过四点透视变换提取 LCD:

# extract the thermostat display, apply a perspective transform
# to it
warped = four_point_transform(gray, displayCnt.reshape(4, 2))
output = four_point_transform(image, displayCnt.reshape(4, 2))

应用这种透视变换为我们提供了一个自上而下的 LCD 鸟瞰图:

获得 LCD 的这个视图满足第 2 步——我们现在准备从 LCD 中提取数字:

# threshold the warped image, then apply a series of morphological
# operations to cleanup the thresholded image
thresh = cv2.threshold(warped, 0, 255,cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (1, 5))
thresh = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel)

为了获得数字本身,我们需要对扭曲图像进行阈值处理,以在较亮的背景(即 LCD 显示屏的背景)中显示暗区(即数字):

然后我们应用一系列形态学操作来清理阈值图像:

现在我们有一个很好的分割图像,我们再次需要应用轮廓过滤,只是这次我们正在寻找实际的数字:

# find contours in the thresholded image, then initialize the
# digit contours lists
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = imutils.grab_contours(cnts)
digitCnts = []
# loop over the digit area candidates
for c in cnts:# compute the bounding box of the contour(x, y, w, h) = cv2.boundingRect(c)# if the contour is sufficiently large, it must be a digitif w >= 15 and (h >= 30 and h <= 40):digitCnts.append(c)

为此,我们在阈值图像中找到轮廓。 初始化digitsCnts 列表——这个列表将存储数字本身的轮廓。

在每个轮廓上循环。

对于每个轮廓,我们计算边界框,确保宽度和高度是可接受的大小,如果是,则更新digitsCnts 列表。

如果我们循环遍历digitsCnts内部的轮廓并在图像上绘制边界框,结果将如下所示:

果然,我们在液晶显示屏上找到了数字! 最后一步是实际识别每个数字:

# sort the contours from left-to-right, then initialize the
# actual digits themselves
digitCnts = contours.sort_contours(digitCnts,method="left-to-right")[0]
digits = []

在这里,我们只是根据 (x, y) 坐标从左到右对数字轮廓进行排序。

这个排序步骤是必要的,因为不能保证轮廓已经从左到右排序(与我们读取数字的方向相同)。

接下来是实际的数字识别过程:

# loop over each of the digits
for c in digitCnts:# extract the digit ROI(x, y, w, h) = cv2.boundingRect(c)roi = thresh[y:y + h, x:x + w]# compute the width and height of each of the 7 segments# we are going to examine(roiH, roiW) = roi.shape(dW, dH) = (int(roiW * 0.25), int(roiH * 0.15))dHC = int(roiH * 0.05)# define the set of 7 segmentssegments = [((0, 0), (w, dH)),    # top((0, 0), (dW, h // 2)),    # top-left((w - dW, 0), (w, h // 2)),   # top-right((0, (h // 2) - dHC) , (w, (h // 2) + dHC)), # center((0, h // 2), (dW, h)),    # bottom-left((w - dW, h // 2), (w, h)),    # bottom-right((0, h - dH), (w, h)) # bottom]on = [0] * len(segments)

遍历每个数字轮廓。

对于这些区域中的每一个,我们计算边界框并提取数字 ROI。

我在下面包含了每个数字 ROI 的 GIF 动画:

给定数字 ROI,我们现在需要定位和提取数字显示的七个部分。

根据 ROI 尺寸计算每个段的大致宽度和高度。 然后我们定义一个 (x, y) 坐标列表,这些坐标对应七个线段。 此列表遵循与上面图 2 相同的段顺序。 这是一个示例 GIF 动画,它在正在调查的当前片段上绘制一个绿色框:

最后,初始化我们的 on 列表——该列表中的值 1 表示给定的段是“打开”的,而值为零表示该段是“关闭的”。 给定七个显示段的 (x, y) 坐标,识别一个段是打开还是关闭是相当容易的:

# loop over the segmentsfor (i, ((xA, yA), (xB, yB))) in enumerate(segments):# extract the segment ROI, count the total number of# thresholded pixels in the segment, and then compute# the area of the segmentsegROI = roi[yA:yB, xA:xB]total = cv2.countNonZero(segROI)area = (xB - xA) * (yB - yA)# if the total number of non-zero pixels is greater than# 50% of the area, mark the segment as "on"if total / float(area) > 0.5:on[i]= 1# lookup the digit and draw it on the imagedigit = DIGITS_LOOKUP[tuple(on)]digits.append(digit)cv2.rectangle(output, (x, y), (x + w, y + h), (0, 255, 0), 1)cv2.putText(output, str(digit), (x - 10, y - 10),cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 255, 0), 2)

我们开始循环遍历每个线段的 (x, y) 坐标。

我们提取片段 ROI,然后计算非零像素数(即片段中“开启”的像素数)。

如果非零像素与段总面积的比率大于 50%,那么我们可以假设该段是“on”并相应地更新我们的 on 列表。 在循环七段之后,我们可以将列表传递给 DIGITS_LOOKUP 以获取数字本身。

然后我们在数字周围绘制一个边界框并在输出图像上显示数字。 最后,我们的最后一个代码块将数字打印到我们的屏幕上并显示输出图像:

# display the digits
print(u"{}{}.{} \u00b0C".format(*digits))
cv2.imshow("Input", image)
cv2.imshow("Output", output)
cv2.waitKey(0)

请注意我们如何使用 Python 和 OpenCV 正确识别 LCD 屏幕上的数字:

总结

在今天的博客文章中,我演示了如何利用 OpenCV 和 Python 来识别图像中的数字。

这种方法专门用于七段显示器(即您通常会在数字闹钟上看到的数字显示器)。

通过提取七个段中的每一个并应用基本的阈值和形态学操作,我们可以确定哪些段是“开”的,哪些是“关”的。

从那里,我们可以在 Python 字典数据结构中查找开/关段以快速确定实际数字——无需机器学习!

正如我在这篇博文的开头提到的,应用计算机视觉来识别恒温器图像中的数字往往会使问题本身过于复杂——使用数据记录温度计会更可靠,并且需要的工作量要少得多。

我希望你喜欢今天的博文!
代码:
https://download.csdn.net/download/hhhhhhhhhhwwwwwwwwww/38496915

使用 OpenCV 和 Python 识别数字相关推荐

  1. 使用 OpenCV 和 Python 识别信用卡号

    使用 OpenCV 和 Python 识别信用卡号 在之前的博文中,我们学习了如何安装 Tesseract 二进制文件并将其用于 OCR. 然后我们学习了如何使用基本的图像处理技术来清理图像以提高 T ...

  2. python识别数字程序_python实现识别手写数字 python图像识别算法

    写在前面 这一段的内容可以说是最难的一部分之一了,因为是识别图像,所以涉及到的算法会相比之前的来说比较困难,所以我尽量会讲得清楚一点. 而且因为在编写的过程中,把前面的一些逻辑也修改了一些,将其变得更 ...

  3. OpenCV For Python识别图片中的米粒个数,并计算米粒的面积平均面积

    精确分割请看分水岭算法实现https://blog.csdn.net/qq_36623595/article/details/109273629 使用OpenCV构建图像识别算法,识别图片中的米粒个数 ...

  4. python识别数字程序_详解python实现识别手写MNIST数字集的程序

    我们需要做的第⼀件事情是获取 MNIST 数据.如果你是⼀个 git ⽤⼾,那么你能够通过克隆这本书的代码仓库获得数据,实现我们的⽹络来分类数字 git clone https://github.co ...

  5. python 识别数字字母 训练集_Python 实现训练集、测试集随机划分

    随机从列表中取出元素: import random dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]] trainDa ...

  6. 使用OpenCV和Python,OCR识别数字

    使用OpenCV和Python,OCR识别数字 1. 效果图 2. 原理 2.1. 什么是七段显示器 2.2 识别数字步骤 3. 源码 参考 这篇博客将演示如何使用OpenCV和Python识别图像中 ...

  7. dlib 使用OpenCV,Python和深度学习进行人脸识别 源代码

    请直接访问原文章 dlib 使用OpenCV,Python和深度学习进行人脸识别 源代码 https://hotdog29.com/?p=595 在 2019年7月7日 上张贴 由 hotdog发表回 ...

  8. python模块cv2人脸识别_手把手教你使用OpenCV,Python和深度学习进行人脸识别

    使用OpenCV,Python和深度学习进行人脸识别 在本教程中,你将学习如何使用OpenCV,Python和深度学习进行面部识别.首先,我们将简要讨论基于深度学习的面部识别,包括"深度度量 ...

  9. python信用卡识别_python opencv实现信用卡的数字识别

    本项目利用python以及opencv实现信用卡的数字识别 前期准备 导入工具包 定义功能函数 模板图像处理 读取模板图像 cv2.imread(img) 灰度化处理 cv2.cvtColor(img ...

最新文章

  1. 前端面试的作品示例_如何回答任何技术面试问题-包括示例
  2. 阶段-关口系统---学习笔记
  3. 背水一战 Windows 10 (36) - 控件(弹出类): ToolTip, Popup, PopupMenu
  4. IE这回在css flex中扳回一局?
  5. MOTO行货如此服务——服务的南北差异
  6. 细胞转染的操作步骤及注意事项
  7. Java™ 教程(Set接口)
  8. faster rcnn resnet_RCNN, Fast R-CNN 与 Faster RCNN理解及改进方法
  9. [JavaScriptC#]收藏 备忘
  10. java的IO总结(一)
  11. php嗅探视频地址,用PHP嗅探youku视频的真实地址!
  12. 论文章的标题与页面的距离不一样(已解决)章标题设置相同的段前段后间距,但各章段前距不一致
  13. 2021-2-2有道翻译在线翻译爬虫
  14. 金蝶凭证序时簿在哪_金蝶KIS旗舰版外购入库单序时簿界面没有凭证的按钮
  15. 平方米用计算机怎么计算公式,公式的换算和公式计算器
  16. 自制太阳能手机充电器
  17. Centos7 搭建 Svn+ReviewBoard
  18. 【飞飞CMS二次开发实录】开篇:安装与运行
  19. 百度mip推送工具_(教程)主动推送(实时)、熊掌号天级/周级提交、MIP提交
  20. Studing Day4 - python基础4

热门文章

  1. 计算机附件计算器的用法,《计算机附件中的计算器使用方法.doc
  2. 冲击波病毒内幕点滴(3)
  3. IOS进入DFU模式通过iTunes恢复系统
  4. 手把手教你开通和使用融资融券账户!
  5. 20180725-Ubuntu 18.04 开启隐藏录音降噪功能
  6. APICloud的发展和应用
  7. 0基础手把手教你开发探探类社交软件(Tinder项目产品架构说明文档)
  8. 主板鸣叫_为代码#4鸣叫
  9. Frida-OC操作
  10. 这个B站的外挂脚本太强大了,啥都能改!