针对工程需求精度不够,目前只能识别率为86%左右。

用tesseract的深度学习可能会好一点,没搞懂怎么用?

单张图片

import cv2
import numpy as np
import matplotlib.pyplot as plt
import pytesseract
import ospytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"img_orig = cv2.imread('images/OCR/OCRS116.jpg')image_RGB = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)# 提取感兴趣区域
# cv2.rectangle(image_RGB, (1150,820),(1400,950),(0,0,255),1)
ROI = image_RGB[820:950, 1166:1380]
img = ROI
print(img.shape)
# print(pytesseract.image_to_boxes(ROI))# cv2.imshow("roi", ROI)
# cv2.waitKey(0)kernel = np.ones((5, 5), np.uint8)
open_img = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)# 二值化
left_thred = 240
gray_img = cv2.cvtColor(open_img, cv2.COLOR_RGB2GRAY)
ret, thresh1 = cv2.threshold(gray_img, left_thred, 255, cv2.THRESH_BINARY)# 根据自己的图像情况处理
# thresh1[0:20, 0:100] = 255
# thresh1[100:129, 0:210] = 255
# 模糊操作
blur = cv2.blur(thresh1,(3,3))cv2.imshow("blur",blur)
cv2.waitKey(0)img_strings = pytesseract.image_to_string(blur)
# 输入想要的字符段
print(img_strings[:6])

文件夹中多张图片

import cv2
import numpy as np
import matplotlib.pyplot as plt
import pytesseract
import ospytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"config='--psm 6 --oem 1 -c tessedit_char_whitelist=0123456789'path = r"D:\BUFFER\Pycharm\OpencvLearn\images\OCR"
for filename in os.listdir(path):  # listdir的参数是文件夹的路径filenames = path + '\\' + filename# print(filenames)img_orig = cv2.imread(filenames, 1)# print(filenames)image_RGB = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)# cv2.rectangle(image_RGB, (1150,820),(1400,950),(0,0,255),1)ROI = image_RGB[820:950, 1165:1380]img = ROI# print(pytesseract.image_to_boxes(ROI))# cv2.imshow("roi", ROI)# cv2.waitKey(0)kernel = np.ones((5,5), np.uint8)open_img = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)# cv2.imshow("images", open_img)left_thred = 240gray_img = cv2.cvtColor(open_img,cv2.COLOR_RGB2GRAY)ret, thresh1 = cv2.threshold(gray_img, left_thred, 255, cv2.THRESH_BINARY)thresh1[0:20, 0:100] = 255thresh1[105:129, 0:210] = 255blur = cv2.blur(thresh1, (3,3))# cv2.imshow("thresh",thresh1)# cv2.waitKey(0)img_strings = pytesseract.image_to_string(blur)print(img_strings[:6])

pytesseract识别数字相关推荐

  1. 【验证码识别】使用pytesseract识别数字验证码

    文章目录 前言 一.pytesseract是什么? 二.基本应用 三.进阶应用(指定识别字符白名单提高识别正确率) 总结 备注 前言 验证码是最简单有效防止恶意登录的方法,但是验证码对于我们自动化控制 ...

  2. python文字识别 训练_Python3.x:pytesseract识别率提高(样本训练)

    Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个人 ...

  3. 运行caffe识别数字的模型mnist

    <!---title:运行caffe识别数字的模型mnist--> <!---keywords:填写关键字, 以半角逗号分割--> 原始引用地址:  [运行caffe识别数字的 ...

  4. php 图片路径混淆,爬虫遇到了字符图片混淆。pytesseract识别图片字符

    本帖最后由 打字的小强 于 2020-6-11 14:05 编辑 最近爬虫遇到了字符图片混淆的反爬.如图所示,文字和图片混在一起,需要对图片进行识别,图片很小,这时候我就想到了pytesseract, ...

  5. 【OpenCV/C++】KNN算法识别数字的实现原理与代码详解

    KNN算法识别数字 一.KNN原理 1.1 KNN原理介绍 1.2 KNN的关键参数 二.KNN算法识别手写数字 2.1 训练过程代码详解 2.2 预测分类的实现过程 三.KNN算法识别印刷数字 2. ...

  6. Tesseract训练识别数字

    Tesseract训练识别数字 一.软件环境 1.安装Tesseract 3.0.2 2.安装jTessBoxEditorFX训练工具 二.训练前需要准备的素材 1.多张包含数字的图片 三.开始训练 ...

  7. 安卓实现扫一扫识别数字

    本文已授权微信公众号:鸿洋(hongyangAndroid)原创首发. 公司业务需求,需要做手机号码的识别.所以有了此篇文章,现在就将实现过程分享给大家. 1.准备工作 首先实现识别数字等字符,我们要 ...

  8. Android基于卷积神经网络的数字手势识别识别数字手势0-10 Android studio编译

    这篇博客主要基于我做的一个数字手势识别APP,具体分享下如何一步步训练一个卷积神经网络模型(CNN)模型,然后把模型集成到Android Studio中,开发一个数字手势识别APP.Android基于 ...

  9. pytesseract识别中文并获得中文的位置信息(Bounding Box)

    pytesseract识别中文并且获得识别的字符的位置信息,识别中文随便找找就能找到相关资料,但是获得位置信息的中文资料有点少呀,下面通过学习这个获得了怎么得到位置信息的方法了.总体来说有两个方法.一 ...

  10. 使用 OpenCV 和 Python 识别数字

    使用 OpenCV 和 Python 识别数字 本文演示如何使用 OpenCV 和 Python 识别图像中的数字. 在本教程的第一部分,我们将讨论什么是七段显示器,以及我们如何应用计算机视觉和图像处 ...

最新文章

  1. Django Celery定时任务和时间设置
  2. python 统计2^2^2^2^2的各数字出现次数
  3. opencv 霍夫线变换
  4. retrofit 解析百度地图api 返回数据_阿里二面:关于 Retrofit 你知道多少?看完你的offer稳了
  5. 小程序引入的echarts过大如何解决_解决微信小程序引用echarts视图模糊的问题
  6. 安装sqlserver时“试图执行未经授权的操作“的错误
  7. string 转比较运算符_运算符
  8. Jmeter BeanShell采样器提取接口响应并传递(三)
  9. JavaScript实现复选框的全选/全不选和批量选择
  10. ArcGIS Server 中AJAX应用系列(3)
  11. 数据状态更新时的差异 diff 及 patch 机制
  12. Flutter RotatedBox 旋转组件
  13. php 获取数据库函数吗,如何正确理解PHP获取显示数据库数据函数
  14. 怎样在SQL Server上部署SSIS包 2
  15. 拳魂觉醒服务器维护怎么办,拳魂觉醒 哪些不为人知的的小秘密
  16. Linux添加用户并赋管理员权限
  17. SDNU 1072.我们爱递归(水题)
  18. 谁让APP工程师产生了泡沫?
  19. fileupload控件的属性_FileUpLoad控件简介.ppt
  20. R数据分析:列线图的做法及解释

热门文章

  1. 祝贺吾博文中第一篇点击超过一万的文章出现
  2. 破坏入侵计算机信息系统犯罪,刑事律师解读:新形势下的黑科技犯罪—破坏计算机信息系统罪...
  3. micropython入门指南pdf百度云下载_MicroPython入门教程之语法基础
  4. 安装pyspider报错:ERROR: Complete output from command python setup.py egg_info:...
  5. python之用yagmail模块发送邮件
  6. Oracle+Mybatis模糊查询
  7. Lync Server在父子域环境中使用图形界面扩展AD架构失败
  8. 新手降NAT网络第十步曲,小编提供思路。
  9. python-33:极视界爬虫V-0.2
  10. Linux总结----PS命令