今天学习 tesseract-ocr开源库的使用,这是个开源的能够识别多语言文字的库

下面是在Windows上安装的步骤
1:下载软件,选择最新的版本安装
https://github.com/UB-Mannheim/tesseract/wiki

The latest installers can be downloaded here:
tesseract-ocr-w32-setup-v5.0.1.20220118.exe (32 bit) and
tesseract-ocr-w64-setup-v5.0.1.20220118.exe (64 bit) resp.

2:安装时可以将语言包选上(比如不选择的话,默认的只能解析英文)

3:配置环境变量,将安装目录加载PATH环境变量中去,安装目录下面有个 tesseract.exe 。(选择的语言的训练包都在安装目录下的 tessdata 子目录)

4:检查下,打开cmd,
tesseract -v 查看版本
tesseract --list-langs 查看安装的语言

5:安装必要的库

pip install Pillow
pip3 install pytesseract

然后就可以写代码了

代码测试如下:

import cv2 as cv
from PIL import Image
import pytesseract as tesssrc = cv.imread("images/number2.png")  # 读取图片
gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)
cv.imshow("src input image", gray)  # 通过名字将图像和窗口联系ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
cv.imshow("binary", binary)textInImage = Image.fromarray(binary)
text = tess.image_to_string(textInImage)
print("ocr detect result:%s" % text)cv.waitKey(0)
cv.destroyAllWindows()

效果如下:

学习自:
https://www.cnblogs.com/zhigu/p/10646928.html
https://blog.csdn.net/ytzh88/article/details/106186475/
https://blog.csdn.net/qq_33731081/article/details/103812749

【opencv 学习】使用tesseract-ocr机芯数字识别相关推荐

  1. 基于Tesseract训练的数字识别研究

    征地档案数字识别研究与应用 1 永州市自然资源与规划勘测事务中心 湖南 永州425000 摘要:针对征地档案数据整理建库工作中界址点坐标电子数据缺失现象,当前主要通过人工识别档案资料并且将坐标数据抄录 ...

  2. AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理

    AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理) 概述 前提条件 读入数据并划分数据集 扩展阅读:为什么学术界的模型总在不断精进呢? 训练样本乱序.生成批次数据 校验数 ...

  3. 【学习日记】手写数字识别及神经网络基本模型

    2021.10.7 [学习日记]手写数字识别及神经网络基本模型 1 概述 张量(tensor)是数字的容器,是矩阵向任意维度的推广,其维度称为轴(axis).深度学习的本质是对张量做各种运算处理,其分 ...

  4. 利用深度学习(CNN)进行验证码(字母+数字)识别

    利用深度学习(CNN)进行验证码(字母+数字)识别_helen1313的专栏-CSDN博客 本文方法针对的验证码为定长验证码,不包含中文. 本文的思路是:1. 使用keras中预训练好的模型,在pyt ...

  5. android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库

    目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...

  6. OpenCV实践小项目(一): 信用卡数字识别

    1. 写在前面 今天整理一个OpenCV实践的小项目, 前几天整理了一篇OpenCV处理图像的知识笔记,后面,就通过一些小项目把这些知识运用到实践中去,一个是加深理解,另一个是融会贯通,连成整体,因为 ...

  7. 深度学习数字仪表盘识别_【深度学习系列】手写数字识别实战

    上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下.不过呢,这块内容太复杂了,所以就简单的介绍一下padd ...

  8. 深度学习项目实战——手写数字识别项目

    摘要 本文将介绍的有关于的paddle的实战的相关的问题,并分析相关的代码的阅读和解释.并扩展有关于的python的有关的语言.介绍了深度学习步骤: 1. 数据处理:读取数据 和 预处理操作 2. 模 ...

  9. 关于Tesseract OCR 中文训练识别小试(java调用Tess4j)

    2017.9.20日小结 最近接到是关于消防系统协议解析仪器的项目,目的是从协议解析仪器获取有效数据,并解析数据(目的是不希望消防主机的数据信息再传给主机厂商而是最后能给自己收集调用).由于各个消防器 ...

最新文章

  1. RabbitMQ学习总结(6)——消息的路由分发机制详解
  2. redis安全与管理
  3. JS的trim()方法
  4. mysql脚本mysql_safe解释、mysql.sock文件、mysql_install_db
  5. 2019-02-24-算法-进化
  6. atexit()函数(进程退出函数,类似析构)
  7. Exchange2010 owa 访问 http 500 内部服务器错误
  8. 软件网站安全性的设计与检测与解决方案
  9. 深度复盘 | 蚂蚁集团万级规模 k8s 集群基建之路
  10. 如何确定一家培训机构值得信赖
  11. 我的×××面——深信服面试全记录
  12. 作业五:结对项目-四则运算 “软件”之升级版
  13. 短信工具类——mo信通
  14. Flutter Switch
  15. UEditor(集成 135 编辑器插件)(附源码)
  16. 停车场寻车难?蓝牙5.1提供的新思路
  17. 关于旋转(Rotation)
  18. C语言、编程语言发展史
  19. 简析PPC的Device Tree机制
  20. Vue 计算属性缓存和方法的区别:从另一段代码来看【vue3学习笔记】

热门文章

  1. Access is denied
  2. JavaScript本地存储实践(html5的localStorage和ie的userData)的实例页面
  3. CentOS 新增swap交换空间
  4. VS Code常用快捷键汇总
  5. 止欲知足,为获得幸福生活的根本法则之一
  6. Primefaces,Spring 4 with JPA(Hibernate 4 / EclipseLink)示例教程
  7. HTML 中多媒体设置:1、滚动字幕及滚动图片的设置 2、音乐视频的插入
  8. C语言圈叉游戏,圈叉棋小游戏的简单实现代码
  9. rpm | 升级软件包
  10. 【C语言】构建一个校园交通查询系统程序。能够规划出任意出发地和目的地之间的最短路径。...