【图像算法】pytesseract简单实现图片数字识别

【前置目的】
识别视频中是否包含目标元素；
抽象自动化，就是处理一段含有时间戳的视频；
再核心就是对视频进行图片裁减，识别出图片中的数字，做数学计算延时。

【学习地址】
环境：mac、python3、pytesseract库
关键语句：pytesseract.image_to_string 基本语言库，可支持汉子和数字的识别
后续就是OCR流程

机器学习
图像预处理：去噪、灰度化、图像增强等
文本检测：滑动窗口算法遍历整张图片
字符分类：划分单个字符，识别单字

【图片例子】
time1.png
time2.png

time3.pngtime4.png

eng.png

【代码实现】

import pytesseractdef seek_num():text1 = pytesseract.image_to_string(Image.open("time1.png"), lang='eng')print(text1)

识别结果：['ITE AY (8)\n\nbe\n\n20224712 A308\n\n']
['14:08:01\n']
['14:19:17\n\nFriday, 30 December 2022\n']
['14:56:10\n']
['nn BWNY\n\nWriting a Closing\n\nWrapping Up\n\nSummarize\n\nCheck for agreement\n\nReminders\n\nThank You / congratulations/ personal messages\n\nFollow Ups\n']

查看本地语言库支持的类型目录
cd /opt/homebrew/share/tessdata/

本地支持更高低点语言库，比如lang='chi_sim’等
https://github.com/tesseract-ocr/tessdata

【延伸问题】

pytesseract对代测图片的内容要求很高，一般带有点文字内容会识别出数字！！！
视频每帧输出成图片

ffmpeg -i input.mp4 -r 1 -s 1280,720 -ss 00:00:00 %d.png

需要用ffmpeg对图片大小进行裁剪，才难识别出具体的数字

ffmpeg -i input.png -vf crop=600:170:330:570 outpit.png

crop=W:H:X:Y参数说明
W:输出视频的宽度
H:输出视频的高度
X:开始裁剪的水平位置，从左边开始(绝对左距为0)。默认为中心(iw-ow)/2
Y:开始裁剪的垂直位置，从视频的顶部开始(绝对顶部为0)。默认为中心(ih-oh)/2

(也可以在视频剪切成每张图片之前先对视频进行裁剪)

对输出的内容进行替换，可能存在标点符号的问题
（勉强可用，支持了我的诉求～）

【图像算法】pytesseract简单实现图片数字识别相关推荐

用Python进行简单的图片数字识别（1）
一.源代码 from PIL import Image im = Image.open("F:/result/4.jpg") # 先将图片转为固定宽高如55*55以符合一行txt文 ...
Python 基础之 jupyter notebook 中机器学习的简单入门书写数字识别 demo 操作学习
Python 基础之 jupyter notebook 中机器学习的简单入门书写数字识别 demo 操作学习目录 Python 基础之 jupyter notebook 中机器学习的简单入门书写 ...
OPENCV图片数字识别
这个非常麻烦,麻烦到我真的不想做但是我也没有办法的呢好了开始这个图片数字识别例如把下面的信用卡上的数字识别出来因为这次的代码分段比较多,所以把重复操作的过程打包成函数提前运行了 import ...
python:pytesseract库实现图片文字识别
import pytesseract from PIL import Imagetext = pytesseract.image_to_string(Image.open(r"E:\repo ...
Tesseract-OCR 图片数字识别的样本训练
最近想利用python写一段识别穿越火线交易所各种道具价格的代码.命令行执行: tesseract.exe grab.jpg result -l eng 使用默认的Tesseract语言库总会识别成字 ...
opencl 加速 c语言程序_在AlveoU200加速卡上实现简单手写数字识别
最近实验室租了块xilinx家的AlveoU200加速卡,过去几天被这块板吸引了注意力.刚开始了解,做点什么来试试水呢?一想,可以把曾经学 @蔡宇杰大佬在pynq-z2上做的那个手写数字识别工程在这 ...
（python）实现一个简单的图片文字识别脚本
文章目录截图文字识别## 访问剪切板总结快毕业了,除了准备答辩之外,就是看看书,各种瞎晃~ 那么,这两天在看书的时候遇到这么个问题: 首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程 ...
python图片数字识别_python 识别图片上的数字
https://blog.csdn.net/qq_31446377/article/details/81708006 ython 3.6 版本 Pytesseract 图像验证码识别环境: (1) ...
python实现简单的图片文字识别脚本
我们都知道,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程中无法选取文字.对于平时有记录习惯的人来说,无法复制黏贴真的很不爽! 为了解决这个问题,需要这样一个脚本,他有下面这些功能: 1.能够实 ...

【图像算法】pytesseract简单实现图片数字识别

【图像算法】pytesseract简单实现图片数字识别相关推荐

最新文章

热门文章