Python文字识别

一、介绍
目前文字识别有两种方式
1、远端服务器识别返回结果
2、本地识别Tesseract-OCR

远端识别需要联网，这里以本地识别为例

二、相关库安装
pip install PIL
pip install pytesseract

下载Tesseract-OCR
链接：https://pan.baidu.com/s/1stgWF-aBKJ-l86vAMWaH1g
提取码：7m4m

默认安装就行
复制中文数据级进入
修改配置
#tesseract_cmd = ‘tesseract’
tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’

三、函数介绍
1、get_tesseract_version返回系统中安装的Tesseract版本。
2、image_to_string将图像上的Tesseract OCR运行结果返回到字符串
3、image_to_boxes返回包含已识别字符及其框边界的结果
4、image_to_data返回包含框边界，置信度和其他信息的结果。需要Tesseract 3.05+。有关更多信息，请查看Tesseract TSV文档
5、image_to_osd返回包含有关方向和脚本检测的信息的结果

image_to_data（image，lang = None，config =’’， nice = 0，output_type = Output.STRING）
参数
image Object，PIL Image /由Tesseract处理的图像的NumPy数组
lang String，Tesseract语言代码字符串
config String，任何其他配置为字符串，例如：config =’ - psm 6’
nice Integer，修改Tesseract运行的处理器优先级。Windows不支持。尼斯调整了类似unix的流程的优点。
output_type Class属性，指定输出的类型，默认为string。有关所有支持类型的完整列表，请检查pytesseract.Output类的定义

四、程序示例
1、图片文字识别

from PIL import Image
import pytesseracttext=pytesseract.image_to_string(Image.open('test.jpg'),lang='chi_sim')
print(text)

原始图片

识别结果

2、摄像头文字识别
预留

总体能识别，还是有误识别需要修改参数

Python文字识别相关推荐

Python文字识别之tesseract-ocr和EasyOCR
Python文字识别之tesseract-ocr和EasyOCR 本文主要是将手机拍摄的图片文字通过Python OCR转换成Word文件,并尝试通过tesseract-ocr和EasyOCR两种方式 ...
python文字识别算法_Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
python文字识别并获取位置_python实现简单的文字识别
将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).今天我们用到的就是一个OCR 库--Tesseract. 首先要安装Tesseract,除 ...
python文字识别库_python做文字识别一行代码都不用！
今天,我们用Python实现对图像文字的识别,很简单!利用的库是pillow和pytesseract.pytesseract需要从网上下载,也很方便. 学习Python中有不明白推荐加入交流群号:9 ...
python文字识别模块_PYTHON如何调取OCR识别模块识别发票并输出到EXCLE？ | ocr在线识别导出excle...
PYTHON如何调取OCR识别模块识别发票并输出到EXCLE? import qqai from os import path from win32com.client import Dispatch ...
【python文字识别OCR】
问题 python实现文字识别方法 tesseract-OCR方法,没有环境限制,pytorch还是tensorflow都可以用步骤 1. 下载 tesseract-ocr 的exe文件文件名称 ...
python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能（OCR)...
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
python文字识别前端_Python文字识别
import keyboard import time from PILimport ImageGrab#pip install from aipimport AipOcr#pip install b ...
python 文字识别 tesseract_Python_文字识别引擎试用：tesseract-ocr
tesseract-ocr是一个OCR引擎,在1985年到1995年由HP实验室开发,后来由google开发并且开源,支持多平台,支持多达40种语言,其中包括中文,支持训练,tesseract-oc ...
python文字识别训练_Python3.x：pytesseract识别率提高（样本训练）
Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个人 ...

Python文字识别

Python文字识别相关推荐

最新文章

热门文章