Python文字识别
一、介绍
目前文字识别有两种方式
1、远端服务器识别返回结果
2、本地识别Tesseract-OCR
远端识别需要联网,这里以本地识别为例
二、相关库安装
pip install PIL
pip install pytesseract
下载Tesseract-OCR
链接:https://pan.baidu.com/s/1stgWF-aBKJ-l86vAMWaH1g
提取码:7m4m
默认安装就行
复制中文数据级进入
修改配置
#tesseract_cmd = ‘tesseract’
tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’
三、函数介绍
1、get_tesseract_version返回系统中安装的Tesseract版本。
2、image_to_string将图像上的Tesseract OCR运行结果返回到字符串
3、image_to_boxes返回包含已识别字符及其框边界的结果
4、image_to_data返回包含框边界,置信度和其他信息的结果。需要Tesseract 3.05+。有关更多信息,请查看Tesseract TSV文档
5、image_to_osd返回包含有关方向和脚本检测的信息的结果
image_to_data(image,lang = None,config =’’, nice = 0,output_type = Output.STRING)
参数
image Object,PIL Image /由Tesseract处理的图像的NumPy数组
lang String,Tesseract语言代码字符串
config String,任何其他配置为字符串,例如:config =’ - psm 6’
nice Integer,修改Tesseract运行的处理器优先级。Windows不支持。尼斯调整了类似unix的流程的优点。
output_type Class属性,指定输出的类型,默认为string。有关所有支持类型的完整列表,请检查pytesseract.Output类的定义
四、程序示例
1、图片文字识别
from PIL import Image
import pytesseracttext=pytesseract.image_to_string(Image.open('test.jpg'),lang='chi_sim')
print(text)
原始图片
识别结果
2、摄像头文字识别
预留
总体能识别,还是有误识别需要修改参数
Python文字识别相关推荐
- Python文字识别之tesseract-ocr和EasyOCR
Python文字识别之tesseract-ocr和EasyOCR 本文主要是将手机拍摄的图片文字通过Python OCR转换成Word文件,并尝试通过tesseract-ocr和EasyOCR两种方式 ...
- python文字识别算法_Python图像处理之图片文字识别(OCR)
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
- python文字识别并获取位置_python实现简单的文字识别
将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).今天我们用到的就是一个OCR 库--Tesseract. 首先要安装Tesseract,除 ...
- python文字识别库_python做文字识别一行代码都不用!
今天,我们用Python实现对图像文字的识别,很简单!利用的库是pillow和pytesseract.pytesseract需要从网上下载,也很方便. 学习Python中有不明白推荐加入交流群 号:9 ...
- python文字识别模块_PYTHON如何调取OCR识别模块识别发票并输出到EXCLE? | ocr在线识别导出excle...
PYTHON如何调取OCR识别模块识别发票并输出到EXCLE? import qqai from os import path from win32com.client import Dispatch ...
- 【python文字识别OCR】
问题 python实现文字识别 方法 tesseract-OCR方法,没有环境限制,pytorch还是tensorflow都可以用 步骤 1. 下载 tesseract-ocr 的exe文件 文件名称 ...
- python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能(OCR)...
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
- python文字识别前端_Python文字识别
import keyboard import time from PILimport ImageGrab#pip install from aipimport AipOcr#pip install b ...
- python 文字识别 tesseract_Python_文字识别引擎试用:tesseract-ocr
tesseract-ocr是一 个OCR引擎,在1985年到1995年由HP实验室开发,后来由google开发并且开源,支持多平台,支持多达40种语言,其中包括中文,支持训练,tesseract-oc ...
- python文字识别 训练_Python3.x:pytesseract识别率提高(样本训练)
Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个人 ...
最新文章
- 修改Activity响应音量控制键修改的音频流
- easyui tabs 使用iframe 出现两个垂直滚动条 解决方法
- sort和uniq命令
- 最小生成树的Kruskal算法实现
- Chrome OS 0.4.220 Beta下载已发布
- java redis 批量删除key_互联网大厂Java工程师面试指南——Redis篇
- 算法竞赛入门经典(第二版) | 程序3-6 WERTYU (UVa 10082)(常量数组)
- Useful code snippet to parse the key value pairs in URL
- macos安装低版本php,mac下安装多个版本PHP及切换
- Numpy高维数据的理解
- R 梯度提升算法①
- django 学习-7 模型数据操作
- 为什么python打不开_anaconda为什么打不开
- iOS 微信消息拦截插件系列教程-附录(服务端成果展示)
- 卡巴斯基最新Key下载 生成卡巴斯基Key的工具下载 卡巴斯基Key下载
- vue+video.js实现前端视频流(hls、MP4、flv)
- 视觉SLAM十四讲第七讲
- Word小技巧:图片批量裁剪与大小调整
- 六一儿童节,悼念天堂的小朋友
- 论文阅读:DEFORMABLE DETR:DEFORMABLE DETR: DEFORMABLE TRANSFORMERSFOR END-TO-END OBJECT DETECTION