一、介绍
目前文字识别有两种方式
1、远端服务器识别返回结果
2、本地识别Tesseract-OCR

远端识别需要联网,这里以本地识别为例

二、相关库安装
pip install PIL
pip install pytesseract

下载Tesseract-OCR
链接:https://pan.baidu.com/s/1stgWF-aBKJ-l86vAMWaH1g
提取码:7m4m


默认安装就行
复制中文数据级进入
修改配置
#tesseract_cmd = ‘tesseract’
tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’


三、函数介绍
1、get_tesseract_version返回系统中安装的Tesseract版本。
2、image_to_string将图像上的Tesseract OCR运行结果返回到字符串
3、image_to_boxes返回包含已识别字符及其框边界的结果
4、image_to_data返回包含框边界,置信度和其他信息的结果。需要Tesseract 3.05+。有关更多信息,请查看Tesseract TSV文档
5、image_to_osd返回包含有关方向和脚本检测的信息的结果

image_to_data(image,lang = None,config =’’, nice = 0,output_type = Output.STRING)
参数
image Object,PIL Image /由Tesseract处理的图像的NumPy数组
lang String,Tesseract语言代码字符串
config String,任何其他配置为字符串,例如:config =’ - psm 6’
nice Integer,修改Tesseract运行的处理器优先级。Windows不支持。尼斯调整了类似unix的流程的优点。
output_type Class属性,指定输出的类型,默认为string。有关所有支持类型的完整列表,请检查pytesseract.Output类的定义

四、程序示例
1、图片文字识别

from PIL import Image
import pytesseracttext=pytesseract.image_to_string(Image.open('test.jpg'),lang='chi_sim')
print(text)

原始图片

识别结果

2、摄像头文字识别
预留

总体能识别,还是有误识别需要修改参数

Python文字识别相关推荐

  1. Python文字识别之tesseract-ocr和EasyOCR

    Python文字识别之tesseract-ocr和EasyOCR 本文主要是将手机拍摄的图片文字通过Python OCR转换成Word文件,并尝试通过tesseract-ocr和EasyOCR两种方式 ...

  2. python文字识别算法_Python图像处理之图片文字识别(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  3. python文字识别并获取位置_python实现简单的文字识别

    将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).今天我们用到的就是一个OCR 库--Tesseract. 首先要安装Tesseract,除 ...

  4. python文字识别库_python做文字识别一行代码都不用!

    今天,我们用Python实现对图像文字的识别,很简单!利用的库是pillow和pytesseract.pytesseract需要从网上下载,也很方便. 学习Python中有不明白推荐加入交流群 号:9 ...

  5. python文字识别模块_PYTHON如何调取OCR识别模块识别发票并输出到EXCLE? | ocr在线识别导出excle...

    PYTHON如何调取OCR识别模块识别发票并输出到EXCLE? import qqai from os import path from win32com.client import Dispatch ...

  6. 【python文字识别OCR】

    问题 python实现文字识别 方法 tesseract-OCR方法,没有环境限制,pytorch还是tensorflow都可以用 步骤 1. 下载 tesseract-ocr 的exe文件 文件名称 ...

  7. python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能(OCR)...

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  8. python文字识别前端_Python文字识别

    import keyboard import time from PILimport ImageGrab#pip install from aipimport AipOcr#pip install b ...

  9. python 文字识别 tesseract_Python_文字识别引擎试用:tesseract-ocr

    tesseract-ocr是一 个OCR引擎,在1985年到1995年由HP实验室开发,后来由google开发并且开源,支持多平台,支持多达40种语言,其中包括中文,支持训练,tesseract-oc ...

  10. python文字识别 训练_Python3.x:pytesseract识别率提高(样本训练)

    Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个人 ...

最新文章

  1. 修改Activity响应音量控制键修改的音频流
  2. easyui tabs 使用iframe 出现两个垂直滚动条 解决方法
  3. sort和uniq命令
  4. 最小生成树的Kruskal算法实现
  5. Chrome OS 0.4.220 Beta下载已发布
  6. java redis 批量删除key_互联网大厂Java工程师面试指南——Redis篇
  7. 算法竞赛入门经典(第二版) | 程序3-6 WERTYU (UVa 10082)(常量数组)
  8. Useful code snippet to parse the key value pairs in URL
  9. macos安装低版本php,mac下安装多个版本PHP及切换
  10. Numpy高维数据的理解
  11. R 梯度提升算法①
  12. django 学习-7 模型数据操作
  13. 为什么python打不开_anaconda为什么打不开
  14. iOS 微信消息拦截插件系列教程-附录(服务端成果展示)
  15. 卡巴斯基最新Key下载 生成卡巴斯基Key的工具下载 卡巴斯基Key下载
  16. vue+video.js实现前端视频流(hls、MP4、flv)
  17. 视觉SLAM十四讲第七讲
  18. Word小技巧:图片批量裁剪与大小调整
  19. 六一儿童节,悼念天堂的小朋友
  20. 论文阅读:DEFORMABLE DETR:DEFORMABLE DETR: DEFORMABLE TRANSFORMERSFOR END-TO-END OBJECT DETECTION

热门文章

  1. iOS开发:对于动态库共享缓存(dyld)的了解
  2. KDE桌面下konsole打开terminal/tab 并执行命令或脚本
  3. Linux系统时钟同步
  4. 同源时钟/同步时钟/异步时钟/同源时钟之间时序约束/clk group
  5. 获取两个指定数之间的随机数(万能公式)
  6. 怎样在电脑上设置路由器的WiFi密码
  7. c语言用if函数如何判断闰年,excel怎么用IF公式判断闰?
  8. Markdown文档编写规则:标题
  9. 生存分析-Cox回归模型
  10. 常用电阻阻值表怎么定的?