import pytesseract
from PIL import Imagetext = pytesseract.image_to_string(Image.open(r"E:\report\chen\4.png"), lang='chi_sim')print(text)

运行结果

D:\Python3.8.6\python.exe D:/PythonWorkSpace/Auto_test_wuhan/common/utils/char_recognize.py
空 调Process finished with exit code 0

图片文字识别的代码很简单,难就难在文件的配置、环境变量、语言包的下载。下面是我遇到的问题及解决方法

语言包Tesseract OCR 下载安装 (中英文语言包) 下载路径如下

1.GitHub - tesseract-ocr/tessdata: Trained models with support for legacy and LSTM OCR engine

2.找到简中的语言包下载完后安装Tesseract-OCR

3.安装完成后需要配置环境变量

4.增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中

5.打开终端,输入:tesseract -v,可以看到版本信息,表示安装成功

6.这个时候运行代码仍然会报错提示pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH

7.在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd='tesseract',这里并没有指定文件路径

8.修改成刚才安装的路径 

9.现在运行程序就不报错啦。如果图片包含文字较多或较小,可能出现识别不准确问题,可以对图片进行剪裁,只保留要识别的区域可解决该问题。

python:pytesseract库实现图片文字识别相关推荐

  1. python实现简单的图片文字识别脚本

    我们都知道,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程中无法选取文字.对于平时有记录习惯的人来说,无法复制黏贴真的很不爽! 为了解决这个问题,需要这样一个脚本,他有下面这些功能: 1.能够实 ...

  2. 基于Python的离线OCR图片文字识别(一)——命令行方式对图像文件处理生成同名txt文件

    应用背景:在正式开始文章之前,先阐述一下项目的应用背景--项目需要对已有的电子档案数据进行"大数据"处理和呈现,但是由于之前进行档案电子化时都是以扫描文件的图像格式存储在硬盘上(准 ...

  3. 【Python 基于EasyOCR库进行图片文字识别】

    文章目录 一.概况 目前支持的语言 二.安装指南(windows) 1.通过pip安装 2.通过源代码安装 三.代码运用OCR 要识别的图片 1.代码_I 识别结果_1 2.代码_II 识别结果_2 ...

  4. 基于Python的离线OCR图片文字识别(三)——支持PDF文件

    前面第一个版本实现了基本的ocr功能,可以对某图像文件进行处理,将ocr结果以同名txt文件的方式保存在图像文件同路径下: 然后在第二个版本中又实现了对文件夹参数的支持,也即可以对某个包含大量图像文件 ...

  5. 基于Python的离线OCR图片文字识别(四)——支持txt文件指定路径保存

    虽然在前面在第二次升级时就已经通过json配置文件支持将ocr识别结果txt保存到指定的文件夹里了,但由于指定待识别文件夹时文件夹里面可能包含多个不同的子文件夹.不同的子文件夹里面可能包含同名的图像文 ...

  6. 基于Python的离线OCR图片文字识别(五)——终极版本

    至此,终于迎来了离线ocr的终极大结局,命令行后面参数既支持图像文件.图像文件夹,还支持PDF图像类型的文件,既支持通过json文件进行参数配置,又支持帮助文档,easyOCR包既支持允许字符集(也即 ...

  7. 小猪的Python学习之旅 —— 13.文字识别库pytesseract初体验

    小猪的Python学习之旅 -- 13.文字识别库pytesseract初体验 标签:Python 引言 度过了短暂的春节假期,又要开始继续搬砖了,因为还处于节后 综合征,各种散漫,不想看任何代码相关 ...

  8. python图像识别系统_Python图像处理之图片文字识别功能(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  9. python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能(OCR)...

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

最新文章

  1. 在ChemDraw中如何使用ChemACX
  2. pythonpandas函数详解_对pandas中Series的map函数详解
  3. 使用xilinx的documentation navigator快速查找资料
  4. cppcheck编译安装命令
  5. C~K的班级_JAVA
  6. Android应用程序请求SurfaceFlinger服务渲染Surface的过程分析
  7. python list常用方法_Python中列表(List)的基本用法
  8. python Requests登录GitHub
  9. python 剪切一行内容到另一个文件
  10. python电脑编程求圆的面积案例_学Python划重点七 网络编程(UPD Socket编程、上传文件实例、计算圆的面积实例)...
  11. html2canvas图片坐标,html2canvas生成的图片偏移不完整的解决方法
  12. [APK拆解]谷歌眼镜XE16设置新语言,当你盯着屏幕时可同步检测
  13. linux下查看tomcat使用的jdk版本
  14. 金蝶K3系统数据库群集部署方案
  15. 单细胞分析实录(16): 非负矩阵分解(NMF)检测细胞异质性
  16. cdn加速的原理及步骤
  17. 基于普中A2开发板(STC80C51单片机)呈现的中断小实验代码电路及其效果。
  18. linux小米随身wifi密码,Ubuntu用小米随身WiFi
  19. Balance安装及用法小结
  20. Jmeter中线程组对Sampler和对循环控制器的作用

热门文章

  1. 良心帖!看完这篇,你的Python入门基础就差不多了!
  2. 内核版本与发行版本(CentOS Ubuntu)的对应关系
  3. pywin32 python3.6_windos64位下python3.6安装pywin32的问题
  4. 如何了解对手?竞争对手的数据分析方法
  5. win10使用磁盘管理器创建并配置VHD虚拟磁盘,创建分区和简单卷以及虚拟磁盘的挂载和分离
  6. MySQL服务器安装(轻松带你安装)
  7. 一看就懂的Alpha-Beta剪枝算法详解
  8. html里的odd作用,html – :nth-​​child(even / odd)选择器与类
  9. 计算机软件专业 英文,大学生计算机软件专业英文简历范文
  10. VUE获取当前点击元素