1.说明
1)Python版本:3.x
2)安装PIL、pytesseract
3)安装识别引擎tesseract-ocr

4)测试两张图片,denggao.jpg(中文信息)、test.jpg(英文信息)

2.安装操作
1)进入cmd界面,执行以下两行命令,进行PIL和pytesseract的安装(界面可看安装进度条):
pip install PIL 
pip install pytesseract 
2)测试安装成功与否,在Python界面执行以下语句,不报错即安装成功:
from PIL import Image
import pytesseract

3.安装好PIL和pytesseract之后,运行下面代码:
# # 对于中文信息的提取,需要加lang='chi_sim',调用中文词库
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\denggao.jpg'),lang='chi_sim')
print(text)

报这样的错误,原因包含2个:其一,图片路径错误;其二,没有安装识别引擎tesseract-ocr。

我们进行原因排查,运行下面代码:
from skimage import io  
img=io.imread('C:\\Users\\Administrator\\Desktop\\denggao.jpg')  
io.imshow(img)  
如果not such file则表示物理路径出错了,如果能浏览到图片,则表示路径没问题,可以看到:

from skimage import io  
img=io.imread('C:\\Users\\Administrator\\Desktop\\test.jpg')  
io.imshow(img)

在确认物理地址读取没有问题之后,如果执行前面获取信息的语句仍然报错,那么原因就可以锁定为没有安装识别引擎tesseract-ocr。

4.安装识别引擎tesseract-ocr
1)下载下面的安装包,然后直接点击安装即可:
http://download.csdn.net/download/qq_40426415/10237320

2)解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。

3)安装完成tesseract-ocr后,我们还需要做一下配置 
方法1:
在C:\Anaconda3\Lib\site-packages\ptyprocess找到pytesseract.py打开后做如下操作:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

方法2:
在Python变成页面,Ctrl+鼠标右键,选择import pytesseract中的pytesseract,快速打开pytesseract.py进行路径修改;

5.至此我们所有的配置就完成了,运行下面代码就可以从图片中解析出中文信息和英文信息了
# # 对于中文信息的提取,需要加lang='chi_sim',调用中文词库
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\denggao.jpeg'),lang='chi_sim')
# # 输出结果
print(text)

# # 对于英文处理,不需lang='chi_sim'
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.jpg'))
# # 输出结果
print(text)

Python实现图片中英文信息识别相关推荐

  1. 【Python例】利用 python 进行图片文字信息的提取 --- OCR-EasyOCR

    [Python例]利用 python 进行图片文字信息的提取 - OCR-EasyOCR 本文主要用于记录,并使用 python 脚本进行图片文字信息的生成. 什么是 OCR? OCR OCR(Opt ...

  2. 使用python进行图片的文字识别

    使用python进行图片的文字识别 文章目录 使用python进行图片的文字识别 安装 Tesseract OCR 安装过程 配置系统的环境变量 安装python的第三方库 Pytesseract库 ...

  3. 用python获得图片定位信息

    用Python exifread 库获取和实现图片的定位 首先,安装这个库 pip install exifread 安装成功!!! 确定经纬度功能函数 查找GPS图片 def find_GPS_im ...

  4. Python改变图片EXIF信息(修复图片上传后方向改变的BUG)

    文章目录 简介 安装 读取 EXIF 保存 EXIF 插入 EXIF 删除 EXIF 复制 EXIF 将 PIL 读取的信息存入 EXIF 标签内容 根据旋转信息旋转图片 生成一套方向图片 ExifT ...

  5. python 进行图片的文字识别

    需要安装一些库才能够进行: pip3 install tesseractapt-get install tesseract-ocrpip install pytesseract 图片如下: 代码短小精 ...

  6. python 标准图片数字OCR识别

    基于像素比对的方式识别图片数字,常见于价格展示中 原生库+逻辑(用一张数字图片作为基准,和待预测图片取差)比对,比较轻量级 包含预测准确率评价 import numpy as np from PIL ...

  7. python读取图片属性信息

    import exifread def read():GPS = {}date = ''with open("D:\py项目工程\自动化测试\练习\IMG20201013135058.jpg ...

  8. 用python读取图像_Python读取图片属性信息的实现方法

    本文是利用Python脚本读取图片信息,有几个说明如下: 1.没有实现错误处理 2.没有读取所有信息,大概只有 GPS 信息.图片分辨率.图片像素.设备商.拍摄设备等 3.简单修改后应该能实现暴力修改 ...

  9. python如何获取图片的尺寸_如何基于Python获取图片的物理尺寸

    如何基于Python获取图片的物理尺寸 这篇文章主要介绍了如何基于Python获取图片的物理尺寸,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 问题 ...

最新文章

  1. app开发外包的流程、需求、报价,需要知道的细节!
  2. 【python教程入门学习】利用Python绘制关系网络图
  3. java boolean几个字节_Java中boolean类型到底占用多少个字节?
  4. python 二叉树遍历
  5. js条件语句初步练习
  6. 【渝粤教育】国家开放大学2018年秋季 0551-22T素描(二) 参考试题
  7. 【RK3399Pro学习笔记】十、ROS服务端Server的编程实现
  8. 远程用power shell 管理vmware view 池用户
  9. Python中文编码过程中遇到的一些问题
  10. 【机器学习】算法调参
  11. LEADTOOLS构建HTML5 DICOM/PACS查看器
  12. BZOJ 2463: [中山市选2009]谁能赢呢?
  13. python教材答案第四章_第四章-习题答案
  14. 剑网三 服务器维护时间,剑网3白帝风云什么时候开放
  15. 博弈论:零和博弈与常和博弈的区别
  16. vertica数据库监控
  17. RGB颜色值与十六进制颜色码对照表
  18. 动态规划(Dynamic Programing)背包——01背包
  19. 白鹭(egret)引擎安装及使用
  20. Excel学习日记:L21-表格数值格式

热门文章

  1. [TCL]Tcl语言基礎教程(二)
  2. matlab自耦变压器,基于MATLAB的500kV自耦变压器建模及仿真.pdf
  3. 绘制地铁线路html,基于HTML5技术绘制上海地铁图
  4. react生命周期总结
  5. react生命周期与优化
  6. 多读书多看报...... http://www.it-ebooks.info/
  7. 四川大学计算机考研课程表,2019年四川大学研究生教学运行作息时间表.doc
  8. 市场营销策划书的设计与撰写
  9. 许奔创新社-第28问:创新符合用进废退原则吗?
  10. 【iHMI43 4.3寸液晶模块】demo竖屏例程(版本1.01)发布