Python实现图片中英文信息识别
1.说明
1)Python版本:3.x
2)安装PIL、pytesseract
3)安装识别引擎tesseract-ocr
4)测试两张图片,denggao.jpg(中文信息)、test.jpg(英文信息)
2.安装操作
1)进入cmd界面,执行以下两行命令,进行PIL和pytesseract的安装(界面可看安装进度条):
pip install PIL
pip install pytesseract
2)测试安装成功与否,在Python界面执行以下语句,不报错即安装成功:
from PIL import Image
import pytesseract
3.安装好PIL和pytesseract之后,运行下面代码:
# # 对于中文信息的提取,需要加lang='chi_sim',调用中文词库
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\denggao.jpg'),lang='chi_sim')
print(text)
报这样的错误,原因包含2个:其一,图片路径错误;其二,没有安装识别引擎tesseract-ocr。
我们进行原因排查,运行下面代码:
from skimage import io
img=io.imread('C:\\Users\\Administrator\\Desktop\\denggao.jpg')
io.imshow(img)
如果not such file则表示物理路径出错了,如果能浏览到图片,则表示路径没问题,可以看到:
from skimage import io
img=io.imread('C:\\Users\\Administrator\\Desktop\\test.jpg')
io.imshow(img)
在确认物理地址读取没有问题之后,如果执行前面获取信息的语句仍然报错,那么原因就可以锁定为没有安装识别引擎tesseract-ocr。
4.安装识别引擎tesseract-ocr
1)下载下面的安装包,然后直接点击安装即可:
http://download.csdn.net/download/qq_40426415/10237320
2)解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。
3)安装完成tesseract-ocr后,我们还需要做一下配置
方法1:
在C:\Anaconda3\Lib\site-packages\ptyprocess找到pytesseract.py打开后做如下操作:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
方法2:
在Python变成页面,Ctrl+鼠标右键,选择import pytesseract中的pytesseract,快速打开pytesseract.py进行路径修改;
5.至此我们所有的配置就完成了,运行下面代码就可以从图片中解析出中文信息和英文信息了
# # 对于中文信息的提取,需要加lang='chi_sim',调用中文词库
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\denggao.jpeg'),lang='chi_sim')
# # 输出结果
print(text)
# # 对于英文处理,不需lang='chi_sim'
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.jpg'))
# # 输出结果
print(text)
Python实现图片中英文信息识别相关推荐
- 【Python例】利用 python 进行图片文字信息的提取 --- OCR-EasyOCR
[Python例]利用 python 进行图片文字信息的提取 - OCR-EasyOCR 本文主要用于记录,并使用 python 脚本进行图片文字信息的生成. 什么是 OCR? OCR OCR(Opt ...
- 使用python进行图片的文字识别
使用python进行图片的文字识别 文章目录 使用python进行图片的文字识别 安装 Tesseract OCR 安装过程 配置系统的环境变量 安装python的第三方库 Pytesseract库 ...
- 用python获得图片定位信息
用Python exifread 库获取和实现图片的定位 首先,安装这个库 pip install exifread 安装成功!!! 确定经纬度功能函数 查找GPS图片 def find_GPS_im ...
- Python改变图片EXIF信息(修复图片上传后方向改变的BUG)
文章目录 简介 安装 读取 EXIF 保存 EXIF 插入 EXIF 删除 EXIF 复制 EXIF 将 PIL 读取的信息存入 EXIF 标签内容 根据旋转信息旋转图片 生成一套方向图片 ExifT ...
- python 进行图片的文字识别
需要安装一些库才能够进行: pip3 install tesseractapt-get install tesseract-ocrpip install pytesseract 图片如下: 代码短小精 ...
- python 标准图片数字OCR识别
基于像素比对的方式识别图片数字,常见于价格展示中 原生库+逻辑(用一张数字图片作为基准,和待预测图片取差)比对,比较轻量级 包含预测准确率评价 import numpy as np from PIL ...
- python读取图片属性信息
import exifread def read():GPS = {}date = ''with open("D:\py项目工程\自动化测试\练习\IMG20201013135058.jpg ...
- 用python读取图像_Python读取图片属性信息的实现方法
本文是利用Python脚本读取图片信息,有几个说明如下: 1.没有实现错误处理 2.没有读取所有信息,大概只有 GPS 信息.图片分辨率.图片像素.设备商.拍摄设备等 3.简单修改后应该能实现暴力修改 ...
- python如何获取图片的尺寸_如何基于Python获取图片的物理尺寸
如何基于Python获取图片的物理尺寸 这篇文章主要介绍了如何基于Python获取图片的物理尺寸,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 问题 ...
最新文章
- app开发外包的流程、需求、报价,需要知道的细节!
- 【python教程入门学习】利用Python绘制关系网络图
- java boolean几个字节_Java中boolean类型到底占用多少个字节?
- python 二叉树遍历
- js条件语句初步练习
- 【渝粤教育】国家开放大学2018年秋季 0551-22T素描(二) 参考试题
- 【RK3399Pro学习笔记】十、ROS服务端Server的编程实现
- 远程用power shell 管理vmware view 池用户
- Python中文编码过程中遇到的一些问题
- 【机器学习】算法调参
- LEADTOOLS构建HTML5 DICOM/PACS查看器
- BZOJ 2463: [中山市选2009]谁能赢呢?
- python教材答案第四章_第四章-习题答案
- 剑网三 服务器维护时间,剑网3白帝风云什么时候开放
- 博弈论:零和博弈与常和博弈的区别
- vertica数据库监控
- RGB颜色值与十六进制颜色码对照表
- 动态规划(Dynamic Programing)背包——01背包
- 白鹭(egret)引擎安装及使用
- Excel学习日记:L21-表格数值格式
热门文章
- [TCL]Tcl语言基礎教程(二)
- matlab自耦变压器,基于MATLAB的500kV自耦变压器建模及仿真.pdf
- 绘制地铁线路html,基于HTML5技术绘制上海地铁图
- react生命周期总结
- react生命周期与优化
- 多读书多看报...... http://www.it-ebooks.info/
- 四川大学计算机考研课程表,2019年四川大学研究生教学运行作息时间表.doc
- 市场营销策划书的设计与撰写
- 许奔创新社-第28问:创新符合用进废退原则吗?
- 【iHMI43 4.3寸液晶模块】demo竖屏例程(版本1.01)发布