python 图像识别 1

一、安装pytesseract和PIL

　　　PIL全称：Python Imaging Library，python图像处理库，这个库支持多种文件格式，并提供了强大的图像处理和图形处理能力。

　　　由于PIL仅支持到Python 2.7，所以在PIL的基础上创建了Pillow库，支持最新Python 3.x。

　　1、使用pycharm编辑器安装，如下操作步骤。

　　安装成功：

　　安装pytesseract时，同时安装pillow，所以我们只需安装pytesseract即可。

　　3.尝试运行，

源码如下：

from PIL import Image import pytesseract Image = Image.open('1.png') # 打开图片text = pytesseract.image_to_string(Image,lang='chi_sim') #使用简体中文解析图片 print(text)

　　　出现报错，如下图，

　　　原因：没有安装识别引擎tesseract-ocr

二、安装识别引擎tesseract-ocr

　　1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别，经过改进引擎和训练系统，它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符，但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言（比如中文）上较慢，但是工作良好。

　　下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

　　因为tesseract-ocr默认不支持中文识别。

　　将下载到的文件：chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下，如图：

　　2，安装完成tesseract-ocr后，需要做一下配置。

　　　　在Python安装目录（如：D:\Python35\Lib\site-packages\pytesseract）中修改 pytesseract.py文件。

　　　　也可以通过pycharm，Ctrl+B 快速打开pytesseract源码文件：

　　3.尝试运行，出现如下报错：

　　pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your 　　"tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

　　4.解决方法：将tessdata目录的上级目录所在路径：(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中，如下图：

　　　　注意：配置完环境变量需要重新打开pycharm编辑器（IDE）。

　　5.再次运行结果：图片识别成功！

　　但识别率不是很高，后期优化，持续更新。

python 图像识别 1相关推荐

python 图像识别_python图像识别之图片相似度计算
作者 | a1131825850疯子来源 | Python爬虫scrapy 原文 | python图像识别---------图片相似度计算 1.背景要识别两张图片是否相似,首先我们可能会区分这两张 ...
python图片识别-python图像识别
python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用. 安装安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径.环境变量甚至与linux不同的路径分 ...
[Python图像识别] 四十九.图像生成之什么是生成对抗网络GAN？基础原理和代码普及
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
[Python图像识别] 四十八.Pytorch构建Faster-RCNN模型实现小麦目标检测
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
[Python图像识别] 四十六.图像预处理之图像去雾详解（ACE算法和暗通道先验去雾算法）
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
[Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
Python图像识别
Python图像识别第一次写博客首先说明,我只是一个刚开始学习python的学生,此博客纯粹记录我学习的过程,如果代码过程中有问题或者有更好的实现方法,希望业界各位大佬指点.评论工具 pycha ...
python 图像识别实现四川麻将回放牌面数据
python 图像识别自动获取麻将APP实时牌面数据前面写了一篇文章,深度学习图像识别麻将APP数据,然后结合自己的算法实现自动打麻将demo!很多朋友感兴趣.最开始做这个也只是为了研究学习图像识 ...
python识别数字程序_python实现识别手写数字 python图像识别算法
写在前面这一段的内容可以说是最难的一部分之一了,因为是识别图像,所以涉及到的算法会相比之前的来说比较困难,所以我尽量会讲得清楚一点. 而且因为在编写的过程中,把前面的一些逻辑也修改了一些,将其变得更 ...
[Python图像识别] 五十一.水书图像识别之利用数据增强扩充图像数据集
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

python 图像识别 1

二、安装识别引擎tesseract-ocr

python 图像识别 1相关推荐

最新文章

热门文章