python 图像识别 1
一、安装pytesseract和PIL
PIL全称:Python Imaging Library,python图像处理库,这个库支持多种文件格式,并提供了强大的图像处理和图形处理能力。
由于PIL仅支持到Python 2.7,所以在PIL的基础上创建了Pillow库,支持最新Python 3.x。
1、使用pycharm编辑器安装,如下操作步骤。
安装成功:
安装pytesseract时,同时安装pillow,所以我们只需安装pytesseract即可。
3.尝试运行,
源码如下:
from PIL import Image import pytesseract Image = Image.open('1.png') # 打开图片text = pytesseract.image_to_string(Image,lang='chi_sim') #使用简体中文解析图片 print(text)
出现报错,如下图,
原因:没有安装识别引擎tesseract-ocr
二、安装识别引擎tesseract-ocr
1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别,经过改进引擎和训练系统,它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符,但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言(比如中文)上较慢,但是工作良好。
下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3
因为tesseract-ocr默认不支持中文识别。
将下载到的文件:chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下,如图:
2,安装完成tesseract-ocr后,需要做一下配置 。
在Python安装目录(如:D:\Python35\Lib\site-packages\pytesseract) 中修改 pytesseract.py文件。
也可以通过pycharm,Ctrl+B 快速打开pytesseract源码文件:
3.尝试运行,出现如下报错:
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
4.解决方法:将tessdata目录的上级目录所在路径:(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中,如下图:
注意:配置完环境变量需要重新打开pycharm编辑器(IDE)。
5.再次运行结果:图片识别成功!
但识别率不是很高,后期优化,持续更新。
python 图像识别 1相关推荐
- python 图像识别_python图像识别之图片相似度计算
作者 | a1131825850疯子 来源 | Python爬虫scrapy 原文 | python图像识别---------图片相似度计算 1.背景 要识别两张图片是否相似,首先我们可能会区分这两张 ...
- python图片识别-python图像识别
python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用. 安装 安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径.环境变量甚至与linux不同的路径分 ...
- [Python图像识别] 四十九.图像生成之什么是生成对抗网络GAN?基础原理和代码普及
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
- [Python图像识别] 四十八.Pytorch构建Faster-RCNN模型实现小麦目标检测
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
- [Python图像识别] 四十六.图像预处理之图像去雾详解(ACE算法和暗通道先验去雾算法)
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
- [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
- Python图像识别
Python图像识别 第一次写博客 首先说明,我只是一个刚开始学习python的学生,此博客纯粹记录我学习的过程,如果代码过程中有问题或者有更好的实现方法,希望业界各位大佬指点.评论 工具 pycha ...
- python 图像识别实现四川麻将回放牌面数据
python 图像识别 自动获取麻将APP实时牌面数据 前面写了一篇文章,深度学习图像识别麻将APP数据,然后结合自己的算法实现自动打麻将demo!很多朋友感兴趣.最开始做这个也只是为了研究学习图像识 ...
- python识别数字程序_python实现识别手写数字 python图像识别算法
写在前面 这一段的内容可以说是最难的一部分之一了,因为是识别图像,所以涉及到的算法会相比之前的来说比较困难,所以我尽量会讲得清楚一点. 而且因为在编写的过程中,把前面的一些逻辑也修改了一些,将其变得更 ...
- [Python图像识别] 五十一.水书图像识别之利用数据增强扩充图像数据集
该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...
最新文章
- 使用MASM03 - Win32汇编语言011
- 界面 高炉系统_浅议工业互联网与传统计算机系统的关系
- 一个重复try语句的实验
- javascript创建类_如何在10分钟内使用JavaScript创建费用管理器
- Spring Boot 2.3.3 正式发布!
- [译][Tkinter 教程15] event 事件绑定
- Flex 基于数据源的Menu Tree
- 【雷达通信】基于matlab雷达数字信号处理【含Matlab源码 281期】
- vue模块单独封装html,在vue中怎么定义自定义组件?
- C++ 实现matlab高斯滤波函数imgaussfilt
- 如何取消计算机中的0-9,告诉你如何关闭win10易升程序
- ug冲模标准件库_UG NX插件
- 音频功放的失真的原因分析及测量
- 就这一篇:教你真正有效地解决爆满的C盘!
- matlab计算海洋浮力频率_海洋要素计算:潮汐调和分析
- Ubuntu安装eog遇到的坑及解决方案
- 下载xcode 6 beta.dmg
- Unity使用PhotoShop制作磨砂玻璃材质
- pathon的基本语法
- 多校区网络直播系统解决方案
热门文章
- string类的常用函数(总结)
- impala常用String函数大全(超详细)
- 2016年58同城赶集笔试题
- 一文弄懂23种设计模式之装饰器模式
- wdcp 升级 php mysql phpmyadmin_centos5,升级php后phpmyadmin无法登陆
- TCL品牌升级,“饱和攻击”下B、C端“联袂”成为主航道
- c语言怎么学自学,怎么学自学C语言啊?
- GitLab 14 轻量化运行方案
- 学计算机是就业班好还是升学班好,升学班和就业班应该怎么选择?
- 第一天开始写博客,从学习BootStrap开始吧,努力加油