一、安装pytesseract和PIL

   PIL全称:Python Imaging Library,python图像处理库,这个库支持多种文件格式,并提供了强大的图像处理和图形处理能力。

   由于PIL仅支持到Python 2.7,所以在PIL的基础上创建了Pillow库,支持最新Python 3.x。

  1、使用pycharm编辑器安装,如下操作步骤。

  安装成功:

  安装pytesseract时,同时安装pillow,所以我们只需安装pytesseract即可。

  3.尝试运行,

源码如下:

from PIL import Image import pytesseract Image = Image.open('1.png') # 打开图片text = pytesseract.image_to_string(Image,lang='chi_sim') #使用简体中文解析图片 print(text)

   出现报错,如下图,

   原因:没有安装识别引擎tesseract-ocr

二、安装识别引擎tesseract-ocr

  1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别,经过改进引擎和训练系统,它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符,但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言(比如中文)上较慢,但是工作良好。

  下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

  因为tesseract-ocr默认不支持中文识别。

   将下载到的文件:chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下,如图:

  2,安装完成tesseract-ocr后,需要做一下配置 。

    在Python安装目录(如:D:\Python35\Lib\site-packages\pytesseract) 中修改 pytesseract.py文件。

    也可以通过pycharm,Ctrl+B 快速打开pytesseract源码文件:

  3.尝试运行,出现如下报错:

  pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your   "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')

  4.解决方法:将tessdata目录的上级目录所在路径:(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中,如下图:

    注意:配置完环境变量需要重新打开pycharm编辑器(IDE)。

  5.再次运行结果:图片识别成功!

  但识别率不是很高,后期优化,持续更新。

python 图像识别 1相关推荐

  1. python 图像识别_python图像识别之图片相似度计算

    作者 | a1131825850疯子 来源 | Python爬虫scrapy 原文 | python图像识别---------图片相似度计算 1.背景 要识别两张图片是否相似,首先我们可能会区分这两张 ...

  2. python图片识别-python图像识别

    python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用. 安装 安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径.环境变量甚至与linux不同的路径分 ...

  3. [Python图像识别] 四十九.图像生成之什么是生成对抗网络GAN?基础原理和代码普及

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  4. [Python图像识别] 四十八.Pytorch构建Faster-RCNN模型实现小麦目标检测

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  5. [Python图像识别] 四十六.图像预处理之图像去雾详解(ACE算法和暗通道先验去雾算法)

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  6. [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  7. Python图像识别

    Python图像识别 第一次写博客 首先说明,我只是一个刚开始学习python的学生,此博客纯粹记录我学习的过程,如果代码过程中有问题或者有更好的实现方法,希望业界各位大佬指点.评论 工具 pycha ...

  8. python 图像识别实现四川麻将回放牌面数据

    python 图像识别 自动获取麻将APP实时牌面数据 前面写了一篇文章,深度学习图像识别麻将APP数据,然后结合自己的算法实现自动打麻将demo!很多朋友感兴趣.最开始做这个也只是为了研究学习图像识 ...

  9. python识别数字程序_python实现识别手写数字 python图像识别算法

    写在前面 这一段的内容可以说是最难的一部分之一了,因为是识别图像,所以涉及到的算法会相比之前的来说比较困难,所以我尽量会讲得清楚一点. 而且因为在编写的过程中,把前面的一些逻辑也修改了一些,将其变得更 ...

  10. [Python图像识别] 五十一.水书图像识别之利用数据增强扩充图像数据集

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

最新文章

  1. 使用MASM03 - Win32汇编语言011
  2. 界面 高炉系统_浅议工业互联网与传统计算机系统的关系
  3. 一个重复try语句的实验
  4. javascript创建类_如何在10分钟内使用JavaScript创建费用管理器
  5. Spring Boot 2.3.3 正式发布!
  6. [译][Tkinter 教程15] event 事件绑定
  7. Flex 基于数据源的Menu Tree
  8. 【雷达通信】基于matlab雷达数字信号处理【含Matlab源码 281期】
  9. vue模块单独封装html,在vue中怎么定义自定义组件?
  10. C++ 实现matlab高斯滤波函数imgaussfilt
  11. 如何取消计算机中的0-9,告诉你如何关闭win10易升程序
  12. ug冲模标准件库_UG NX插件
  13. 音频功放的失真的原因分析及测量
  14. 就这一篇:教你真正有效地解决爆满的C盘!
  15. matlab计算海洋浮力频率_海洋要素计算:潮汐调和分析
  16. Ubuntu安装eog遇到的坑及解决方案
  17. 下载xcode 6 beta.dmg
  18. Unity使用PhotoShop制作磨砂玻璃材质
  19. pathon的基本语法
  20. 多校区网络直播系统解决方案

热门文章

  1. string类的常用函数(总结)
  2. impala常用String函数大全(超详细)
  3. 2016年58同城赶集笔试题
  4. 一文弄懂23种设计模式之装饰器模式
  5. wdcp 升级 php mysql phpmyadmin_centos5,升级php后phpmyadmin无法登陆
  6. TCL品牌升级,“饱和攻击”下B、C端“联袂”成为主航道
  7. c语言怎么学自学,怎么学自学C语言啊?
  8. GitLab 14 轻量化运行方案
  9. 学计算机是就业班好还是升学班好,升学班和就业班应该怎么选择?
  10. 第一天开始写博客,从学习BootStrap开始吧,努力加油