http://blog.sina.com.cn/s/blog_628cc2b70101cjvp.html

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用Anaconda.

pytesser是谷歌OCR开源项目的一个模块,在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时,pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下:
首先,安装Python2.7版本,这个版本比较稳定,建议使用这个版本。
其次,安装python opencv,请自行百度之。
然后,安装PIL工具,下载的地址是:http://www.pythonware.com/products/pil/,pytesser的使用需要PIL库的支持。
接着下载pytesser,下载的地址是:https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/pytesser/pytesser_v0.0.1.zip
如果翻不了墙的话,请使用如下:pytesser下载:http://code.google.com/p/pytesser/  若打不开,可通过百度网盘下载:http://pan.baidu.com/s/1o69LL8Y
最后,将pytesser解压,这个是免安装的,可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用,比如我的安装目录是:C:\Python27\Lib\site-packages,同时把这个目录添加到环境变量之中。
完成以上步骤之后,就可以编写图片文本识别的Python脚本了。参考脚本如下:
from pytesser.pytesser import image_to_stringfrom PIL import *
import Image
import ImageEnhanceimage = Image.open(r"D:\workstation\driving_licence.jpg")#使用ImageEnhance可以增强图片的识别率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架,免费使用,现在已经支持中文,而且识别率非常高,这里简要来个helloworld级别的认识

下载地址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

下载之后进行安装,不再演示。

在tesseract目录下,有个tesseract.exe文件,主要调用这个执行文件,用cmd运行到这个目录下,在这个目录下同时放置一张需要识别的图片,这里是driving_license.jpg

然后运行:tesseract driving_license.jpg result

会把driving_license.jpg自动识别并转换为txt文件到result.txt

但是此时中文识别不好,要下载一个中文包:https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata

然后找到tessdata目录,把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata

ok,现在中文识别基本达到90%以上了

问题一的解决链接:

PIL The _imaging C module is not installed

其实就是下载一个兼容     python2.7        Pillow-2.1.0.win-amd64-py2.7.exe

Python Error in image_to_string

python图片文本识别的简单实现相关推荐

  1. Python技巧-只用一行代码轻松实现图片文本识别

    生活中我们可能会遇到需要从图片上获取文本内容的情况,人工去核对的话非常头疼.今天小千就来教大家使用Python一行代码就能实现文本识别,下面来看看吧. Python图片文本识别 这里我们需要用到两个库 ...

  2. python识别文字软件_|python图片文字识别扫描工具下载免费版 - 欧普软件下载

    python图片文字识别扫描工具是一款文字识别软件,软件基于Python和百度识别接口设计而来,可快速识别图片中的文字,写入TXT文件,支持快捷键F1截屏,虽说是基于命令行的操作,但是操作也算简单,需 ...

  3. Python图片文字识别——Windows下Tesseract-OCR的安装与使用

    Python图片文字识别--Windows下Tesseract-OCR的安装与使用 前言 Windows下Tesseract-OCR的安装与配置 Tesseract-OCR简介与版本选择 tesser ...

  4. python 图片 文本 矫正

    python 图片 文本 矫正 代码 # -*- coding: UTF-8 -*- import numpy as np import cv2 import os ## 图片旋转 def rotat ...

  5. 用百度文字识别实现图片文本识别

    要用百度API则必须先注册百度开发者,然后才能使用百度的各项服务:地图API.文字语音转换API.文本识别API.....,文本识别的官方文档:文字识别-帮助与支持-百度云 注册完成后,需要用到以下三 ...

  6. Python 图像文本识别 EasyOCR

    目录 1. 安装依赖 2. 下载模型文件 3. 编写代码 4. 运行脚本 命令行模式 参考文献 一个Python的图像文本识别工具:easyocr. 这个模块支持70多种语言的即用型OCR,包括中文, ...

  7. 比Everything更强的文件搜索工具,支持文件名、文件内容和文件图片上的文字搜索,文件内容搜索工具,文件图片内容搜索工具,OCR图片文本识别搜索,文件快速搜索工具,文字识别文件搜索工具

    Windows自带的文件搜索功能想必不需要过多吐槽,搜索速度简直是在龟爬,所以小编很早之前就在用Everything进行文件搜索了,不过,今天的主角不是它,而是比它更更更更更强的一款软件! 这款软件适 ...

  8. 【python 图片文字识别】pyocr图片文字识别

    无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 pyocr 官方网 ...

  9. python之图片文本识别

    这里需要用到python的几个库,分别是pytesser,以及pytesser的依赖库PIL.python的版本建议用2.7或者2.7一下的都行,不建议用python3以上的,因为python3不向下 ...

最新文章

  1. 百度15篇论文被AAAI 2019收录
  2. mysql延迟解决方案
  3. python从零基础到项目实战怎么样-2018完整Python零基础到项目精通的学习书籍
  4. 一个可以使用的公用MQTT测试服务器
  5. bash循环控制语句之for循环
  6. swagger 修改dto注解_Swagger 详解
  7. php邮件代码c语言,C语言实现邮件发送功能(SMTP)源码
  8. Python使用matplotlib.pyplot绘图时设置坐标轴刻度
  9. 20世纪50年代开始,数字技术出现,数字计算机开始代替模拟计算机,我们从电气时代逐渐走到了信息时代,电脑重塑了社会的架构与价值。...
  10. plsql怎么导出几十w的数据到csv_Greenplum数据库使用总结(干货满满)初级使用
  11. java注释符_Java程序中的单行注释符是(  ),多行注释符是( )。
  12. 【读书笔记《Android游戏编程之从零开始》】4.Android 游戏开发常用的系统控件(EditText、CheckBox、Radiobutton)
  13. Java Sigar Windows 监控系统
  14. Kinect2.0相机标定
  15. 用Acrobat pro DC 自动生成pdf目录——知网硕博论文为例(附带如何下载只有caj的pdf)
  16. Windows远程提示“终端服务器超出了最大允许连接”
  17. 迎合老板还是员工 结果导向CRM更受欢迎
  18. Java开发-日期与时间戳转换封装工具类
  19. 怎样在小方框上打对号 小方框内打对勾 word 方框打对勾
  20. 利用c#快速知道哪些qq好友空间屏蔽了自己

热门文章

  1. 2020东软面试题小计(校招Java篇)
  2. Unity3d游戏开发之C#开发(一)
  3. 【Python】求笛卡尔乘积
  4. MBA-day22 至多至少问题
  5. 使用ChatGPT工具阅读文献的实战教程
  6. word计算机桌面加密,Word文档怎么加密 保护Word文档就靠这4招
  7. word加密文档忘记密码了如何打开
  8. 国外不错的网站(类似知乎)
  9. OpenSSH: 通过 LDAP 做认证
  10. Android WebView(一) WebView详解