tesseract 是一个google支持的开源ocr项目。下面介绍如何使用

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;

  1. 下载windows版本的tesseract安装包,我下载的版本是是http://3.onj.me/tesseract/网站所维护的,安装后有个doc文件夹,里面有英文的使用文档。为了在全局使用方便,比如安装路径为D:\Application\tesseract,将D:\Application\tesseract添加到环境变量的path中。

  2. 为了进行测试,我们在其他文件夹下,比如在桌面建立了一个文件夹进行测试,C:\Users\Administrator\Desktop\pythonTest\tesseract,此文件夹有个验证码图片1.jpg, 在此文件夹打开cmd命令,输入tesseract 1.jpg res, 这个是最基础的用法,就是将1.jpg这个图片的文字转为res.text。默认用英语的语言包。运行完后,文件夹里面出现res.text, 内容就是被转换的文字但是一开始,我却发现报以下错误
    Error opening data file ….
    Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your “tessdata” directory.
    Failed loading language ‘eng’
    Teseract couldn’t load any languages!
    Counld not initialize tesseract

    上面的意思就是说不能加载’eng’语言包。请将tessdata的父文件夹路径设置为TESSDATA_PREFIX环境变量值,这个就是说在环境变量中新建一个系统变量,变量名称为TESSDATA_PREFIX,tessdata是放置语言包的文件夹,一般在你安装tesseract的目录下,即tesseract的安装目录就是tessdata的父目录,把ESSDATA_PREFIX的值设置为它就行了

  3. 重启电脑(我就是没有干这事儿,浪费了2小时折腾各种文档),然后按照第二部就能成功了

参考链接: http://www.cnblogs.com/zhongtang/p/5554784.html

tesseract安装使用相关推荐

  1. OCR之Tesseract安装

    Tesseract安装 一.Tesseract下载 二.添加环境变量 三.配置Tesseract中文识别语言包 四.下载相关库 五.示例程序 1.待识别图片 2.识别程序 3.识别结果 Tessera ...

  2. php tesseract,安装Leptonica、Tesseract-OCR

    安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) 依赖的包: autoconf automake libtool libjp ...

  3. tesseract 安装常见报错

    tesseract 安装常见报错 1 安装软件时报错 Download error Status of equ: Send Request Error. Click OK to continue!!! ...

  4. python ocr中文识别库 tesseract安装及问题处理

    这个破东西,折腾了快1个小时,网上的教材太乱了. 我解决的主要是windows的问题 先下载exe.(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de ...

  5. Google开源OCR项目Tesseract安装版在Windows下的使用测试记录

    开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下: https://en.wikipedia.org/wiki/Comparison_of_optical_ ...

  6. python验证码_Python验证码登录(Tesseract安装配置)

    1.安装py库:pytesseract,PIL pip install pytesseract pip install PILLOW 如果安装时,出现权限不足: pip install --user ...

  7. tesseract安装及配置

    1. 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程.对于图形验证码来说,它们都是 ...

  8. tesseract 安装及使用

    1. 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程.对于图形验证码来说,它们都是 ...

  9. tesseract安装使用,人工智,图文识别验证码 系统操作(python)

    这两天自学关于自我感觉很牛的图文识别系统,给你一张图片可以扫描其中的文字(是不是很牛嘿嘿!!!),以下是我在学习过程中所遇到的一点问题.先前在学习之前肯定是安装各种文件,各种包--(头痛--),查过各 ...

最新文章

  1. 这个省到2025年,PUE>1.3存量大型数据中心将全部腾退关停!
  2. 装修行业难互联网化?利润不合理并非本质,体制才是
  3. python 三维散点图拟合曲面_python实现三维拟合的方法
  4. PyQt5 打包问题解决 Unable to find “D:\anaconda3\lib\site-packages\PyQt5\Qt\translations\qtwebengine_locale
  5. Python使用Tornado+Redis维护ADSL拨号服务器代理池
  6. java dbcursor_优化JAVA查询Mongodb数量过大,查询熟读慢的方法
  7. 遇见Python.h: No such file or directory的解决方法
  8. KEIL使用教程——KEIL常用配置技巧
  9. Sakai3白皮书(中文版)
  10. PGP加密的基本操作
  11. J2EE和J2se的区别
  12. 其它 以字典的方式 暴力破解 压缩文件密码
  13. 影响你一生的10句话
  14. P7776 【模板】特征多项式 题解
  15. 牛客(中兴捧月)—B-切绳子
  16. 2022年全球程序员收入报告来了!字节主管年薪56.4万美元强势上榜!
  17. 三菱FX5U系列PLC使用FX5-CCL-MS模块无需编程即可实现CC-Link总线通信的具体步骤
  18. java简历工作描述怎么写,送大厂面经一份!
  19. 计算机控制恒电位仪,上海昕瑞微电脑恒电位仪DJS-292D
  20. Valens VA7031 HDBaseT视频传输芯片 车载视频传输芯片

热门文章

  1. 慈溪视频软件测试,慈溪论坛
  2. 七里香计算机音乐谱子,七里香(改编自《新经典》)
  3. 仿权重8高收录面包网pc+手机苹果cmsv8影视网站含迅雷下载N430模板
  4. 工行山东省分行加强客户信息安全保护
  5. office 2007 word中无法显示嵌入的图片
  6. 让我在这枯燥的实验室机房里,告诉你们什么是嵌入式软件开发
  7. package.josn中^和~的区别
  8. Mac上使用IE浏览器
  9. 【重识云原生】第四章云网络4.8.4节——OpenStack与SDN的集成
  10. APP下载链接在微信被屏蔽了 无法打开的解决方案