tesseract安装使用
tesseract 是一个google支持的开源ocr项目。下面介绍如何使用
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;
下载windows版本的tesseract安装包,我下载的版本是是http://3.onj.me/tesseract/网站所维护的,安装后有个doc文件夹,里面有英文的使用文档。为了在全局使用方便,比如安装路径为D:\Application\tesseract,将D:\Application\tesseract添加到环境变量的path中。
为了进行测试,我们在其他文件夹下,比如在桌面建立了一个文件夹进行测试,C:\Users\Administrator\Desktop\pythonTest\tesseract,此文件夹有个验证码图片1.jpg, 在此文件夹打开cmd命令,输入tesseract 1.jpg res, 这个是最基础的用法,就是将1.jpg这个图片的文字转为res.text。默认用英语的语言包。运行完后,文件夹里面出现res.text, 内容就是被转换的文字但是一开始,我却发现报以下错误
Error opening data file ….
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your “tessdata” directory.
Failed loading language ‘eng’
Teseract couldn’t load any languages!
Counld not initialize tesseract上面的意思就是说不能加载’eng’语言包。请将tessdata的父文件夹路径设置为TESSDATA_PREFIX环境变量值,这个就是说在环境变量中新建一个系统变量,变量名称为TESSDATA_PREFIX,tessdata是放置语言包的文件夹,一般在你安装tesseract的目录下,即tesseract的安装目录就是tessdata的父目录,把ESSDATA_PREFIX的值设置为它就行了
- 重启电脑(我就是没有干这事儿,浪费了2小时折腾各种文档),然后按照第二部就能成功了
参考链接: http://www.cnblogs.com/zhongtang/p/5554784.html
tesseract安装使用相关推荐
- OCR之Tesseract安装
Tesseract安装 一.Tesseract下载 二.添加环境变量 三.配置Tesseract中文识别语言包 四.下载相关库 五.示例程序 1.待识别图片 2.识别程序 3.识别结果 Tessera ...
- php tesseract,安装Leptonica、Tesseract-OCR
安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) 依赖的包: autoconf automake libtool libjp ...
- tesseract 安装常见报错
tesseract 安装常见报错 1 安装软件时报错 Download error Status of equ: Send Request Error. Click OK to continue!!! ...
- python ocr中文识别库 tesseract安装及问题处理
这个破东西,折腾了快1个小时,网上的教材太乱了. 我解决的主要是windows的问题 先下载exe.(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de ...
- Google开源OCR项目Tesseract安装版在Windows下的使用测试记录
开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下: https://en.wikipedia.org/wiki/Comparison_of_optical_ ...
- python验证码_Python验证码登录(Tesseract安装配置)
1.安装py库:pytesseract,PIL pip install pytesseract pip install PILLOW 如果安装时,出现权限不足: pip install --user ...
- tesseract安装及配置
1. 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程.对于图形验证码来说,它们都是 ...
- tesseract 安装及使用
1. 安装tesseract OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程.对于图形验证码来说,它们都是 ...
- tesseract安装使用,人工智,图文识别验证码 系统操作(python)
这两天自学关于自我感觉很牛的图文识别系统,给你一张图片可以扫描其中的文字(是不是很牛嘿嘿!!!),以下是我在学习过程中所遇到的一点问题.先前在学习之前肯定是安装各种文件,各种包--(头痛--),查过各 ...
最新文章
- 这个省到2025年,PUE>1.3存量大型数据中心将全部腾退关停!
- 装修行业难互联网化?利润不合理并非本质,体制才是
- python 三维散点图拟合曲面_python实现三维拟合的方法
- PyQt5 打包问题解决 Unable to find “D:\anaconda3\lib\site-packages\PyQt5\Qt\translations\qtwebengine_locale
- Python使用Tornado+Redis维护ADSL拨号服务器代理池
- java dbcursor_优化JAVA查询Mongodb数量过大,查询熟读慢的方法
- 遇见Python.h: No such file or directory的解决方法
- KEIL使用教程——KEIL常用配置技巧
- Sakai3白皮书(中文版)
- PGP加密的基本操作
- J2EE和J2se的区别
- 其它 以字典的方式 暴力破解 压缩文件密码
- 影响你一生的10句话
- P7776 【模板】特征多项式 题解
- 牛客(中兴捧月)—B-切绳子
- 2022年全球程序员收入报告来了!字节主管年薪56.4万美元强势上榜!
- 三菱FX5U系列PLC使用FX5-CCL-MS模块无需编程即可实现CC-Link总线通信的具体步骤
- java简历工作描述怎么写,送大厂面经一份!
- 计算机控制恒电位仪,上海昕瑞微电脑恒电位仪DJS-292D
- Valens VA7031 HDBaseT视频传输芯片 车载视频传输芯片