OCR之Tesseract安装
Tesseract安装
- 一、Tesseract下载
- 二、添加环境变量
- 三、配置Tesseract中文识别语言包
- 四、下载相关库
- 五、示例程序
- 1.待识别图片
- 2.识别程序
- 3.识别结果
Tesseract是常用的开源OCR识别引擎,后续的图片文字识别项目我们将会调用该库进行识别,本文针对Tesseract的安装配置进行相关说明。
一、Tesseract下载
下载地址:Tesseract
选择最新的版本进行下载,下载完成后,解压安装在自己设定的安装路径,一直选择next即可完成安装。
二、添加环境变量
打开系统属性页面,然后点击高级,最后选择环境变量。
在环境变量页面,将Tesseract安装路径添加到用户变量和系统变量的Path,为验证添加环境变量是否成功,打开cmd窗口,输入命令:
tesseract -v
如果弹出tesseract的版本信息,则说明环境变量配置成功,否则说明配置失败,需要读者仔细研读上述步骤进行重新配置。
使用tesseract --list-langs来查看Tesseract-OCR支持语言。
三、配置Tesseract中文识别语言包
下载路径:chi_sim
将下载的chi_sim.traineddata文件复制到安装路径下的tessdata文件夹,如图所示:
四、下载相关库
pip install pytesseract
pip install Pillow
五、示例程序
1.待识别图片
2.识别程序
import pytesseract
from PIL import Image
path="D:\\code\\python\\opencv\\图像处理\\test.png"
image=Image.open(path)
text=pytesseract.image_to_string(image,lang='chi_sim')
print(text)#打印输出识别文字
3.识别结果
OCR之Tesseract安装相关推荐
- Google开源OCR项目Tesseract安装版在Windows下的使用测试记录
开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下: https://en.wikipedia.org/wiki/Comparison_of_optical_ ...
- Google开源OCR项目Tesseract训练(自己训练的记录,未成功)
图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章 ...
- Windows安装用于OCR的Tesseract及使用命令行参数进行OCR
Windows安装用于OCR的Tesseract及使用命令行参数进行OCR 1. 效果图 2. Tesseract 安装及验证 参考 这篇博客将介绍如何安装和使用光学字符识别(OCR Optical ...
- Tesseract OCR简介(三)--安装及参数使用
参考:AI-Tesseract-OCR简介_花熊的博客-CSDN博客_tesseract坐标 一.windows 1.1 Tesseract安装 适用于Tesseract 3.05和Tesseract ...
- OCR引擎Tesseract以及pytesseract详解及实例
OCR引擎Tesseract以及pytesseract详解及实例 目录 OCR引擎Tesseract以及pytesseract详解及实例 谷歌开源OCR引擎Tesseract Tesseract的安装 ...
- OCR 工具tesseract初体验
OCR 工具tesseract初体验 @(工具使用)[工具使用, python] OCR即图片上文字识别 安装tesseract github地址 tesseract是一个命令行程序,后面安装的pyt ...
- 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...
- python 离线图片文字识别(OCR)Tesseract
本人最近也是在使用和学习python遇到各种问题,公司内网控制严格 没有网络,同时也不允许安装exe文件,做python 十分的费劲,也研究了好几款文字识别的OCR ,要么是收费的 要么是离线不能用, ...
- [转]浅谈OCR之Tesseract
转载请注明出处:http://www.cnblogs.com/brooks-dotnet/archive/2010/10/05/1844203.html 浅谈OCR之Tesseract 光学字符识别( ...
最新文章
- 一篇文章让你读懂Pivotal的GemFire家族产品
- Vue全局路由侦听beforeEach路由守卫附代码使用示例
- [python] 之all()和any()内置函数
- 【热烈祝贺】俺们的S5PV210 工控板终于启动到wince桌面了!
- boost::python::import相关的测试程序
- spring cloud+dotnet core搭建微服务架构:服务发现(二)
- 从零开始学Java编程!java集合类详解和使用
- SQL转化为MapReduce的过程
- myeclipse去掉js报错
- SVM与感知机的异同点
- del服务器如何收系统日志,利用Rsyslog集中收集系统日志和用户操作记录以及相关处理方法...
- Windows10系统彻底禁止自动更新
- spymemcached 的 useNagle 问题与 TCP/IP延迟发送数据
- solidity 合约权限授权_Curve + zkSync L2:以太坊的ZK Rollup智能合约
- Java解析XML字符串
- win10错误代码0x0000011b怎么解决
- Go:一次 exit code 是 137 且 无 coredump 的排错经历
- COSCon'21 大数据(D)论坛介绍
- 怎么制作位置分布图,怎么画网点分布图
- 支付宝社交风波以道歉收场,微信小程序会有不同结局吗?