Tesseract安装

  • 一、Tesseract下载
  • 二、添加环境变量
  • 三、配置Tesseract中文识别语言包
  • 四、下载相关库
  • 五、示例程序
    • 1.待识别图片
    • 2.识别程序
    • 3.识别结果

Tesseract是常用的开源OCR识别引擎,后续的图片文字识别项目我们将会调用该库进行识别,本文针对Tesseract的安装配置进行相关说明。

一、Tesseract下载

下载地址:Tesseract

选择最新的版本进行下载,下载完成后,解压安装在自己设定的安装路径,一直选择next即可完成安装。

二、添加环境变量

打开系统属性页面,然后点击高级,最后选择环境变量。


在环境变量页面,将Tesseract安装路径添加到用户变量和系统变量的Path,为验证添加环境变量是否成功,打开cmd窗口,输入命令:

tesseract -v


如果弹出tesseract的版本信息,则说明环境变量配置成功,否则说明配置失败,需要读者仔细研读上述步骤进行重新配置。
使用tesseract --list-langs来查看Tesseract-OCR支持语言。

三、配置Tesseract中文识别语言包

下载路径:chi_sim
将下载的chi_sim.traineddata文件复制到安装路径下的tessdata文件夹,如图所示:

四、下载相关库

pip install pytesseract
pip install Pillow

五、示例程序

1.待识别图片

2.识别程序

import pytesseract
from PIL import Image
path="D:\\code\\python\\opencv\\图像处理\\test.png"
image=Image.open(path)
text=pytesseract.image_to_string(image,lang='chi_sim')
print(text)#打印输出识别文字

3.识别结果

OCR之Tesseract安装相关推荐

  1. Google开源OCR项目Tesseract安装版在Windows下的使用测试记录

    开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下: https://en.wikipedia.org/wiki/Comparison_of_optical_ ...

  2. Google开源OCR项目Tesseract训练(自己训练的记录,未成功)

    图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章  ...

  3. Windows安装用于OCR的Tesseract及使用命令行参数进行OCR

    Windows安装用于OCR的Tesseract及使用命令行参数进行OCR 1. 效果图 2. Tesseract 安装及验证 参考 这篇博客将介绍如何安装和使用光学字符识别(OCR Optical ...

  4. Tesseract OCR简介(三)--安装及参数使用

    参考:AI-Tesseract-OCR简介_花熊的博客-CSDN博客_tesseract坐标 一.windows 1.1 Tesseract安装 适用于Tesseract 3.05和Tesseract ...

  5. OCR引擎Tesseract以及pytesseract详解及实例

    OCR引擎Tesseract以及pytesseract详解及实例 目录 OCR引擎Tesseract以及pytesseract详解及实例 谷歌开源OCR引擎Tesseract Tesseract的安装 ...

  6. OCR 工具tesseract初体验

    OCR 工具tesseract初体验 @(工具使用)[工具使用, python] OCR即图片上文字识别 安装tesseract github地址 tesseract是一个命令行程序,后面安装的pyt ...

  7. 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

    开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...

  8. python 离线图片文字识别(OCR)Tesseract

    本人最近也是在使用和学习python遇到各种问题,公司内网控制严格 没有网络,同时也不允许安装exe文件,做python 十分的费劲,也研究了好几款文字识别的OCR ,要么是收费的 要么是离线不能用, ...

  9. [转]浅谈OCR之Tesseract

    转载请注明出处:http://www.cnblogs.com/brooks-dotnet/archive/2010/10/05/1844203.html 浅谈OCR之Tesseract 光学字符识别( ...

最新文章

  1. 一篇文章让你读懂Pivotal的GemFire家族产品
  2. Vue全局路由侦听beforeEach路由守卫附代码使用示例
  3. [python] 之all()和any()内置函数
  4. 【热烈祝贺】俺们的S5PV210 工控板终于启动到wince桌面了!
  5. boost::python::import相关的测试程序
  6. spring cloud+dotnet core搭建微服务架构:服务发现(二)
  7. 从零开始学Java编程!java集合类详解和使用
  8. SQL转化为MapReduce的过程
  9. myeclipse去掉js报错
  10. SVM与感知机的异同点
  11. del服务器如何收系统日志,利用Rsyslog集中收集系统日志和用户操作记录以及相关处理方法...
  12. Windows10系统彻底禁止自动更新
  13. spymemcached 的 useNagle 问题与 TCP/IP延迟发送数据
  14. solidity 合约权限授权_Curve + zkSync L2:以太坊的ZK Rollup智能合约
  15. Java解析XML字符串
  16. win10错误代码0x0000011b怎么解决
  17. Go:一次 exit code 是 137 且 无 coredump 的排错经历
  18. COSCon'21 大数据(D)论坛介绍
  19. 怎么制作位置分布图,怎么画网点分布图
  20. 支付宝社交风波以道歉收场,微信小程序会有不同结局吗?

热门文章

  1. 记录下我在csdn做过的直播
  2. USB 为什么一般选择48MHz
  3. Sprite Kit 移动精灵
  4. 学校智慧校园平台管理系统小程序开发制作
  5. 关于汽车信息安全测试的公司-阿古斯
  6. AI大军已经兵临城下,我们离失业还有多远?
  7. ORB-SLAM 全文翻译
  8. 计算机组装与系统安装实验目的,计算机原理与系统组装实验
  9. numeric比较大小 数据库_SQL中NUMERIC和DECIMAL的区别
  10. Car-t细胞治疗最新进展(2022年5月)