光学文字识别(OCR)

2024-06-04 11:08:05

一、什么是光学文字识别？

简单来说，就是将图片上的文字给识别出来，称为光学文字识别(Optical Character Recognition),简写为OCR。目前市面上这种库并不多，因为做这个需要很强的深度学习功底，而大多数人又不懂这个方面的内容，所以开源的库就更少了，公认的最优秀的开源的OCR库为谷歌赞助开发的Tesseract。

Tesseract是一个开源的OCR引擎，大家均可以免费使用，惠普公司的布里斯托尔实验室在1984-1994年开发完成，起初作为惠普的平板扫描仪的文字识别引擎。Tesseract在1995年UNLV OCR字符识别准确性测试中拔得头筹，受到广泛关注，后来HP放弃了OCR市场，在1994年以后，Tesseract的开发就停止了。

在2005年，HP将Tesseract贡献给开源社区。美国内华达州信息技术研究所获得该源码，同时，Google开始对Tesseract进行功能扩展及优化。目前，Tesseract作为开源项目发布在Google Project上，重获新生，它支持60种以上的语言，提供一个引擎和一个命令行工具。

二、安装tesseract-ocr

1.双击可执行文件。

2.按照步骤安装即可。

3.设置环境变量

(1)训练数据文件环境变量【环境变量必须为这个名字】

TESSDATA_PREFIX=D:\study\Tesseract-OCR\tessdata

(2)tesseract.exe环境变量

在Path中直接添加即可。

三、在命令行使用tesseract-ocr

1.将【tesseract.exe】所在的文件夹添加到环境变量里面。

2.使用cmd进入到想识别的图片的所在的文件夹内。

使用方法：tesseract eg.png(文件名) eg(识别结果存放的文件)

3.识别中文

使用方法：tesseract eg.png(文件名) eg(识别结果存放的文件) -l chi_sim

四、在Python中使用tesseract-ocr

1.Python需要安装对应的库

(1)在线安装：

pip install pytesseract

(2)离线安装：

下载对应的.whl文件即可安装。

示例博客地址：https://blog.csdn.net/weixin_42830697/article/details/102492605

2.查看对应的版本

3.测试是否安装成功

执行导入操作未报错即表示安装成功！！

光学文字识别(OCR)相关推荐

halcon ocr 生成样本变体_Halcon简单文字识别OCR的使用
重要:本文最后更新于2019-10-18 08:49:28,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 突然想起网上有很多打码挣钱的活动,于是灵光一闪,用C#搞个自动识别验证码的 ...
Tesseract-OCR对图像和PDF进行光学文字识别
本文主要介绍Tesseract-OCR光学文字识别应用程序的下载安装.运行参数,以及gImageReader图形界面,并Ubuntu和Windows环境下演示了使用图形界面对PDF和图像文件进行文字识 ...
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用一背景在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...
python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
吴恩达《Machine Learning》精炼笔记 12：大规模机器学习和图片文字识别 OCR
作者 | Peter 编辑 | AI有道系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习吴恩达<Machine Learning>精 ...
吴恩达《机器学习》第十八章：图片文字识别OCR
文章目录十八.应用实例:图片文字识别OCR 18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:下一步工作十八.应用实例:图片文字识别OCR 18 ...
APISpace 通用文字识别OCR API
APISpace 的通用文字识别OCR API,基于业界领先的深度学技术,对图片中的文字进行检测和识别,支持多种语言.并且包含文字在图片中的位置信息,方便进行版式的二次处理. 应用场景拍照/截图识 ...
python实现文字识别软件_文字识别(OCR)CRNN（基于pytorch、python3）实现不定长中文字符识别...
文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...
如何使用Python实现图像文字识别OCR
要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...

最新文章

热门文章