一、什么是光学文字识别?

简单来说,就是将图片上的文字给识别出来,称为光学文字识别(Optical Character Recognition),简写为OCR。目前市面上这种库并不多,因为做这个需要很强的深度学习功底,而大多数人又不懂这个方面的内容,所以开源的库就更少了,公认的最优秀的开源的OCR库为谷歌赞助开发的Tesseract。

Tesseract是一个开源的OCR引擎,大家均可以免费使用,惠普公司的布里斯托尔实验室在1984-1994年开发完成,起初作为惠普的平板扫描仪的文字识别引擎。Tesseract在1995年UNLV OCR字符识别准确性测试中拔得头筹,受到广泛关注,后来HP放弃了OCR市场,在1994年以后,Tesseract的开发就停止了。

在2005年,HP将Tesseract贡献给开源社区。美国内华达州信息技术研究所获得该源码,同时,Google开始对Tesseract进行功能扩展及优化。目前,Tesseract作为开源项目发布在Google Project上,重获新生,它支持60种以上的语言,提供一个引擎和一个命令行工具。

二、安装tesseract-ocr

1.双击可执行文件。

2.按照步骤安装即可。

3.设置环境变量

(1)训练数据文件环境变量【环境变量必须为这个名字】

TESSDATA_PREFIX=D:\study\Tesseract-OCR\tessdata

(2)tesseract.exe环境变量

在Path中直接添加即可。

三、在命令行使用tesseract-ocr

1.将【tesseract.exe】所在的文件夹添加到环境变量里面。

2.使用cmd进入到想识别的图片的所在的文件夹内。

使用方法:tesseract   eg.png(文件名)    eg(识别结果存放的文件)

3.识别中文

使用方法:tesseract   eg.png(文件名)    eg(识别结果存放的文件)  -l   chi_sim

四、在Python中使用tesseract-ocr

1.Python需要安装对应的库

(1)在线安装:

pip install pytesseract

(2)离线安装:

下载对应的.whl文件即可安装。

示例博客地址:https://blog.csdn.net/weixin_42830697/article/details/102492605

2.查看对应的版本

3.测试是否安装成功

执行导入操作未报错即表示安装成功!!

光学文字识别(OCR)相关推荐

  1. halcon ocr 生成样本变体_Halcon简单文字识别OCR的使用

    重要:本文最后更新于2019-10-18 08:49:28,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 突然想起网上有很多打码挣钱的活动,于是灵光一闪,用C#搞个自动识别验证码的 ...

  2. Tesseract-OCR对图像和PDF进行光学文字识别

    本文主要介绍Tesseract-OCR光学文字识别应用程序的下载安装.运行参数,以及gImageReader图形界面,并Ubuntu和Windows环境下演示了使用图形界面对PDF和图像文件进行文字识 ...

  3. 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

    开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...

  4. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  5. 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR

    作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...

  6. 吴恩达《机器学习》第十八章:图片文字识别OCR

    文章目录 十八.应用实例:图片文字识别OCR 18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:下一步工作 十八.应用实例:图片文字识别OCR 18 ...

  7. APISpace 通用文字识别OCR API

    APISpace 的 通用文字识别OCR API,基于业界领先的深度学技术,对图片中的文字进行检测和识别,支持多种语言.并且包含文字在图片中的位置信息,方便进行版式的二次处理. 应用场景 拍照/截图识 ...

  8. python实现文字识别软件_文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别...

    文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别 发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...

  9. 如何使用Python实现图像文字识别OCR

    要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...

最新文章

  1. 【干货书】数据科学家统计学基础:R和Python实战
  2. bitcoin转账api,python3.7
  3. 且看BCH开启的“信用本位”时代
  4. oc基础-self关键字的使用
  5. 行为模型:客户行为智能分析模型
  6. Tunnelling HTTP Traffic Through XSS Channels.pdf
  7. server2005系统表知多少 之sysdatabases
  8. Spring Boot返回的数据格式是XML 而不是JSON之原因探求的和解决
  9. 【Linux】预编译,编译,汇编,链接的四过程
  10. IOS view的圆角和阴影并存
  11. linux删除文件密码不奏效,Linux运维知识之linux_无秘登录问题(不生效)
  12. 基因组信息学参考习题
  13. c语言怎样识别字母大小写,c语言islower()函数如何判断字符是否为小写字母
  14. 衣带渐宽终不悔,为“指针”消得人憔悴(三)
  15. Windows杀死Tomcat进程
  16. 电影记忆之20(恐怖游轮)
  17. 受够了百度网盘?如何注册无限容量的Google Drive网盘
  18. 幼儿园数学区如何用计算机作用,实用帖——幼儿园数学区域玩教具
  19. CM311-1A 卡刷 + 线刷、刷安卓与 Armbian 教程
  20. 6sigma is a good issue improved

热门文章

  1. 写一个python代码,实现在中国国家统计局的官网上收集近3年的GDP数据,然后将这些数据绘制到一个折线图上展示出来...
  2. c++ opencv imread函数浅解
  3. 石油网络的放大器设置问题
  4. python函数参数引用传递
  5. 一图看懂数据治理、数据管理与数据管控的关系和区别
  6. 面向对象、基于对象和面向过程
  7. 2019写给对象的话_[想对对象说的一句情话]2019年最想对你说的十句情话
  8. ZZULIOJ:1012: 求绝对值
  9. linux下编译snmp++报crypt冲突
  10. 如何使用 Python 构建 西门子PLC Snap7通信