光学文字识别(OCR)
一、什么是光学文字识别?
简单来说,就是将图片上的文字给识别出来,称为光学文字识别(Optical Character Recognition),简写为OCR。目前市面上这种库并不多,因为做这个需要很强的深度学习功底,而大多数人又不懂这个方面的内容,所以开源的库就更少了,公认的最优秀的开源的OCR库为谷歌赞助开发的Tesseract。
Tesseract是一个开源的OCR引擎,大家均可以免费使用,惠普公司的布里斯托尔实验室在1984-1994年开发完成,起初作为惠普的平板扫描仪的文字识别引擎。Tesseract在1995年UNLV OCR字符识别准确性测试中拔得头筹,受到广泛关注,后来HP放弃了OCR市场,在1994年以后,Tesseract的开发就停止了。
在2005年,HP将Tesseract贡献给开源社区。美国内华达州信息技术研究所获得该源码,同时,Google开始对Tesseract进行功能扩展及优化。目前,Tesseract作为开源项目发布在Google Project上,重获新生,它支持60种以上的语言,提供一个引擎和一个命令行工具。
二、安装tesseract-ocr
1.双击可执行文件。
2.按照步骤安装即可。
3.设置环境变量
(1)训练数据文件环境变量【环境变量必须为这个名字】
TESSDATA_PREFIX=D:\study\Tesseract-OCR\tessdata
(2)tesseract.exe环境变量
在Path中直接添加即可。
三、在命令行使用tesseract-ocr
1.将【tesseract.exe】所在的文件夹添加到环境变量里面。
2.使用cmd进入到想识别的图片的所在的文件夹内。
使用方法:tesseract eg.png(文件名) eg(识别结果存放的文件)
3.识别中文
使用方法:tesseract eg.png(文件名) eg(识别结果存放的文件) -l chi_sim
四、在Python中使用tesseract-ocr
1.Python需要安装对应的库
(1)在线安装:
pip install pytesseract
(2)离线安装:
下载对应的.whl文件即可安装。
示例博客地址:https://blog.csdn.net/weixin_42830697/article/details/102492605
2.查看对应的版本
3.测试是否安装成功
执行导入操作未报错即表示安装成功!!
光学文字识别(OCR)相关推荐
- halcon ocr 生成样本变体_Halcon简单文字识别OCR的使用
重要:本文最后更新于2019-10-18 08:49:28,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 突然想起网上有很多打码挣钱的活动,于是灵光一闪,用C#搞个自动识别验证码的 ...
- Tesseract-OCR对图像和PDF进行光学文字识别
本文主要介绍Tesseract-OCR光学文字识别应用程序的下载安装.运行参数,以及gImageReader图形界面,并Ubuntu和Windows环境下演示了使用图形界面对PDF和图像文件进行文字识 ...
- 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...
- python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
- 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR
作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...
- 吴恩达《机器学习》第十八章:图片文字识别OCR
文章目录 十八.应用实例:图片文字识别OCR 18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:下一步工作 十八.应用实例:图片文字识别OCR 18 ...
- APISpace 通用文字识别OCR API
APISpace 的 通用文字识别OCR API,基于业界领先的深度学技术,对图片中的文字进行检测和识别,支持多种语言.并且包含文字在图片中的位置信息,方便进行版式的二次处理. 应用场景 拍照/截图识 ...
- python实现文字识别软件_文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别...
文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别 发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...
- 如何使用Python实现图像文字识别OCR
要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...
最新文章
- 【干货书】数据科学家统计学基础:R和Python实战
- bitcoin转账api,python3.7
- 且看BCH开启的“信用本位”时代
- oc基础-self关键字的使用
- 行为模型:客户行为智能分析模型
- Tunnelling HTTP Traffic Through XSS Channels.pdf
- server2005系统表知多少 之sysdatabases
- Spring Boot返回的数据格式是XML 而不是JSON之原因探求的和解决
- 【Linux】预编译,编译,汇编,链接的四过程
- IOS view的圆角和阴影并存
- linux删除文件密码不奏效,Linux运维知识之linux_无秘登录问题(不生效)
- 基因组信息学参考习题
- c语言怎样识别字母大小写,c语言islower()函数如何判断字符是否为小写字母
- 衣带渐宽终不悔,为“指针”消得人憔悴(三)
- Windows杀死Tomcat进程
- 电影记忆之20(恐怖游轮)
- 受够了百度网盘?如何注册无限容量的Google Drive网盘
- 幼儿园数学区如何用计算机作用,实用帖——幼儿园数学区域玩教具
- CM311-1A 卡刷 + 线刷、刷安卓与 Armbian 教程
- 6sigma is a good issue improved
热门文章
- 写一个python代码,实现在中国国家统计局的官网上收集近3年的GDP数据,然后将这些数据绘制到一个折线图上展示出来...
- c++ opencv imread函数浅解
- 石油网络的放大器设置问题
- python函数参数引用传递
- 一图看懂数据治理、数据管理与数据管控的关系和区别
- 面向对象、基于对象和面向过程
- 2019写给对象的话_[想对对象说的一句情话]2019年最想对你说的十句情话
- ZZULIOJ:1012: 求绝对值
- linux下编译snmp++报crypt冲突
- 如何使用 Python 构建 西门子PLC Snap7通信