基于python的OCR字符识别
官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
1 基本环境
操作系统:win10 64位系统
python版本:3.6
2 安装配套环境
(1)首先安装OCR字符识别库Tesseract 下载网址:Index of /tesseract
下载下图对应的版本(如下图所示)
下载后双击进行安装,在这里(如下图)要根据需求在安装界面进行语言勾选,展开Additional language data
然后按照下图进行勾选(本人选择的是中文)
然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径)。我的路径为:
D:\Tesseract-OCR
接下来配置环境变量。
通过控制面板找到环境变量配置界面如下(找不到环境变量配置的自行百度):
分别对用户变量PATH和系统变量Path添加刚才的安装目录 D:\Tesseract-OCR;
环境变量修改好之后验证下是否安装成功。打开cmd命令行工具 敲入命令:
Tesseract -v
出来如下界面说明成功
(2)安装python环境
pip install Pillow==5.2.0
pip install pytesseract==0.2.4
3 测试
将以下图片保存为OCR_test.png,然后放在桌面上
在cmd窗口中执行 tesseract test.jpg test.txt –l chi_sim+eng(chi_sim是中文识别包,equ是数学公式包,eng是英文包),即可将图片中的文字识别出来
tesseract OCR_test.png OCR_test –l chi_sim+eng
效果图如下:
基于python的OCR字符识别相关推荐
- python如何ocr_基于Python的OCR实现示例
摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...
- python实现ocr识别算法_基于Python的OCR实现示例
摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...
- 简单实用的基于python的OCR中文字符识别——基于windows平台(附代码)
1. 基本环境 操作系统:win7 64位系统 python版本:3.6 2.安装配套环境 (1)首先安装OCR字符识别库Tesseract 下载网址:https://digi.bib.uni- ...
- 基于Python的OCR图像识别
前言 由于目前做的项目里面有些地方的需要用到图像文字识别,因此在此总结下,以下方法适合新手 1.使用python的pytesseract库 主要是安装库,比较简单,直接使用 pip install 安 ...
- 基于python的OCR图像识别,EasyOCR图像处理文字识别
最近在做ocr图像识别,试过了好多种,其中EasyOCR模块还是可以满足基本的图像识别的,下面,写一写使用的方法,一是供大家参考,二也是自己做个备注笔记,另外,EasyORC是个开源的项目,免费的 1 ...
- 【优秀课设】基于Python的百度API的OCR名片识别【含完整API账户】
基于Python的百度API的OCR名片识别[含完整API账户] API账户:(AK及SK) client_id ='WiXDt5e70NI5w0qSeoUBZClZ' client_secret = ...
- python 高精度时间_如何基于Python代码实现高精度免费OCR工具
近期Github开源了一款基于Python开发.名为Textshot的截图工具,刚开源不到半个月已经500+Star. 这两天抽空看了一下Textshot的源码,的确是一个值得介绍的项目. 相对于大多 ...
- 基于Python的离线OCR图片文字识别(一)——命令行方式对图像文件处理生成同名txt文件
应用背景:在正式开始文章之前,先阐述一下项目的应用背景--项目需要对已有的电子档案数据进行"大数据"处理和呈现,但是由于之前进行档案电子化时都是以扫描文件的图像格式存储在硬盘上(准 ...
- 基于Python的简单验证码识别
原文链接:有图有真相 摘要:验证码在网络安全方面发挥着关键作用,验证码的主要目的是区分人类和计算机,用来防止自动化脚本对网站的一些恶意行为.目前绝大多数网站都利用验证码来阻止恶意脚本程序的入侵.验证码 ...
最新文章
- C++实现stack【栈】
- U盘安装LINUX系统,拔除U盘后无法引导系统
- MIME type类型
- linux命令行设置编码,编码样式-Linux命令行开关和参数是否有标准?
- 属于程序员的黄金五年,把握这 5 年,或将迎来美好的职场生活!
- VS中使用码云gitee建立源代码管理
- 环境变量查看修改工具 RapidEE(Rapid Environment Editor)
- 股票财务指标数据获取,附代码
- pandas安装了但是import不了
- 入侵检测系统建设及常见入侵手法应对
- 2021年12月中国A股钢铁行业上市企业市值排行榜:行业总市值较11月增长1.18%,金洲管道增幅最大(附月榜TOP44详单)
- 计算机组成原理实验:静态随机存储器实验
- 小程序 侧边栏(导航)滑动
- java魂斗罗_向经典致敬--跟我用Java写魂斗罗
- dnf压爆服务器挑战网站,dnf手游压爆服务器挑战在哪里?地下城与勇士压爆挑战体验时间介绍[多图]...
- 关于Tomcat中文乱码问题的探究
- 我炒股十五年,亏损超过五十万,我该怎么办?
- 5G投资稳步下降:三大运营商CAPEX支出集体“转向”
- super()函数的使用
- 【计网面经】HTTP
热门文章
- iOS之热启动和冷启动
- Android冷启动与热启动概念
- CentOS7下安装chrome浏览器
- tsconfig.json配置学习笔记
- 第一章,倒霉的少女。
- b社服务器稳定吗,B社向玩家道歉 《辐射76》将会在12月推出两次大补
- 创新案例分享 | 人力资源数字化赋能开启银行新篇章
- 数据结构之每日一练-02(冒泡排序)
- 中专学的计算机大学可以报什么专业,初中孩子成绩不好,上中职学这五个专业,不愁就业又能考大学...
- java输出一副扑克牌_Java输出扑克牌中的“红黑梅方”和其他表情包