python -使用pytesseract识别文字时遇到的问题
1、运行环境
(1) win10
(2) pycharm
(3) python 3.5
2、下载pytesseract、pillow库
(1)在cmd终端页面输入:pip install pytesseract
(2)在cmd终端页面输入:pip install pillow
3、安装Tesseract-OCR软件
我们需要下载Tesseract-OCR这个软件,这里我已经将东西都打包好了放在百度云中,大家可以直接下载:
https://pan.baidu.com/s/1AqkFp6QYB_beoy_GO9aCJA
提取密码:25et
或者在网上下载其他版本的软件:
https://digi.bib.uni-mannheim.de/tesseract/
打开安装包,进行一路安装:
记录好自己的安装路径
安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。
之后,我们只剩下一个东西要配一下了,在pytesseract模块中的pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,这个时候我们可以通过刚刚pip安装的位置找到pytesseract.py文件,如下图:
进入目录找到pytesseract.py文件并且打开它:
将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。
现在,我们在准备一张图片,用来识别:
4、编写代码进行测试
img2text.py
#coding:gbk
import pytesseract
from PIL import Image# 使用pytesseract对英文进行识别,lang参数可省略
code = pytesseract.image_to_string(Image.open(r'shijian.png'),lang="eng")
print(code)
# 使用pytesseract对中文(含英文,但识别率降低)进行识别
code = pytesseract.image_to_string(Image.open(r'shuzi.jpg'),lang='chi_sim')
print(code)
测试结果:
w (p won i#coding:gbkimport pytesseract
from PIL import Image
H"7999999999999"
我们可以看到在画质清晰的图片中,数字文字识别比较准确。
此次问题解决到此结束。
python -使用pytesseract识别文字时遇到的问题相关推荐
- 【Python】轻松识别文字,这款Python OCR库支持超过80种语言
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|Python大数据分析 什么是OCR? 有一款软件叫扫描全 ...
- 我用Python实现截图识别文字,工作效率提升,直接打卡下班
大家好,我是大飞,今天给大家带来Python实现有趣的脚本. <font size="5"">ta href="#diary-tail" ...
- Python 截取图片识别文字并翻译
一.使用百度账号登录,查看 百度OCR识别API文档 : 首次创建新的应用,必须将文字识别中需要的✔,界面如下: 二.使用键盘监听事件,监听用户有没有触发截屏快捷方式 ctrl+o,并将 ...
- python调用百度识别文字接口_python调用百度通用文字识别接口进行验证码识别
官方文档入口 https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E7.AE.80.E4.BB.8B 安装 pip3 install baidu- ...
- python实现ocr识别文字
首先安装模块PIL pip3 install PIL 再装tesseract apt-get install tesseract-ocr 最后装pytesseract pip3 install pyt ...
- python图片转文字_【收藏】图片转成文字的方法总结,python批量图片转文字信息参考源码...
在日常办公或者学习中,往往存在这样一个工作场景,比如,"老王,我这里有一张图片,你把里面的文字信息给我整理出来",都2021年了,你真的还在手敲图片文字信息么?那么还不赶紧收藏这篇 ...
- 【收藏】图片转成文字的方法总结,python批量图片转文字信息参考源码
在日常办公或者学习中,往往存在这样一个工作场景,比如,"老王,我这里有一张图片,你把里面的文字信息给我整理出来",都2021年了,你真的还在手敲图片文字信息么?那么还不赶紧收藏这篇 ...
- 通过Python的pytesseract库识别图片中的文字
文章目录 前言 一.pytesseract 1.pytesseract是什么? 2.安装pytesseract 3.查看pytesseract版本 4.安装PIL 5.查看PIL版本 二.Tesser ...
- python文字识别 训练_Python3.x:pytesseract识别率提高(样本训练)
Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个人 ...
- python视觉识别字_Python怎么识别文字?正确 的方法详解
爬虫--文字识别 机器视觉 从Google的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域. 这里我们将重点介绍机器视觉的一个分支:文字识别.介 ...
最新文章
- 丰田chr优惠5万_精打细算还是英朗划算,优惠5万入手英朗,落地8.8万买贵了吗...
- 如何修改textarea中placeholder的字体
- thinkphp5记录
- springbboot加密打包_Spring Boot 配置 Security 密码加密
- 基于JavaWEB SSM SpringBoot婚纱影楼摄影预约网站设计和实现
- NGUI字体贴图压缩以及相关Shader解读
- 3d数学基础:图形和游戏开发(第2版)_游戏引擎编程需要哪些基本数学知识?
- sql server注入_SQL注入:SQL Server中的介绍和预防方法
- ClustalX进行多序列比对流程
- 【SAP】-常用简称中英日对照表
- amend用法 git 信息_Git commit --amend 修改提交信息操作
- 操作系统与内核的关系
- 中国安检设备行业市场发展分析及前景趋势展望报告2022-2028年
- 台风怎么看内存颗粒_高体质CJR颗粒!七彩虹CVN捍卫者内存评测
- 1894 Beckham’s Freekick
- 关于内推、简历、面试,我有一些想说的
- 常见的继电接触器控制线路总结
- 【问题解决】samba添加用户和密码时报错 Failed to add entry for user
- 计算机基础知识(基础入门小白专属)九
- task定时任务不能自动注入 问题解决办法
热门文章
- 可达编程 [语言题]中国身份证号码校验
- 北京精雕SurfMill8.0 智能电极加工
- 常见设备/CMS默认口令
- 虫师乙醇自动化测试培训第三期
- DPPO:Distributed Proximal Policy Optimization
- Python-Pyecharts画图(饼图,雷达图,词云)[二]
- java rd th 小票机_英语日期rd,th有什么区别,怎么运用
- 互联网最值得加入的 173 家国企汇总!!
- python工资津贴的计算和排序-Python:如何排序(sort)
- MATLAB 自动控制原理 传递函数单位阶跃响应曲线绘制