一、安装依赖库

pip install pytesseract

pip install pillow

二、安装识图引擎tesseract-ocr

https://pan.baidu.com/s/1QaYJc4ggpqhljf4sq_-WQw
密码:2v4a

下载tesseract-ocr-setup-4.00.00dev.exe并安装

三、修改pytesseract库指向tesseract的配置

1、找到python3的安装路径

2、修改pytesseract.py文件

2、将tesseract_cmd的配置改成tesseract安装的执行文件

四、测试识图

1、图片内容

2、代码

from PIL import Image
from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"'
img = Image.open("1.png")
text = image_to_string(img,lang = 'eng',config=tessdata_dir_config)
print(text)

3、结果

五、支持中文

所有语音包地址

https://github.com/tesseract-ocr/tessdata

1、下载中文语音包

https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata

2、将下载好的chi_sim.traineddata包放入Tesseract-OCR安装地址中的tessdata目录中

3、测试中文图片

中文图片

测试代码

from PIL import Image
from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"'
img = Image.open("3.png")
text = image_to_string(img,lang = 'chi_sim',config=tessdata_dir_config) #之前安装的中文包名
print(text)

测试结果

4、图标二值化

灰度化和二值化后的图片

代码

from PIL import Image
from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"'
img = Image.open("3.png")#灰度化
image = img.convert('L')pixels = image.load()threshold = 200 #阈值

#二值化
for x in range(image.width):for y in range(image.height):if pixels[x, y] > threshold:pixels[x, y] = 255else:pixels[x, y] = 0
image.show()
text = image_to_string(image,lang = 'chi_sim',config=tessdata_dir_config)
print(text)

#结果

#结论

汉字的识别率不是太高,如果要求高的话可以使用百度云的百度识图,文档地址:https://cloud.baidu.com/doc/IMAGERECOGNITION/ImageClassify-Python-SDK.html#.E5.8A.A8.E7.89.A9.E8.AF.86.E5.88.AB

使用百度识图需要创建百度云账号,百度识图有免费额度(我没试过),阿里云的识图有点贵。

转载于:https://www.cnblogs.com/zhangb8042/p/10242990.html

python3 自动识图相关推荐

  1. python Opencv和pyautogui实现自动识图点击

    python Opencv和pyautogui实现自动识图点击 1.导入python及其他模块 匹配类是上一章博客内容,pyautogui自带的图片匹配效果不是很理想.就使用Opencv的图片匹配来实 ...

  2. 易景空间地图建筑CAD自动识图转换为室内三维地图技术2021年突破

    目前市场上仅有的几家三维地图编辑器都是通过上传建筑CAD截图图片,然后上传到地图平台,在图片上进行描绘,这个过程时间花费如果房间量少的时候还能忍受,但是在针对复杂.房间比较多的地图场景时,需要重复的绘 ...

  3. 自动识图进行点击,用Python玩连连看是什么效果?

    1.前言 Python实现的qq连连看辅助, 仅用于学习, 请在练习模式下使用, 请不要拿去伤害玩家们- 2.基本环境配置 版本:Python3.6 系统:Windows 3.相关模块: 私信小编00 ...

  4. 快速实践大规模轻量级图片分类模型:飞桨识图 PP-ShiTu

    快速实践大规模图片分类模型:飞桨识图 PP-ShiTu 飞桨识图PP-ShiTu是轻量级图像识别系统,集成了目标检测.特征学习.图像检索等模块,广泛适用于各类图像识别任务.CPU上0.2s即可完成在1 ...

  5. 符号说明表怎么做_电气新手搞不定电气识图怎么办?别慌!8套电气识图教程,秒上手...

    一个电气新手来说第一次看电气图,普遍会存在看不懂,搞不清设计图怎么看这样的一个问题!那么要怎么进行解决呢?第一次看图电气图需要做哪些准备工作呢? 要做到会看图和看懂图,首先应掌握识图的基本知识,即应当 ...

  6. goip技术原理图解_图解电工识图一看就懂

    点击"电工电气学习"关注即可免费订阅! 图解电工识图一看就懂 出版时间:2015内容简介<图解电工识图一看就懂>采用图解的形式,系统介绍了电工识图基础知识.低压电器与电 ...

  7. AI诊断心脏病比人类更准?但这只是识图,不是诊断

    纯生栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这个星球上的人们,或许还没有做好迎接人工智能医生的准备.不过,加州大学旧金山分校(UCSF) 的研究人员培育的AI,已经在心脏图像的分类 ...

  8. DFRobot智能视觉传感器二哈识图(Huskylens)的应用

    二哈识图(HuskyLens)是国内著名开源硬件商DFRobot在人工智能领域出品的一款简单易用的智能视觉传感器.其板载的UART / I2C端口,可以与主流控制器Arduino.micro:bit. ...

  9. 图片素材类网站必备以图搜图、智能搜图识图图像搜索系统imgso,让素材网站更智能专业

    很多背景墙.墙纸.壁纸.电视墙.装修设计素材网都必配以图搜图.这个以图搜图识图的好处不言而喻,是很多素材网必备功能. 推荐一款专业的以图搜图系统imgso,它是一个以图搜图专业系统,让你的网站拥有站内 ...

  10. 机器学习讲座总结-读图时代的识图技术

    在车库咖啡见到了传说的中的大牛 黄畅博士  @黄畅_了解的不只是人脸  ,黄博士对于识图技术进行了一个综述,下面是这次报告的总结. 1. 关于机器学习优化的目的:黄博士提到机器学习并非以求最优为目的, ...

最新文章

  1. 群晖 emby_NAS上安装emby,打造家庭媒体中心
  2. Java 百鸡百钱题
  3. Oracle不同系统之间时间转换(NLS_DATE_LANGUAGE )
  4. linux gui编程语言,使用 Red 语言编写 GUI 应用程序
  5. mysql分片库分页查询_Mysql分库分表
  6. 09年3月编程语言排行榜:Visual Basic与PHP的暗战
  7. 讲述下 :LVM逻辑卷管理遇到的问题
  8. 操作系统(10)-虚拟内存
  9. 中国水龙头市场趋势报告、技术动态创新及市场预测
  10. CSS小技巧--文字对齐
  11. mongodb创建local库用户_MongoDB 在系统数据库local上无法创建用户的解决方法
  12. mysql 查询附近店铺SQL写法 经度 纬度 范围 距离
  13. 使用健康档案数据计算OLT的用户光衰不合格率
  14. finecms aip.php漏洞,FineCMS漏洞挖掘
  15. 软件测试基础 (二): 集成测试
  16. 百度云和ai开放平台关系_集成平台即服务,云和……独角兽
  17. openoffice相关命令
  18. mysql查询大于0的标记,Mysql计数列大于0
  19. ccache高速编译工具
  20. 数据结构——删除x-y之间的元素

热门文章

  1. [转载]linux+nginx+python+mysql安装文档
  2. django学习遇到的问题解决方式
  3. DevExpress 表中数据导出
  4. 浏览器Html 5兼容性测试
  5. [转载]在vim中针对c++自动补全
  6. 剪枝乱炖 | 模型加速与压缩
  7. 【进阶】PyTorch自定义CUDA算子教程与运行时间分析
  8. [CLS]预训练语言模型的前世今生[SEP]萌芽时代[SEP]
  9. 20191202_k-中心聚类算法和k-mean算法Python实现
  10. python pyspark用法