python3 自动识图
一、安装依赖库
pip install pytesseract
pip install pillow
二、安装识图引擎tesseract-ocr
https://pan.baidu.com/s/1QaYJc4ggpqhljf4sq_-WQw
密码:2v4a
下载tesseract-ocr-setup-4.00.00dev.exe并安装
三、修改pytesseract库指向tesseract的配置
1、找到python3的安装路径
2、修改pytesseract.py文件
2、将tesseract_cmd的配置改成tesseract安装的执行文件
四、测试识图
1、图片内容
2、代码
from PIL import Image from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"' img = Image.open("1.png") text = image_to_string(img,lang = 'eng',config=tessdata_dir_config) print(text)
3、结果
五、支持中文
所有语音包地址
https://github.com/tesseract-ocr/tessdata
1、下载中文语音包
https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
2、将下载好的chi_sim.traineddata包放入Tesseract-OCR安装地址中的tessdata目录中
3、测试中文图片
中文图片
测试代码
from PIL import Image from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"' img = Image.open("3.png") text = image_to_string(img,lang = 'chi_sim',config=tessdata_dir_config) #之前安装的中文包名 print(text)
测试结果
4、图标二值化
灰度化和二值化后的图片
代码
from PIL import Image from pytesseract import image_to_stringtessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"' img = Image.open("3.png")#灰度化 image = img.convert('L')pixels = image.load()threshold = 200 #阈值 #二值化 for x in range(image.width):for y in range(image.height):if pixels[x, y] > threshold:pixels[x, y] = 255else:pixels[x, y] = 0 image.show() text = image_to_string(image,lang = 'chi_sim',config=tessdata_dir_config) print(text)
#结果
#结论
汉字的识别率不是太高,如果要求高的话可以使用百度云的百度识图,文档地址:https://cloud.baidu.com/doc/IMAGERECOGNITION/ImageClassify-Python-SDK.html#.E5.8A.A8.E7.89.A9.E8.AF.86.E5.88.AB
使用百度识图需要创建百度云账号,百度识图有免费额度(我没试过),阿里云的识图有点贵。
转载于:https://www.cnblogs.com/zhangb8042/p/10242990.html
python3 自动识图相关推荐
- python Opencv和pyautogui实现自动识图点击
python Opencv和pyautogui实现自动识图点击 1.导入python及其他模块 匹配类是上一章博客内容,pyautogui自带的图片匹配效果不是很理想.就使用Opencv的图片匹配来实 ...
- 易景空间地图建筑CAD自动识图转换为室内三维地图技术2021年突破
目前市场上仅有的几家三维地图编辑器都是通过上传建筑CAD截图图片,然后上传到地图平台,在图片上进行描绘,这个过程时间花费如果房间量少的时候还能忍受,但是在针对复杂.房间比较多的地图场景时,需要重复的绘 ...
- 自动识图进行点击,用Python玩连连看是什么效果?
1.前言 Python实现的qq连连看辅助, 仅用于学习, 请在练习模式下使用, 请不要拿去伤害玩家们- 2.基本环境配置 版本:Python3.6 系统:Windows 3.相关模块: 私信小编00 ...
- 快速实践大规模轻量级图片分类模型:飞桨识图 PP-ShiTu
快速实践大规模图片分类模型:飞桨识图 PP-ShiTu 飞桨识图PP-ShiTu是轻量级图像识别系统,集成了目标检测.特征学习.图像检索等模块,广泛适用于各类图像识别任务.CPU上0.2s即可完成在1 ...
- 符号说明表怎么做_电气新手搞不定电气识图怎么办?别慌!8套电气识图教程,秒上手...
一个电气新手来说第一次看电气图,普遍会存在看不懂,搞不清设计图怎么看这样的一个问题!那么要怎么进行解决呢?第一次看图电气图需要做哪些准备工作呢? 要做到会看图和看懂图,首先应掌握识图的基本知识,即应当 ...
- goip技术原理图解_图解电工识图一看就懂
点击"电工电气学习"关注即可免费订阅! 图解电工识图一看就懂 出版时间:2015内容简介<图解电工识图一看就懂>采用图解的形式,系统介绍了电工识图基础知识.低压电器与电 ...
- AI诊断心脏病比人类更准?但这只是识图,不是诊断
纯生栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这个星球上的人们,或许还没有做好迎接人工智能医生的准备.不过,加州大学旧金山分校(UCSF) 的研究人员培育的AI,已经在心脏图像的分类 ...
- DFRobot智能视觉传感器二哈识图(Huskylens)的应用
二哈识图(HuskyLens)是国内著名开源硬件商DFRobot在人工智能领域出品的一款简单易用的智能视觉传感器.其板载的UART / I2C端口,可以与主流控制器Arduino.micro:bit. ...
- 图片素材类网站必备以图搜图、智能搜图识图图像搜索系统imgso,让素材网站更智能专业
很多背景墙.墙纸.壁纸.电视墙.装修设计素材网都必配以图搜图.这个以图搜图识图的好处不言而喻,是很多素材网必备功能. 推荐一款专业的以图搜图系统imgso,它是一个以图搜图专业系统,让你的网站拥有站内 ...
- 机器学习讲座总结-读图时代的识图技术
在车库咖啡见到了传说的中的大牛 黄畅博士 @黄畅_了解的不只是人脸 ,黄博士对于识图技术进行了一个综述,下面是这次报告的总结. 1. 关于机器学习优化的目的:黄博士提到机器学习并非以求最优为目的, ...
最新文章
- 群晖 emby_NAS上安装emby,打造家庭媒体中心
- Java 百鸡百钱题
- Oracle不同系统之间时间转换(NLS_DATE_LANGUAGE )
- linux gui编程语言,使用 Red 语言编写 GUI 应用程序
- mysql分片库分页查询_Mysql分库分表
- 09年3月编程语言排行榜:Visual Basic与PHP的暗战
- 讲述下 :LVM逻辑卷管理遇到的问题
- 操作系统(10)-虚拟内存
- 中国水龙头市场趋势报告、技术动态创新及市场预测
- CSS小技巧--文字对齐
- mongodb创建local库用户_MongoDB 在系统数据库local上无法创建用户的解决方法
- mysql 查询附近店铺SQL写法 经度 纬度 范围 距离
- 使用健康档案数据计算OLT的用户光衰不合格率
- finecms aip.php漏洞,FineCMS漏洞挖掘
- 软件测试基础 (二): 集成测试
- 百度云和ai开放平台关系_集成平台即服务,云和……独角兽
- openoffice相关命令
- mysql查询大于0的标记,Mysql计数列大于0
- ccache高速编译工具
- 数据结构——删除x-y之间的元素
热门文章
- [转载]linux+nginx+python+mysql安装文档
- django学习遇到的问题解决方式
- DevExpress 表中数据导出
- 浏览器Html 5兼容性测试
- [转载]在vim中针对c++自动补全
- 剪枝乱炖 | 模型加速与压缩
- 【进阶】PyTorch自定义CUDA算子教程与运行时间分析
- [CLS]预训练语言模型的前世今生[SEP]萌芽时代[SEP]
- 20191202_k-中心聚类算法和k-mean算法Python实现
- python pyspark用法