Python Tesseract 图片识别-小操练
小科普
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息.
Tesseract的OCR引擎最先由HP实验室于1985年研发,2005年,交由Google对Tesseract进行改进、优化工作。
准备工作
1.PIL 、Pytesseract
from PIL import Image
from pytesseract import image_to_string
2.安装引擎 Tesseract-OCR
ok 用画图工具整张简单的图片(vm3.png)小试牛刀
上代码
from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img)
print(text)
别走,留步,真的只有那么多,不信看结果
支持中文
but,Tesseract是老外开发的,默认不支持中文,需要我们加个中文语言包
将文件chi_sim.traineddata (密码:nd6p) 放到安装目录:Tesseract-OCR\tessdata文件夹内,再整张图
代码骚作修改(,lang='chi_sim')即可
from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img,lang='chi_sim')
print(text)
没毛病
骚微复杂图像处理
其实,复杂图片的来不了,需要处理一下,比如这张图片:
这样处理:
img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
out.show()
show()一下处理后的结果:
最后,整合一下:
img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
text = image_to_string(out)
print(text)
我就知道你会回来,如果你在运行中遇到以下问题:
tesseract is not installed or it's not in your path
一图解万愁
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
添加环境变量:
变量名:TESSDATA_PREFIX
变量值:testdata的路径
如果加了还不行,重启电脑!
如果还不行,试试百度OCR的吧
如果你用来作为验证码识别。可能会用到截屏和裁剪
Python Tesseract 图片识别-小操练相关推荐
- python智能图片识别系统(图片切割、图片识别、区别标识)
目录 技术介绍 运行效果 关键代码 写在最后 技术介绍 你好! python flask图片识别系统使用到的技术有:图片背景切割.图片格式转换(pdf转png).图片模板匹配.图片区别标识. 运行效果 ...
- Python之图片识别
今天我们来实现用Python来进行图片的文字提取. 技术原理:通过借助ORC和Tesseract工具来实现 文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别.Tessera ...
- Python批量图片识别并翻译——我用python给女朋友翻译化妆品标签
周末福利:文末赠书活动 最近小编遇到一个生存问题,女朋友让我给她翻译英文化妆品标签.美其名曰:"程序猿每天英语开发,英文一定很好吧,来帮我翻译翻译化妆品成分","来,帮我 ...
- Python实现图片识别加翻译,高薪必备技能
Python使用百度AI接口实现图片识别加翻译 python python诞生30周年 encoding:utf-8 import requests import base64 from PIL im ...
- python简单图片识别_用Python进行简单的图片识别(1)
起因是这样的,我想买一个定焦镜头,但也不是必需品,可以长期观望购买.最初的想法是,写个程序,每天爬一下各大电商网站的价格,或者直接爬etao把该镜头的价格记录下来,突然有一个惊爆的低价,就发邮件通知. ...
- Python实现图片识别加翻译
Python使用百度AI接口实现图片识别加翻译 python诞生30周年 # encoding:utf-8import requests import base64 from PIL import I ...
- python视频图片识别算法_python利用Opencv进行人脸识别(视频流+图片)
首先:需要在在自己本地安装opencv具体步骤可以问度娘 如果从事于开发中的话建议用第三方的人脸识别(推荐阿里) 1.视频流中进行人脸识别 # -*- coding: utf-8 -*- import ...
- 利用EasyDL制作一个简单的图片识别小项目
主要是利用EasyDL制作一个简单的傻瓜式猫狗图片识别,利用EasyDL,只需要几步简单的点击即可 *主要的步骤: 1.准备数据 2.训练模型 3.部署 4.H5 * 1.首先创建两个文件夹cat和d ...
- python相似图片识别_Python+Opencv识别两张相似图片
Python+Opencv识别两张相似图片 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话 ...
最新文章
- iPhone PHP获取文件,IOS中获取各种文件的目录路径的方法
- 【论文解读】GCN论文总结
- js密码强度正则表达式_知道这20个前端正则表达式,能让你做项目时少写1000行甚至一万行
- SpringMVC系列(十六)Spring MVC与Struts2的对比
- Freenas使用小结(一)安装
- 非平衡电桥电阻计算_微安表内阻值对热敏电阻温度计设计的影响
- 2020年上海将初步建成“泛在化、融合化、智敏化”智慧城市
- Android应用程序开发习题答案
- OpenGL ES 3.1 Android扩展包介绍
- Matlab 符号函数
- 最详细的jsp基础教程
- poj 2387 最短路 spfa 实现
- 时间漩涡的世界 (一)
- 【转贴】忽悠:如何让武器战士买屠龙
- GHOSTXP_SP3 09 绿茶纯净装机版V12.2 【雪豹】
- C语言之位操作和整形的补位
- 【目标检测】(10) Mosaic 数据增强方法,附Python完整代码
- 力扣刷题记录-回溯算法相关题目
- python correlate_关于numpy互相关函数np.correlate的一点疑问
- 阴霾“强势霸屏”长三角 天际上演“失踪的太阳”
热门文章
- 一场“正宗”的开发者大会,为什么说微软更像是“AII in AI”了?
- 离开互联网上岸1年后,我后悔了!重回大厂内卷
- SpringMVC:注解@ControllerAdvice的工作原理
- 求求你们了,别再写满屏的 try catch 了!!
- Spring Boot“内存泄漏”?看看美团大牛是如何排查的
- System.currentTimeMillis()竟然存在性能问题,这我能信?
- 查找算法常见的五大面试知识点与两类实战!
- 竞赛专题(四)特征工程-竞赛中的必杀技
- 使用谷歌Colab Notebooks,这6个小技巧你需要掌握
- 一块只要4美元,超廉价版树莓派诞生,还用上了自研芯片