小科普
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息.
Tesseract的OCR引擎最先由HP实验室于1985年研发,2005年,交由Google对Tesseract进行改进、优化工作。

准备工作

1.PIL 、Pytesseract

from PIL import Image
from pytesseract import image_to_string

2.安装引擎 Tesseract-OCR

ok 用画图工具整张简单的图片(vm3.png)小试牛刀

上代码

from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img)
print(text)

别走,留步,真的只有那么多,不信看结果

支持中文

but,Tesseract是老外开发的,默认不支持中文,需要我们加个中文语言包
将文件chi_sim.traineddata (密码:nd6p) 放到安装目录:Tesseract-OCR\tessdata文件夹内,再整张图

代码骚作修改(,lang='chi_sim')即可

from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img,lang='chi_sim')
print(text)

没毛病

骚微复杂图像处理

其实,复杂图片的来不了,需要处理一下,比如这张图片:

这样处理:

img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
out.show()

show()一下处理后的结果:

最后,整合一下:

img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
text = image_to_string(out)
print(text)

我就知道你会回来,如果你在运行中遇到以下问题:


tesseract is not installed or it's not in your path

一图解万愁


Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!

添加环境变量:

变量名:TESSDATA_PREFIX
变量值:testdata的路径

如果加了还不行,重启电脑!

如果还不行,试试百度OCR的吧
如果你用来作为验证码识别。可能会用到截屏和裁剪

Python Tesseract 图片识别-小操练相关推荐

  1. python智能图片识别系统(图片切割、图片识别、区别标识)

    目录 技术介绍 运行效果 关键代码 写在最后 技术介绍 你好! python flask图片识别系统使用到的技术有:图片背景切割.图片格式转换(pdf转png).图片模板匹配.图片区别标识. 运行效果 ...

  2. Python之图片识别

    今天我们来实现用Python来进行图片的文字提取. 技术原理:通过借助ORC和Tesseract工具来实现 文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别.Tessera ...

  3. Python批量图片识别并翻译——我用python给女朋友翻译化妆品标签

    周末福利:文末赠书活动 最近小编遇到一个生存问题,女朋友让我给她翻译英文化妆品标签.美其名曰:"程序猿每天英语开发,英文一定很好吧,来帮我翻译翻译化妆品成分","来,帮我 ...

  4. Python实现图片识别加翻译,高薪必备技能

    Python使用百度AI接口实现图片识别加翻译 python python诞生30周年 encoding:utf-8 import requests import base64 from PIL im ...

  5. python简单图片识别_用Python进行简单的图片识别(1)

    起因是这样的,我想买一个定焦镜头,但也不是必需品,可以长期观望购买.最初的想法是,写个程序,每天爬一下各大电商网站的价格,或者直接爬etao把该镜头的价格记录下来,突然有一个惊爆的低价,就发邮件通知. ...

  6. Python实现图片识别加翻译

    Python使用百度AI接口实现图片识别加翻译 python诞生30周年 # encoding:utf-8import requests import base64 from PIL import I ...

  7. python视频图片识别算法_python利用Opencv进行人脸识别(视频流+图片)

    首先:需要在在自己本地安装opencv具体步骤可以问度娘 如果从事于开发中的话建议用第三方的人脸识别(推荐阿里) 1.视频流中进行人脸识别 # -*- coding: utf-8 -*- import ...

  8. 利用EasyDL制作一个简单的图片识别小项目

    主要是利用EasyDL制作一个简单的傻瓜式猫狗图片识别,利用EasyDL,只需要几步简单的点击即可 *主要的步骤: 1.准备数据 2.训练模型 3.部署 4.H5 * 1.首先创建两个文件夹cat和d ...

  9. python相似图片识别_Python+Opencv识别两张相似图片

    Python+Opencv识别两张相似图片 在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话 ...

最新文章

  1. iPhone PHP获取文件,IOS中获取各种文件的目录路径的方法
  2. 【论文解读】GCN论文总结
  3. js密码强度正则表达式_知道这20个前端正则表达式,能让你做项目时少写1000行甚至一万行
  4. SpringMVC系列(十六)Spring MVC与Struts2的对比
  5. Freenas使用小结(一)安装
  6. 非平衡电桥电阻计算_微安表内阻值对热敏电阻温度计设计的影响
  7. 2020年上海将初步建成“泛在化、融合化、智敏化”智慧城市
  8. Android应用程序开发习题答案
  9. OpenGL ES 3.1 Android扩展包介绍
  10. Matlab 符号函数
  11. 最详细的jsp基础教程
  12. poj 2387 最短路 spfa 实现
  13. 时间漩涡的世界 (一)
  14. 【转贴】忽悠:如何让武器战士买屠龙
  15. GHOSTXP_SP3 09 绿茶纯净装机版V12.2 【雪豹】
  16. C语言之位操作和整形的补位
  17. 【目标检测】(10) Mosaic 数据增强方法,附Python完整代码
  18. 力扣刷题记录-回溯算法相关题目
  19. python correlate_关于numpy互相关函数np.correlate的一点疑问
  20. 阴霾“强势霸屏”长三角 天际上演“失踪的太阳”

热门文章

  1. 一场“正宗”的开发者大会,为什么说微软更像是“AII in AI”了?
  2. 离开互联网上岸1年后,我后悔了!重回大厂内卷
  3. SpringMVC:注解@ControllerAdvice的工作原理
  4. 求求你们了,别再写满屏的 try catch 了!!
  5. Spring Boot“内存泄漏”?看看美团大牛是如何排查的
  6. System.currentTimeMillis()竟然存在性能问题,这我能信?
  7. 查找算法常见的五大面试知识点与两类实战!
  8. 竞赛专题(四)特征工程-竞赛中的必杀技
  9. 使用谷歌Colab Notebooks,这6个小技巧你需要掌握
  10. 一块只要4美元,超廉价版树莓派诞生,还用上了自研芯片