Python Tesseract 图片识别-小操练

小科普
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息.
Tesseract的OCR引擎最先由HP实验室于1985年研发，2005年，交由Google对Tesseract进行改进、优化工作。

准备工作

1.PIL 、Pytesseract

from PIL import Image
from pytesseract import image_to_string

2.安装引擎 Tesseract-OCR

ok 用画图工具整张简单的图片(vm3.png)小试牛刀

上代码

from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img)
print(text)

别走，留步，真的只有那么多，不信看结果

支持中文

but,Tesseract是老外开发的，默认不支持中文，需要我们加个中文语言包
将文件chi_sim.traineddata （密码：nd6p）放到安装目录：Tesseract-OCR\tessdata文件夹内，再整张图

代码骚作修改（，lang='chi_sim'）即可

from PIL import Image
from pytesseract import image_to_stringimg = Image.open("vm3.png");
text = image_to_string(img,lang='chi_sim')
print(text)

没毛病

骚微复杂图像处理

其实，复杂图片的来不了，需要处理一下，比如这张图片：

这样处理：

img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
out.show()

show()一下处理后的结果：

最后，整合一下：

img = Image.open("vm.png");
imgry = img.convert("L")
threshold = 140
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
out = imgry.point(table, '1')
text = image_to_string(out)
print(text)

我就知道你会回来，如果你在运行中遇到以下问题：

tesseract is not installed or it's not in your path

一图解万愁

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!

添加环境变量：

变量名：TESSDATA_PREFIX
变量值：testdata的路径

如果加了还不行，重启电脑！

如果还不行，试试百度OCR的吧
如果你用来作为验证码识别。可能会用到截屏和裁剪

Python Tesseract 图片识别-小操练相关推荐

python智能图片识别系统（图片切割、图片识别、区别标识）
目录技术介绍运行效果关键代码写在最后技术介绍你好! python flask图片识别系统使用到的技术有:图片背景切割.图片格式转换(pdf转png).图片模板匹配.图片区别标识. 运行效果 ...
Python之图片识别
今天我们来实现用Python来进行图片的文字提取. 技术原理:通过借助ORC和Tesseract工具来实现文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别.Tessera ...
Python批量图片识别并翻译——我用python给女朋友翻译化妆品标签
周末福利:文末赠书活动最近小编遇到一个生存问题,女朋友让我给她翻译英文化妆品标签.美其名曰:"程序猿每天英语开发,英文一定很好吧,来帮我翻译翻译化妆品成分","来,帮我 ...
Python实现图片识别加翻译，高薪必备技能
Python使用百度AI接口实现图片识别加翻译 python python诞生30周年 encoding:utf-8 import requests import base64 from PIL im ...
python简单图片识别_用Python进行简单的图片识别(1)
起因是这样的,我想买一个定焦镜头,但也不是必需品,可以长期观望购买.最初的想法是,写个程序,每天爬一下各大电商网站的价格,或者直接爬etao把该镜头的价格记录下来,突然有一个惊爆的低价,就发邮件通知. ...
Python实现图片识别加翻译
Python使用百度AI接口实现图片识别加翻译 python诞生30周年 # encoding:utf-8import requests import base64 from PIL import I ...
python视频图片识别算法_python利用Opencv进行人脸识别（视频流+图片）
首先:需要在在自己本地安装opencv具体步骤可以问度娘如果从事于开发中的话建议用第三方的人脸识别(推荐阿里) 1.视频流中进行人脸识别 # -*- coding: utf-8 -*- import ...
利用EasyDL制作一个简单的图片识别小项目
主要是利用EasyDL制作一个简单的傻瓜式猫狗图片识别,利用EasyDL,只需要几步简单的点击即可 *主要的步骤: 1.准备数据 2.训练模型 3.部署 4.H5 * 1.首先创建两个文件夹cat和d ...
python相似图片识别_Python+Opencv识别两张相似图片
Python+Opencv识别两张相似图片在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话 ...

Python Tesseract 图片识别-小操练

ok 用画图工具整张简单的图片(vm3.png)小试牛刀

上代码

支持中文

骚微复杂图像处理

Python Tesseract 图片识别-小操练相关推荐

最新文章

热门文章