python 识别图像中的文字（数字）之python图文识别

最近在爬一个网站，找了数据老半天突然发现原来人家不是用数据传输过来的，而是用png背景透明的图片传输过来的，这把我气的不轻。不过发现了是图片就好说，图像文字识别呗，结果发现，这玩意儿里面又有坑等着我。

1.首先我排除了tesseract，因为这个项目我最后要部署到Linux上，但是这个部署过程有点繁琐，因为这个项目的特殊性，我要以效率为主（虽然最后下来其他方法的探索上没少浪费我时间）

2.调用百度接口。这里具体下来就是百度智能云里有一些接口每个月免费1000次可以用。具体什么去百度智能云申请账号，实名注册网上很多，就不多说了，整个下来识别任何普通图片之类的完全OK，但是这个项目不行，问题出在了哪里？总是返回{'log_id': 1478028467765201250, 'error_msg': 'image format error', 'error_code': 216201}。大改理解一下就是图片尺寸问题，这个项目中的图片有点让人无语的地方就是特别小，浏览器上打开还没我的小指头的指甲盖大，

所以我就又用python修改了图片尺寸，代码如下：

def ResizeImage(filein, fileout, width, height, type):from PIL import Imageimg = Image.open(filein)out = img.resize((width, height),Image.ANTIALIAS)#resize image with high-qualityout.save(fileout, type)

filein====》目标文件

fileout===》结果文件

width, height =====》图片尺寸

type=====》图片类型

但是这样的结果又有个问题，每个图片里内容不统一，有些里面只有四个字，有些两个字，啊这样下去，难道让我逐个调节尺寸大小吗？

3.后来我水了这么多的群，终于在群里有位大佬指点我，让我用muggle_ocr库，这个库效果很不错，很多人眼看不清的都能识别出来。但是这个库用起来也不是一帆风顺。比如最开始的安装这个库，直接用pip insyall muggle_ocr是安装不了的，先安装这五个依赖（tensorflow、numpy、opencv-python、pillow、pyyaml）。下载pip install muggle_ocr的时候总是报错，推荐使用国外镜像源。这里因为我的粗心又耽搁了一点时间，找朋友询问还被我那位李姓朋友忽悠走了一杯奶茶才告诉我原因。

李某人，我说过我会把你写进我的博客里，而且是单独占一行

python 识别图像中的文字（数字）之python图文识别相关推荐

python 图像处理与识别书籍_Python图像处理之识别图像中的文字(实例讲解)
①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...
python去除图片上的文字_Python图像处理之识别图像中的文字(实例讲解)
①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...
Python图像处理之识别图像中的文字
①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...
Python识别图像中的文字、数字等
今天给大家分享一个生活中常见的案例,那就是识别图片.PDF文档中的数据,主要是以文字和数字为例. 需要用到两个第三方库:pyocr.cnocr 这里有个大坑:在安装这两个第三方库的时候走了很漫长的路. ...
[译] 用于 iOS 的 ML Kit 教程：识别图像中的文字
原文地址:ML Kit Tutorial for iOS: Recognizing Text in Images 原文作者:By David East 译文出自:掘金翻译计划本文永久链接:githu ...
python3识别图中的文字_Python3.x：如何识别图片上的文字
Python3.x:如何识别图片上的文字安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google ...
使用python识别图像中的文字
以下内容主要介绍一下使用python语言及PIL,pytesser模块来识别图片中的文字,这样方便我们在模拟网站登录时识别验证码(可能也需要用到selenuim模块). 现在正式开始介绍: PIL安装 ...
用C#识别图像中的文字_MODI OCR
1. 前言光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是 ...
编程实战（4）——python识别图像中的坐标点并保存坐标数据
编程实战(4)--python识别图像中的坐标点并保存坐标数据文章目录编程实战(4)--python识别图像中的坐标点并保存坐标数据综述代码思路库的安装图片预处理图像细化图像二极化提 ...

python 识别图像中的文字（数字）之python图文识别

python 识别图像中的文字（数字）之python图文识别相关推荐

最新文章

热门文章