最近在爬一个网站,找了数据老半天突然发现原来人家不是用数据传输过来的,而是用png背景透明的图片传输过来的,这把我气的不轻。不过发现了是图片就好说,图像文字识别呗,结果发现,这玩意儿里面又有坑等着我。

1.首先我排除了tesseract,因为这个项目我最后要部署到Linux上,但是这个部署过程有点繁琐,因为这个项目的特殊性,我要以效率为主(虽然最后下来其他方法的探索上没少浪费我时间)

2.调用百度接口。这里具体下来就是百度智能云里有一些接口每个月免费1000次可以用。具体什么去百度智能云申请账号,实名注册网上很多,就不多说了,整个下来识别任何普通图片之类的完全OK,但是这个项目不行,问题出在了哪里?总是返回{'log_id': 1478028467765201250, 'error_msg': 'image format error', 'error_code': 216201}。大改理解一下就是图片尺寸问题,这个项目中的图片有点让人无语的地方就是特别小,浏览器上打开还没我的小指头的指甲盖大,

所以我就又用python修改了图片尺寸,代码如下:

def ResizeImage(filein, fileout, width, height, type):from PIL import Imageimg = Image.open(filein)out = img.resize((width, height),Image.ANTIALIAS)#resize image with high-qualityout.save(fileout, type)

filein====》目标文件

fileout===》结果文件

width, height =====》图片尺寸

type=====》图片类型

但是这样的结果又有个问题,每个图片里内容不统一,有些里面只有四个字,有些两个字,啊这样下去,难道让我逐个调节尺寸大小吗?

3.后来我水了这么多的群,终于在群里有位大佬指点我,让我用muggle_ocr库,这个库效果很不错,很多人眼看不清的都能识别出来。但是这个库用起来也不是一帆风顺。比如最开始的安装这个库,直接用pip insyall muggle_ocr是安装不了的,先安装这五个依赖(tensorflow、numpy、opencv-python、pillow、pyyaml)。下载pip install muggle_ocr的时候总是报错,推荐使用国外镜像源。这里因为我的粗心又耽搁了一点时间,找朋友询问还被我那位李姓朋友忽悠走了一杯奶茶才告诉我原因。

李某人,我说过我会把你写进我的博客里,而且是单独占一行

python 识别图像中的文字(数字)之python图文识别相关推荐

  1. python 图像处理与识别书籍_Python图像处理之识别图像中的文字(实例讲解)

    ①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...

  2. python去除图片上的文字_Python图像处理之识别图像中的文字(实例讲解)

    ①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...

  3. Python图像处理之识别图像中的文字

    ①安装PIL:pip install Pillow(之前的博客中有写过) ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install p ...

  4. Python识别图像中的文字、数字等

    今天给大家分享一个生活中常见的案例,那就是识别图片.PDF文档中的数据,主要是以文字和数字为例. 需要用到两个第三方库:pyocr.cnocr 这里有个大坑:在安装这两个第三方库的时候走了很漫长的路. ...

  5. [译] 用于 iOS 的 ML Kit 教程:识别图像中的文字

    原文地址:ML Kit Tutorial for iOS: Recognizing Text in Images 原文作者:By David East 译文出自:掘金翻译计划 本文永久链接:githu ...

  6. python3识别图中的文字_Python3.x:如何识别图片上的文字

    Python3.x:如何识别图片上的文字 安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google ...

  7. 使用python识别图像中的文字

    以下内容主要介绍一下使用python语言及PIL,pytesser模块来识别图片中的文字,这样方便我们在模拟网站登录时识别验证码(可能也需要用到selenuim模块). 现在正式开始介绍: PIL安装 ...

  8. 用C#识别图像中的文字_MODI OCR

    1. 前言 光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是 ...

  9. 编程实战(4)——python识别图像中的坐标点并保存坐标数据

    编程实战(4)--python识别图像中的坐标点并保存坐标数据 文章目录 编程实战(4)--python识别图像中的坐标点并保存坐标数据 综述 代码思路 库的安装 图片预处理 图像细化 图像二极化 提 ...

最新文章

  1. 【数字信号处理】相关函数应用 ( TDOA 时差估计实例 | 调制波特率 | 带宽 | 码元数量 | 信息量 )
  2. Unity3D研究院之Inspector面板枚举的别名与排序
  3. search engine php,用php简单实现search engine friendly的url_php技巧
  4. 子进程 已安装 post-installation 脚本 返回错误状态 1 dpkg: 依赖关系问题使得 mysql-server 的配置工作不能继续: mysql-server 依赖于 mysq
  5. C++ delete删除动态分配的内存
  6. SQL Server 2016的新功能–动态数据屏蔽
  7. SQL Server高级查询之T-SQL编程(流程控制语句)
  8. Angular4---环境配置安装
  9. 投票最喜欢报表模板,赢取复联3正版玩偶
  10. 【ERP流程图】:生产制造
  11. 已知等价关系求商集_等价关系、商集和集合的划分.pdf
  12. 2020清北学堂NOIP刷题营day3Bdierti洛谷P4310绝世好题
  13. 力扣刷题 DAY_88 贪心
  14. 双系统蓝牙键盘的共享配对解决办法的简要步骤:win + arch~IRK、LTK、ERand、EDIV
  15. Formality学习笔记一:基本概念
  16. 银行购房按揭贷款利息计算
  17. 如果显示直播连接不成功问题
  18. ping不通_为何移动4G的两台手机Ping不通?
  19. 决胜经典算法之选择排序
  20. linux-note:Linux Basics

热门文章

  1. go语言学习-- chan与goroutine
  2. RecyclerView滚动指定条目并在页面中居中
  3. 【读书笔记】销售运营-策略制定的6大原则及5个常用工具
  4. php缓存怎么清理,php怎么清除opcache缓存
  5. 前端开发技术——对象
  6. 微软、谷歌、百度等公司经典面试100题
  7. 判断两个数运算是否越界
  8. 2019BNUZ_ACM国庆欢乐赛题解
  9. python selenium 接管已开启浏览器
  10. php 高德地图创建标注,使用高德地图API生成带标的专属地图