作者 | Dario Radečić

编译 | VK

来源 | Towards DataScience

处理图像不是一项简单的任务。对你来说,作为一个人,很容易看着某样东西然后马上知道你在看什么。但电脑不是这样工作的。

对你来说太难的任务,比如复杂的算术,或者一般意义上的数学,是计算机毫不费力就能完成的。但在这里,情况正好相反——对你来说很琐碎的任务,比如识别图像中的猫或狗,对电脑来说真的很难。在某种程度上,我们是天造地设的一对。至少现在是这样。

虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的理解,但是从格式良好的图像中读取文本在Python中却是简单的,并且可以应用于许多现实生活中的问题。

在今天的帖子中,我想证明这一点。虽然会安装一些库,但不会花很多时间。这些是你需要的库:

  • OpenCV

  • PyTesseract

OpenCV

现在,这个库将只用于加载图像,实际上你不需要事先对它有太多了解(尽管它可能有帮助,你将看到为什么)。

根据官方文件:

OpenCV(开源计算机视觉库)是一个开源的计算机视觉和机器学习软件库。OpenCV的目的是为计算机视觉应用提供一个通用的基础结构,并加速机器感知在商业产品中的使用。OpenCV是bsd许可的产品,OpenCV使企业可以轻松地使用和修改代码

简而言之,你可以使用OpenCV来做任何类型的图像转换,这是一个相当简单的库。

如果你还没有安装它,那么它将只是终端中的一行:

pip install opencv-python

差不多就是这样。在此之前,一切都很简单,但这种情况即将改变。

PyTesseract

这个库到底是什么东西?根据维基百科:

Tesseract是用于各种操作系统的光学字符识别引擎。它是免费软件,根据Apache许可2.0版发布,自2006年以来由Google赞助开发。

我敢肯定,现在有更多复杂的库可用,但是我发现这个库运行良好。根据我自己的经验,该库应该能够从任何图像中读取文本,但前提是该字体不会使你连连看都看不懂。

如果无法从你的图像中读取文字,花更多的时间使用OpenCV,应用各种过滤器使文本高亮。

现在安装在底部有些麻烦。如果你使用的是Linux,则全部归结为几个sudo-apt get命令:

sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev

我用的是Windows系统,所以这个过程有点乏味。

首先,打开这个URL:https://github.com/UB-Mannheim/tesseract/wiki下载32位或64位的安装程序:


安装本身很简单,只需单击几次Next。是的,你还需要做一个pip安装:

pip install pytesseract

接下来要需要告诉Python Tesseract安装在何处。在Linux机器上,我不需要这样做,但在Windows上是必需的。默认情况下,它安装Program Files

如果你做的一切正确,执行这些代码应该不会产生任何错误:


获取文本

让我们从一个简单的开始。我找到了一些免版税的图片,里面有一些文字,第一个是这样的:


它应该是简单的一个,有可能Tesseract会读那些蓝色的“对象”作为括号。让我们看看会发生什么:


我的猜测是正确的。不过,这不是一个问题,你可以使用一些Python技巧轻松地解决这些问题。

下一个可能更棘手:


我希望它不会检测到硬币上的“B”:


看起来效果很好。

现在轮到你把它应用到你自己的问题上了。如果文本与背景混合,OpenCV技能在这里可能是至关重要的。

在你离开之前

对计算机来说,从图像中读取文本是一项相当困难的任务。想想看,电脑不知道字母是什么,它只对数字有效。在引擎盖后面发生的事情一开始可能看起来像一个黑盒子,但我鼓励你进一步研究,如果这是你感兴趣的领域。

我并不是说PyTesseract每次都能很好地工作,但是我发现即使在一些比较复杂的图像上它也足够好。但不是所有情况都很好,有时候需要一些图像处理需要使文本高亮让其相对于背景更加突出。

参考文献

  1. https://opencv.org/about/

  2. https://en.wikipedia.org/wiki/Tesseract_(software)

▼往期精彩回顾▼Rasa 聊天机器人专栏(三):架构介绍使用Keras构建深度图像搜索引擎3D模型学会了「唱、跳、Rap、篮球」,GitHub网友也沉迷「鸡你太美」长按扫码,关注我们

你与世界只差一个

磐创AI

点击

opencv videoio无法读取rstp_使用一行Python代码从图像读取文本相关推荐

  1. 25个好用到爆的一行 Python 代码,建议收藏

    作者 | 欣一 来源 | Pyhton爱好集中营 在学习Python的过程当中,有很多复杂的任务其实只需要一行代码就可以解决,那么今天小编我就来给大家介绍实用的一行Python代码,希望对大家能够有所 ...

  2. 【Python】25个好用到爆的一行Python代码,建议收藏

    在学习Python的过程当中,有很多复杂的任务其实只需要一行代码就可以解决,那么今天小编我就来给大家介绍20个实用的一行Python代码,希望对大家能够有所帮助. 1.两个字典的合并 x = {'a' ...

  3. 25个好用到爆的一行Python代码,建议收藏

    大家好,我是欣一 在学习Python的过程当中,有很多复杂的任务其实只需要一行代码就可以解决,那么今天小编我就来给大家介绍20个实用的一行Python代码,希望对大家能够有所帮助. 1.两个字典的合并 ...

  4. resnet keras 结构_Wandb用起来,一行Python代码实现Keras模型可视化

    大数据文摘出品 来源:wandb 编译:邢畅.宁静 在训练神经网络的过程中,我们可能会希望可视化网络的性能和中间的结构,很多可视化代码的冗长复杂使得我们望而却步,有没有一行代码就能解决可视化的所有问题 ...

  5. 神操作!一行Python代码搞定一款游戏?给力!

    来源:pypl编程榜 一直以来Python长期霸占编程语言排行榜前三位,其简洁,功能强大的特性使越来越多的小伙伴开始学习Python .甚至K12的同学都开始学习Python 编程.新手入门的时候趣味 ...

  6. 一行Python代码能实现这么多丧心病狂的功能?(代码可复制)

    最近看知乎上有一篇名为<一行 Python 能实现什么丧心病狂的功能?>(https://www.zhihu.com/question/37046157)的帖子,点进去发现一行Python ...

  7. python、PyTorch图像读取与numpy转换

    原文:https://blog.csdn.net/yskyskyer123/article/details/80707038 python.PyTorch图像读取与numpy转换 Tensor转为nu ...

  8. python可以干嘛知乎-一行Python代码能做什么?

    原标题:一行Python代码能做什么? 作者:笑虎 来源:知乎 首先你要了解一下Python之禅,一行代码输出"The Zen of Python": python -c &quo ...

  9. python画代码-一行Python代码画心型

    一行Python代码画心型 1.画I组成的心型代码: print(' '.join([''.join([('I'[(x-y) % len('I')]if ((x*0.05)**2+(y*0.1)**2 ...

最新文章

  1. C++ 打造自己的Windows终端服务客户端(转)
  2. oracle数据库----笔记1----oracle数据类型
  3. java中集合类的转换_Java中的两个常用工具类及集合数组的相互转换
  4. python训练营朋友圈留言_用Python发一个高逼格的朋友圈【附代码】
  5. python快速排序函数_python算法-快速排序
  6. linux getdents 例子,Linux那些事儿之我是Sysfs(12)举例三:sysfs读入文件夹内容
  7. js如何监听元素事件是否被移除_js 监听事件的叠加和移除 -
  8. sql2008 评估期过期解决办法
  9. Qt系列教程-yafeilinx Qt入门教程
  10. 自定义皮肤---极点五笔5.1
  11. 禁止QQ自动转义表情字符
  12. Beta 反(tu)思(cao) 获小黄衫感言
  13. flutter TabBar设置圆角背景
  14. 基于组件开发——应用软件开发的革命
  15. web前端技术——三、表单
  16. 如何使用netstat命令辨别DDOS入侵
  17. 字节跳动技术评级与面试
  18. Ctrl+Z 撤销 撤多了 砍手之前先修复!!
  19. java基础巩固-宇宙第一AiYWM:为了维持生计,四大基础之计网_Part_1-2(HTTP1.0、1.1、2.0、3.0【谁比谁牛,牛在哪】;HTTP(S)、会话和饼干、权限)整起
  20. 基于扩展卡尔曼滤波的SOC估计(附MATLAB代码)

热门文章

  1. php 自动测试,PHP自动化测试
  2. 移动app测试的多样性_app移动端接口性能测试
  3. python tcp服务器_Python 创建TCP服务器的方法
  4. java 对象 读写锁_读写锁的java实现
  5. java中集合的区别_Java中的集合与集合之间的区别
  6. linux 系统后门检测工具,Linux系统的各种后门和日志工具详细介绍[2]
  7. 全面讲解Python列表数组(二),列表分区/片,列表操作符,比较操作符,逻辑操作符,连接操作符,重复操作符,成员关系操作符;
  8. python中hasattr()、getattr()、setattr()函数的使用
  9. python的init函数里参数的作用
  10. Python实现网页截图