点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达本文转自|Python大数据分析
什么是OCR?

有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。

所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。

OCR的全称叫作“Optical Character Recognition”,即光学字符识别。

这算是生活里最常见、最有用的AI应用技术之一。

细心观察便可发现,身边到处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。

OCR本质是图像识别,其包含两大关键技术:文本检测和文字识别。

先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。

关于EasyOCR

Python中有一个不错的OCR库-EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。

https://github.com/JaidedAI/EasyOCR

EasyOCR支持超过80种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。

安装EasyOCR

安装过程比较简单,使用pip或者conda安装。

pip install easyocr

如果用的PyPl源,安装起来可能会耽误些时间,建议大家用清华源安装,几十秒就能安装好。

使用方法

EasyOCR的用法非常简单,分为三步:

  • 1.创建识别对象;

  • 2.读取并识别图像;

  • 3.导出文本。

我们先来举个简单的例子。

找一张路标图片,保存到电脑:

接着撸代码:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en'])
# 读取图像
result = reader.readtext('test.jpg')
# 结果
result

输出结果:

可以看到路标上的三个路名以及拼音都识别出来了!

识别的结果包含在元组里,元组由三部分组成:边框坐标、文本、识别概率。

「关于语言:」

这段代码有一段参数['ch_sim','en'],这是要识别的语言列表,因为路牌里有中文和英文,所以列表里添加了ch_sim(简体中文)、en(英文)。

可以一次传递多种语言,但并非所有语言都可以一起使用。英语与每种语言兼容,共享公共字符的语言通常相互兼容。

前文我们给出了EasyOCR支持的语言列表,并附有参数代号。

「关于图像文件:」

上面传入了相对路径'test.jpg',还可以传递OpenCV图像对象(numpy数组)、图像字节文件、图像URL。

再读取一张文字较多的新闻稿图片:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en'])
# 读取图像
result = reader.readtext('test1.jpg')
# 结果
result

识别文字的准确率还是很高的,接下来对文字部分进行抽取。

for i in result:word = i[1]print(word)

输出:

小结

该开源库是作者研究了几篇论文,复现出来的成果,真是一位实干家。

检测部分使用了CRAFT算法,识别模型为CRNN,它由3个主要组件组成:特征提取,序列标记(LSTM)和解码(CTC)。整个深度学习过程基于Pytorch实现。

作者一直在完善EasyOCR,后续计划一方面扩展支持更多的语言,争取覆盖全球80%~90%的人口;另一方面支持手写识别,并提高处理速度。

好消息,小白学视觉团队的知识星球开通啦,为了感谢大家的支持与厚爱,团队决定将价值149元的知识星球现时免费加入。各位小伙伴们要抓住机会哦!

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

【Python】轻松识别文字,这款Python OCR库支持超过80种语言相关推荐

  1. python ocr 识别中文pdf_轻松识别文字,这款Python OCR库支持超过80种语言

    OCR是什么? 有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字. 所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息. OCR的 ...

  2. 轻松识别文字,这款Python OCR库支持超过80种语言

    击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 江汉曾为客,相逢每醉还. OCR是什 ...

  3. python ocr识别库_轻松识别文字,这款Python OCR库支持超过80种语言

    OCR是什么? 有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字. 所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息. OCR的 ...

  4. Aquaforest OCR SDK 支持超过100种语言

    Aquaforest OCR SDK 支持超过100种语言 什么是Aquaforest OCR SDK? Aquaforest的.NET OCR SDK使开发人员可以在其应用程序中立即使用此Aquaf ...

  5. 初体验python图片识别文字【Tesseract】OCR技术

    系列文章目录 @[TOC](文章目录) 前言 现在OCR技术用的比较广泛,但是大多接口都是需要付费,例如腾讯.百度.阿里 但是当我们想用到里面的文字时,还是要一个字一个字打出来.那么我们能不能直接识别 ...

  6. python截图识别文字_用百度ocr+微信截图实现文字识别

    作用:将图片中的文字识别出来 一.调用微信截图dll控件 将微信截图插件复制到项目文件,使用ctypes加载(胶水语言就是给力) def capture(): try: dll = ctypes.cd ...

  7. 使用Python轻松识别音频中文字(Whisper)

    使用Python轻松识别音频中文字 一.前言 在开会或是讨论问题的时候,我们总有一些内容需要记录下来.但由于各种原因,我们无法做到全面细致的记录.事后我们可能需要补充这些细节性内容,而回放视频或是录音 ...

  8. screenocr怎么卸载_如何截图识别文字?这五款软件教你轻松识别文字!

    原标题:如何截图识别文字?这五款软件教你轻松识别文字! 在我们日常学习和日常工作中,如果遇到截图识别文字该怎么办呢? 有时候我们会需要在电脑桌面或者浏览页上临时截图识别图中的文字,尤其是在写文章记录素 ...

  9. TextGrabber重大更新,识别文字并实时离线翻译,支持中文

    内容来源:ATYUN AI平台 当你想用机器翻译时,也许会立刻打开谷歌翻译.但是,尽管经过多年的开发和技术收购,它仍然存在诸多问题.例如,如果你在陌生国家没有互联网连接,并且未提前下载该语言,会发生什 ...

最新文章

  1. jiebaR中文分词,从入门到喜欢
  2. 085_Document对象
  3. 现代密码学5.2--域扩张:Merkle-Damgard Transform
  4. XML简介及基本语法
  5. zabbix-web前端配置
  6. 关于linux分区与挂载的解释
  7. 谈谈利用JavaScript结合相对单位rem实现自适应布局的简单而实用的方法
  8. 虽然你没有考入清华大学,但是如果你有对于计算机的向往!!!请看过来
  9. ssh(struts,spring,hibernate)开发的初步集成01--依赖
  10. krita绘图_使用Krita 2.9的Digital Painting提供了缺少的Krita文档
  11. linux设置环境变量 临时设置 和 永久设置
  12. Kubernetes Node Controller源码分析之配置篇
  13. IntelliJ远程调试教程
  14. matlab多重比较lsd法,多重比较LSD-t值的计算(附证明方法)
  15. Pipeline快速入门
  16. uniapp如何分享文件到微信 文件分享
  17. python爬虫爬取网页壁纸图片(《底特律:变人》)
  18. Centos7 glibc库升级到2.23
  19. iOS开发技巧-国际化(Localization),只看一篇就够了
  20. Redis 高可用原理及部署方法

热门文章

  1. 轻松应对Java试题,这是一份大数据分析工程师面试指南
  2. “学了半年后,我要揭开Python 3宗罪!”
  3. 一文帮你梳理清楚:奇异值分解和矩阵分解 | 技术头条
  4. 百度开设「黄埔学院」,革新者来
  5. AI一分钟 | 马斯克:特斯拉内部有人故意搞破坏;亚马逊推出酒店定制版Alexa
  6. 首发 | 北京踏歌智行完成Pre-A轮数千万融资,辰韬资本领投
  7. 还在用Logback?Log4j2的异步性能已经无敌了,还不快试试
  8. 一款零注解侵入的 API 文档生成工具,你用过吗?
  9. 为什么建议使用你 LocalDateTime ,而不是 Date?
  10. Spring是如何运用设计模式的?