很多软件内置了OCR功能,即图片提取文字功能。有些是免费提供给大家使用,但有些是收费的。不管是免费的还是收费的,终究逃离不了隐私问题。用别人的OCR,总得把图片传到对方的服务器。今天我们使用Python开发一个OCR软件,如下图所示。

1 安装环境

本文基于PaddleOCR搭建本地开发图片提取文字软件,因此需要安装PaddlePaddle环境。

1.1 安装PaddlePaddle

如果您的机器有安装CUDA9CUDA10,推荐安装GPU版本的PaddlePaddle,享受更快的运行速度。运行以下命令安装:

python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

如果您的机器只有CPU环境,运行速度会稍微慢一点。请运行以下命令安装

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

1.2 安装PaddleOCR whl包

有了PaddlePaddle环境后,接下来安装PaddleOCR库,推荐使用2.0.1+版本:

pip install "paddleocr>=2.0.1"

注意:

对于Windows环境用户:直接通过pip安装的shapely库可能出现[winRrror 126]找不到指定模块的问题。建议从这里https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely下载shapely安装包完成安装。

2 调用OCR

调用OCR过程非常简单,导入PaddleOCR后,直接创建PaddleOCR对象:

from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")
ocr.ocr(img_path, cls=True)

2行代码中,use_angle_cls参数用于确定是否使用角度分类模型,即是否识别垂直方向的文字。lang参数表示识别的语言,我们传入ch,表示识别汉字。

3行代码中, img_path表示图片路径,cls表示是否使用角度分类模型。

3 开发界面

有了以上代码就可以完成OCR功能,但使用起来还不够方便,我们进一步将OCR功能封装成软件,便于交互。首先安装PyQT5:

pip install PyQt5

接下来调用PyQT5完成界面交互,篇幅原因,这里只显示调用ocr部分代码,读者可以直接拉到最后获取完整源码。

class OCRGUI(QWidget):# 其他代码略...def run_ocr(self, img_path):result = self.ocr.ocr(img_path, cls=True)self.text.clear() txts = [line[1][0] for line in result]for txt in txts:self.text.insertPlainText(txt + "\n")self.loading.hide()

4 获取源码

  1. 关注公众号:Python学习实战
  2. 公众号聊天界面回复:OCR,获取完整源码。

如果您觉得本文有帮助,辛苦您点个不需花钱的赞,您的举手之劳将对我提供了无限的写作动力! 也欢迎关注我的公众号:Python学习实战, 第一时间获取最新文章。

【Python案例】OCR提取图片中的文字相关推荐

  1. Python利用OCR提取图片中的文字

    作者:虚坏叔叔 博客:https://xuhss.com 早餐店不会开到晚上,想吃的人早就来了!

  2. python调用qq识别图片文字_Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解...

    百度OCR体验地址: 腾讯OCR体验地址: 测试结果是:腾讯的效果要比百度的好 腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月 百度接口调用之前写过文 ...

  3. python爬虫代码提取图片中的文字_python识别图像并提取文字的实现方法

    前言 python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用. 安装 安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径.环境变量甚至与linux不同的 ...

  4. 基于Tesseract模块Python实现提取图片中的文字信息(安装+使用教程)

    Python实现提取图片中的文字可以使用Optical Character Recognition (OCR) 技术来解决.OCR是指将图像中的文本转换成可编辑的文本的过程.Python有许多OCR库 ...

  5. python实现批量提取图片中文字的小工具

    要实现批量提取图片中的文字,我们可以使用Python的pytesseract和Pillow库.pytesseract是一个OCR(Optical Character Recognition,光学字符识 ...

  6. VBA批量OCR识别提取身份证照片信息_手机扫描仪:直装就是VIP,不限次数,一秒钟就能提取图片中的文字...

    之前神器妹在神器精选公众号分享过v4.4.5修改版以及更老的版本,本次神器妹分享的是最新v4.6.4修改版(11月16日更新):直装就是VIP,不限次数,一秒钟就能提取图片中的文字. 可扫描识别身份证 ...

  7. python文字提取关键信息_Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!...

    用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字.非常方便实用,那么很难实现吗? 利用Python提取图片中的文字信息,只需要一行代码就能搞定! 当然,这是吹牛皮的,但是真正的 ...

  8. Python利用百度AI提取图片中的文字信息

    Python利用百度AI提取图片中的文字信息 安装百度AI : pip install baidu-aip 到https://console.bce.baidu.com/ai/创建文字识别应用,获取A ...

  9. Python,OpenCV提取图片中的多个茄子种子轮廓,并按从左到右排序后显示

    Python,OpenCV提取图片中的多个茄子种子轮廓,并按从左到右排序后显示 1. 效果图 2. 源码 写这篇博客源于博友的提问,期望把下图中的多个茄子种子按从左到右的顺序提取出来: 1. 效果图 ...

  10. 在线工具:电脑怎么提取图片中的文字?图片如何转化为文字?

    电脑怎么提取图片中的文字? 图片记录着我们生活的点点滴滴,比如各种办公截图.查快递单号.布置的课堂作业等等,都离不开这种便捷的方法.而我们有时难免需要从图片中提取想要的文字,总不能就靠打字打到手软吧, ...

最新文章

  1. notepad++ 快捷键
  2. springBoot ajax 报错 Circular view path [xx: would dispatch...
  3. localdatetime获得时间搓_得用户者得天下,一禅小和尚×往事若茶如何获得消费者认同...
  4. 什么是 Web 应用性能评测领域的 RAIL 模型
  5. c++ 数组的输入遇到特定字符停止输入_滑动窗口思维--挑战“无重复字符的最长子串”
  6. 【2006-1】【字符统计】
  7. linux 安装mongodb 64,在CentOS 6.x 64bit上安装MongoDB 3.2社区版
  8. 训练日志 2018.11.7
  9. Linux服务器备份mySQL数据库_远程linux服务器mysql数据库定期备份和删除
  10. 机器狗vs警犬!在波士顿动力面前,真狗只能“战术撤退”
  11. Composer 安装时要求输入授权用户名密码
  12. 如何彻底删除nginx
  13. Java中抽象类和接口的区别 经典(转)
  14. 100个特别的遥感应用和用途
  15. 用python一条命令解决多个ts转换成MP4(就一条),备用两选一
  16. 01-探寻 JavaScript 反爬虫的根本原因
  17. 解决cherry pick提交报错问题
  18. 网易2018校园招聘:重排数列 [python]
  19. 通过命令行清理360安全卫士批处理
  20. typescript Awaited<Type>教程用法

热门文章

  1. Windows10下安装Gromacs2020
  2. 2014联通见习感悟
  3. plus project的mpp文件导出问题和plus project的xml导出
  4. 三基色配色表java_【调色】颜色配色表 适合重彩搭配用
  5. 关于Qt作为第三方库,QGIS二次开发作为第三方库,Qt ui编译的一些问题
  6. Python函数语法里的中括号和逗号是什么意思
  7. Sequence Model-week1编程题2-Character level language model【RNN生成恐龙名 LSTM生成莎士比亚风格文字】...
  8. go包管理之vender机制
  9. (附源码)小程序校园拼车微信小程序 毕业设计 091617
  10. svc预测概率_Kaggle平台Titanic生存率预测项目(TOP3%)