自动识别图片上的文字

  • 1、引言
  • 2、Cnocr
    • 2.1 安装
    • 2.2 代码示例
  • 3、Pytesseract
    • 3.1 安装
    • 3.1 代码示例
  • 4、总结

1、引言

小鱼:小屌丝,你在干啥呢?
小屌丝:我女神给我的任务啊,把图片上的文字都给写下来。
小鱼:这图片上的文字,可不少啊,你都是手敲的??
小屌丝:可不,不然还有啥法子?

小鱼:我敬佩你是一条汉子。
小屌丝:鱼哥,难道你有什么好的法子?
小鱼:嗯,突然想到的, OCR 。
小屌丝:那你还不赶紧救救我,
小鱼:唉~ ~ 好吧…

图像识别,这里就要提到OCR了,
但是提到OCR,又不得不提到的两个库:

  • cnocr :识别图片的汉字;
  • Pytesseract:识别图片的英文

分别对图片的文字的中文和英文进行识别的。
话不多说,我们直接代码示例演示。

2、Cnocr

2.1 安装

老规矩,直接pip 安装

pip install cnocr

其它安装方式,直接看这两篇:

Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!
Python3:我低调的只用一行代码,就导入Python所有库!

提示一下,
cnocr下的torch 有161.8MB,
所以下载的话,最好在网速快或者国内镜像网站进行下载,否则就会下载失败。

2.2 代码示例

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:识别图片中的汉字
'''
from cnocr import CnOcr#图片名称
file_name = './data/cn_name.png'
ocr = CnOcr()
result = ocr.ocr(file_name)
print(f"Predicted Chars:{result}")

3、Pytesseract

3.1 安装

1、pytesseract
老规矩,直接pip 安装

pip install pytesseract

2、Tesseract
Windows版本,需要手动安装,下载地址如下:

  • Tesseract-OCR:https://github.com/tesseract-ocr/tesseract/wiki
    下载完成后,手动添加路径到到环境变量(path)里面即可。

3.1 代码示例

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:识别图片中的英文
'''
import pytesseract
from PIL import Image#图片名称
file_name = './data/en_name.png'
#打开图片
image = Image.open(file_name)result = pytesseract.image_to_string(image, lang='eng')
print(f'识别结果:{result}')

4、总结

看到这里,今天的分享就到这里了。
关于识别图片中的文字,这里例举了OCR中的 cnocr 与pytesseract,
其实代码很简单,只是安装过程中需要一点点的耐心。

我是小鱼:

  • CSDN博客专家
  • 51Testing认证讲师
  • 金牌面试官
  • 商务合作|面试培训|职场规划,可以扫码咨询

关注我,带你学习Python领域更多更专业的技能。

Python3,自动识别图片文字,这个库,我爱了。相关推荐

  1. Python3识别图片文字

    Python3识别图片文字 一.Pillow, pytesseract库的安装(Python 3.5) PIL全称:Python Imaging Library,python图像处理库,这个库支持多种 ...

  2. python3 识别图片文字

    1.下载相关组件 安装:pip install Pillow 或下载:https://pypi.org/project/Pillow/5.2.0/  ,https://pypi.org/project ...

  3. 利用Python实现自动识别图片文字 -- OCR

    文章目录 什么是OCR? 安装Tesseract-OCR和pytesseract 实现自动识别文字 什么是OCR? OCR,全称Optical Character Recognition ,中文释义为 ...

  4. Python 自动识别图片文字—OCR实战教程

    OCR 是光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程. 很早之前就有同学在公众号后台回复 ...

  5. 有没有识别图片文字的软件?这几款就很不错

    在工作中,我们时常需要使用打印机扫描一些文件资料,帮助我们快速提取资料中的文本内容,但当我们遇到文件是以图片形式提交时怎么办呢?可以用什么软件来提取图片中的文字呢?很简单!用识别软件来帮助我们提取图片 ...

  6. python读取图片文字-Python3实现获取图片文字里中文的方法分析

    本文实例讲述了Python3实现获取图片文字里中文的方法.分享给大家供大家参考,具体如下: 一.运行环境 (1) win10 (2) pycharm (3) python 3.5 (4) pillow ...

  7. Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

    文章目录 Python3 图片文字识别翻译--调用百度AI.百度翻译和有道翻译的API 一.演示 二. API准备 三. 图片文字识别--调用百度AI文字识别API 四. 文字翻译 1. 百度翻译 请 ...

  8. 图像处理---《在图片上打印文字 FreeType库》

    图像处理---<在图片上打印文字 FreeType库> 目的:想在处理之后的图像上打印输出结果. 方法: (1)只在图像上打印 数字.字母的话:                 1.Mat ...

  9. Python3一行代码实现图片文字识别

    今天突发奇想,想用Python识别图片里的文字.没想到Python实现图片文字识别这么简单,只需要一行代码就能搞定 from PIL import Image import pytesseract # ...

最新文章

  1. 《微生物学报》“微生物大数据资源”专刊邀稿函
  2. ios 系统状态栏样式修改_iOS设置状态栏样式,statusBarStyle
  3. mysql兼容性高吗_MySQL与标准的兼容性
  4. 游戏场景中的建筑设计,专访暴雪娱乐首席美术师 PhilipKlevestav
  5. 怎么调试内存溢出的c++代码_【C/C++】内存对齐 到底怎么回事?
  6. [css] 使用css实现对话气泡的效果
  7. 第一部分 走进Java
  8. 搜索了一下电脑上编程相关的 pdf, 看有你需要的吗?
  9. RSAES-OAEP 和 RSAES-PKCS1-v1_5 和 RSASSA-PSS 和 RSASSA-PKCS1-v1_5
  10. 构建插件式的应用程序框架(四)----服务容器(ZT)
  11. 四种常见的颜色模式及各自的特点?
  12. Linux kernel ‘aac_send_raw_srb’函数输入验证漏洞
  13. qt 3d迷宫游戏_鲨话游戏史FPS游戏竟然40年前就有了?暴露年龄系列,慎入!
  14. 有谁知道iphone XR的“R”到底是什么意思?答案可能会让你们无奈
  15. 使用Ambari快速部署Hadoop大数据环境
  16. OneDrive配合OneIndex搭建自用网盘
  17. 第七章、绘制3D图表和统计地图
  18. BH1750FVI调试
  19. soot中存在的主要对象、soot的执行流
  20. mysql分组之后再求和

热门文章

  1. 运用计算机思维可以解决什么问题,计算机思维是能否解决生活中遇到的难题?...
  2. Au入门系列之十:母带处理
  3. 【Linux39-9】k8s存储之卷(volumes)、挂载不同类型的卷(emptyDir、hostpath、nfs)
  4. PHP Warning: file_put_contents(..):failed to open stream: Permission denied in...
  5. backurl: heytapbrowser://main/iflow?sub_target=only_enter_iflow
  6. 小试牛刀—猜数字游戏
  7. 思科高级配置(配置标准ACL)
  8. 项目管理标杆和先驱——华为管理体系(PMP),一文看懂!
  9. ai字体行间距怎么调整_ai怎么调整文字间距- ai调整行间距的详细教程
  10. 【Verilog语法1】加载存储器$readmemh和$readmemb函数的使用