一、前言

不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制。或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存。但是当我们想用到里面的文字时,还是要一个字一个字打出来。那么我们能不能直接识别图片中的文字呢?答案是肯定的。

二、Tesseract

文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别。Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别。但是在此之前我们需要完成一个繁琐的工作。

(1)Tesseract的安装及配置

有很多版本供大家选择,大家可以根据自己的需求选择。其中w32表示32位系统,w64表示64位系统,大家选择合适的版本即可,可能下载速度比较慢,大家可以选择链接:https://pan.baidu.com/s/1YQCMnx-wCeNrJEE3wcEnQA 提取码:rbc6下载。安装时我们需要知道我们安装的位置,将安装目录配置到系统path变量当中,我们路径是D:\CodeField\Tesseract-OCR。

我们右击我的电脑/此电脑->属性->高级系统设置->环境变量->Path->编辑->新建然后将我们的路径复制进去即可。添加好系统变量后后我们还需要依次点确定,这样才算配置好了。

(2)下载语言包

Tesseract默认是不支持中文的,如果想要识别中文或者其它语言需要下载相应的语言包,下载地址如下: https://tesseract-ocr.github.io/tessdoc/Data-Files ,进入网站后我们往下翻:

其中有两个中文语言包,一个Chinese-Simplified和Chinese-Traditional,它们分别是简体中文和繁体中文,我们选择需要的下载即可。下载完成后我们需要放到Tesseract的路径下的tessdata目录下,我们路径是D:\CodeField\Tesseract-OCR\tessdata。

(3)其它模块下载

除了上面的步骤,我们还需要下载两个模块:

pip install pytesseract

pip install pillow

第一个是用于文字识别的,第二个是用于图片读取的。接下来我们就可以进行文字识别了。

三、文字识别

(1)单张图片识别

接下来的操作就要简单的多,下面是我们要识别的图片:

接下来就是我们文字识别的代码:

import pytesseract

from PIL import Image

# 读取图片

im = Image.open('sentence.jpg')

# 识别文字

string = pytesseract.image_to_string(im)

print(string)

识别结果如下:

Do not go gentle into that good night!

因为默认是支持英文的,所以我们可以直接识别,但是当我们要识别中文或其它语言时就需要做些修改:

import pytesseract

from PIL import Image

# 读取图片

im = Image.open('sentence.png')

# 识别文字,并指定语言

string = pytesseract.image_to_string(im, lang='chi_sim')

print(string)

在识别时,我们设置lang='chi_sim',也就是把语言设置为简体中文,只有当你的tessdata目录下有简体中文包该设置才会生效。下面是我们用来识别的图片:

识别结果如下:

不 要 温 顺 的 走 进 那 个 良 夜

图片内容被准确识别出来了。有一点我们需要知道,在我们将语言设置为简体中文或其它语言后,Tesseract还是可以识别出英文字符。

(2)批量图片识别

既然我们把单张图片识别列出来了,就肯定还有批量图片识别这个功能,这就需要我们准备一个txt文件了,比如我有text.txt文件,内容如下:

sentence1.jpg

sentence2.jpg

我们将代码修改为如下:

import pytesseract

# 识别文字

string = pytesseract.image_to_string('text.txt', lang='chi_sim')

print(string)

但是这样自己写一个txt文件难免有些麻烦,因此我们又可以进行如下修改:

import os

import pytesseract

# 文字图片的路径

path = 'text_img/'

# 获取图片路径列表

imgs = [path + i for i in os.listdir(path)]

# 打开文件

f = open('text.txt', 'w+', encoding='utf-8')

# 将各个图片的路径写入text.txt文件当中

for img in imgs:

f.write(img + '\n')

# 关闭文件

f.close()

# 文字识别

string = pytesseract.image_to_string('text.txt', lang='chi_sim')

print(string)

这样我们只需要传入一个文字图片的根目录就可以批量进行识别了。在测试过程中发现,Tesseract对手写体、行楷等飘逸的字体识别不准确,对一些复杂的字识别也有待提升。但是宋体、印刷体等笔画严谨的字体识别准确率很高。另外如果图片的倾斜大于一定的角度,识别结果也会有很大差别。

总结

到此这篇关于如何利用Python识别图片中文字的文章就介绍到这了,更多相关Python识别图片中文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

python识别图片文字_如何利用Python识别图片中的文字相关推荐

  1. python提取视频字幕_荐利用Python提取视频中的字幕(文字识别)

    学了好久机器学习的内容有些许枯燥,今天我们来做一个Python的小项目来玩耍吧! 项目背景 通过获取百度API实现视频文字识别. 需求阐述 将.MP4格式视频裁剪成一帧一帧的图片再将图片中的字幕摘取出 ...

  2. python爬虫微信朋友圈怎么发文字_如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

    今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...

  3. 如何用python进行相关性分析_如何利用python进行时间序列分析

    题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家分享下.在此也要特别 ...

  4. 利用python查询电脑配置_干货|利用Python将地址转换为经纬度坐标

    本文主要讲述利用Python将文本格式的地址转换为数字格式的经纬度坐标数据,主要步骤有: 注册高德地图API账号,申请Web服务的Key 了解并测试地理编码API服务 利用Python实现地址转坐标 ...

  5. python编程应用中级_如何利用Python辅助开发HSK中级课程-数据统计篇

    HSK中级(4级)课程的开发难度比1-3级大上许多.原因主要有:生词量翻倍:3级是300个新增词,4级是600个新增词(脑容量明显不够了) 语法数量猛增:3级的语法数量在50左右,而4级的语法数量,基 ...

  6. python进行词频统计_如何利用Python进行文本词频统计

    欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 问题描述 Python在自然语言处理这个方面,有其天然的优势: ...

  7. python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  8. 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?

    https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...

  9. python计算圆周率近似值_怎样利用python来计算出圆周率π-百度经验

    怎样利用python来计算出圆周率π? 方法/步骤 1 圆周率π是一个无理数,没有任何一个精确公式可以计算出π值,π的计算只能采用近似算法. 我们利用蒙特卡洛方法来求得π的近似值. 蒙特卡洛方法是利用 ...

最新文章

  1. C++ 数据类型转换
  2. Ubuntu12.04安装Mac OSX Yosemite
  3. SSIS教程SQlServer2008R2 (5) 添加错误流重定向
  4. boost::units::information相关的测试程序
  5. STL 之swap, iter_swap, swap_ranges
  6. re:Invent大会第十年,亚马逊云科技推出了哪些底层自研技术
  7. mysql账户最小授权_mysql 创建帐号并授权
  8. YouTube架构学习
  9. Alien Skin Exposure X7调色滤镜插件,RAW后期处理工具
  10. 一人行,必有我师焉 2020.11.22日记
  11. swift 使用Moya进行网络请求
  12. python计算天数包含几周_如何在python中计算几周内两个日期之间的差异
  13. ps4jump大乱斗服务器维护,Jump大乱斗新人实用技巧分享 新手注意事项介绍
  14. C 语言 随机prim算法 生成迷宫
  15. java 必须是数字_[Java教程]限制只能输入数字
  16. 会声会影 我们后惠无期
  17. 假如开源项目创始人去世了,项目怎么办? - 知乎精华
  18. 导航栏个人中心增加宽度RiProV2主题美化日主题美化Ritheme主题美化
  19. 库卡工业机器人负载曲线图_库卡工业机器人的变量运用简述
  20. android 智能电视视频播放器UDP通信

热门文章

  1. bim学习—— 第2章 Revit的基础操作
  2. 全民农场服务器维护,全民农场1月22日更新了什么_全民农场1月22日更新维护内容介绍_游戏堡...
  3. 工匠精神是什么???
  4. 工程预算成本测算思路,造价人必备
  5. matlab内置函数simplify使用方法
  6. 迎接物联网时代!先看这8个重要提示
  7. 计算机路由器的配置文件,如何将网件netgear路由器的配置文件备份到电脑
  8. Eviews基于多元回归模型OLS的CPI影响因素分析
  9. scp命令获取远程文件
  10. python---算法之二分法