Python Easyocr 图片文字识别

前段时间做了车牌识别相关的内容分享,参看:

车牌识别(1)-车牌数据集生成

车牌识别(2)-搭建车牌识别模型

今天给大家分享一个简单的OCR文本识别工具:easyocr。这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。当然这个模块适当改进也可以用以车牌识别

1.安装

pip install easyocr -i https://pypi.tuna.tsinghua.edu.cn/simple

它会安装除了模型文件之外的所有依赖,模型文件则会在运行代码的时候下载。

在pytorch网站上,请确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。

我的电脑没安装gpu版本的pytorch,所以运行比较慢。

2.使用教程

import easyocrreader = easyocr.Reader(['ch_sim']) # ch_sim是Chinese simplified简写result = reader.readtext('1.jpg')print(result)

运行的过程中会安装所需要的模型文件,像下面这样:

由于它的下载速度非常慢,而且经常会失败,因此建议先下载好模型文件,再将其放置到所需要的位置:

文字检测模型(CRAFT)(必须)https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip
中文(简体)模型(识别中文必须)https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip
中国(传统)模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip
拉丁模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip
日本模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip
韩文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip
泰文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip
阿拉伯文模型https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip

如果下载速度太慢,请在公众号后台回复:easyocr(明天再试下载,今晚还没传输到网盘),下载文字检测模型(CRAFT)和中文简体模型文件包。

下载完模型后,将文件放到下面这个位置。

​​​​​​​

Windows:C:\Users\用户名\.EasyOCR\modelLinux:~/ .EasyOCR / model

如下图所示:

重新执行脚本不会再提醒下载模型了,随便找的一个图片如下:

识别结果如下:

[([[60, 308], [745, 308], [745, 447], [60, 447]], '文字识别提取', 0.9516711235046387), ([[77, 471], [725, 471], [725, 535], [77, 535]], '支持识别英法韩日俄德西葡语', 0.7867767214775085)]

输出采用列表格式,每个list分别表示对应文字的边界框、识别文本结果和置信度。

对于多语种的情况:

import easyocrreader = easyocr.Reader(['ch_sim', 'en'])result = reader.readtext('chEN.jpg')print(result)

效果如下:

总体效果还算不错,感兴趣的朋友可以试下车牌识别的效果,以及思考下如何改进车牌识别效果

2021-02-21 Python Easyocr 图片文字识别相关推荐

  1. python批量图片文字识别_利用Python批量进行图片文字识别

    实现逻辑 1. 批量获取图片的路径 2. 通过调用百度OCR接口批量识别图片 3. 将返回值写入txt 实现过程 1. 安装百度的Python SDK pip install baidu-aip 2. ...

  2. Python进行图片文字识别(表格图片)(使用阿里OCR接口)

    使用阿里OCR接口进行图片识别 这里仅做代码的记录,用于后续的快速工作.不会进行太多代码的讲解,如果你也刚好需要的话,还需要结合阿里的OCR文档,会更快速. 阿里OCR链接:https://dugua ...

  3. Python简易图片文字识别

    完整代码如下: from PIL import Image # 加载PIL模块中的Image模组 import pytesseract # 加载pytesseract模块 img=Image.open ...

  4. python 离线图片文字识别(OCR)Tesseract

    本人最近也是在使用和学习python遇到各种问题,公司内网控制严格 没有网络,同时也不允许安装exe文件,做python 十分的费劲,也研究了好几款文字识别的OCR ,要么是收费的 要么是离线不能用, ...

  5. 【小沐学NLP】Python实现图片文字识别

  6. Python3一行代码实现图片文字识别

    今天突发奇想,想用Python识别图片里的文字.没想到Python实现图片文字识别这么简单,只需要一行代码就能搞定 from PIL import Image import pytesseract # ...

  7. Python模块介绍使用:EasyOCR快速实现图片文字识别

    hello,大家好,我是wangzirui32,今天我们来学习如何使用EasyOCR快速实现图片文字识别,开始学习吧! 1. 什么是OCR 2. 安装EasyOCR 安装命令: pip install ...

  8. Python图片文字识别——Windows下Tesseract-OCR的安装与使用

    Python图片文字识别--Windows下Tesseract-OCR的安装与使用 前言 Windows下Tesseract-OCR的安装与配置 Tesseract-OCR简介与版本选择 tesser ...

  9. python调用百度接口实现ocr识别_Python调用百度OCR实现图片文字识别的示例代码

    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '* ...

最新文章

  1. java关键字的用法_JAVA常用关键字及其用法简要说明
  2. html太极图代码静态_如何做URL静态化?和页面的静态化
  3. CSS清除浮动常用方法小结
  4. PYPL 二月榜单发布:最受欢迎的编程语言、IDE 和数据库都是哪些
  5. LiveVideoStack线上分享第四季(五):基于Airflow的视频编码平台
  6. java 获取光标_如何在java中使用Windows API获取当前鼠标光标类型?
  7. IOS开发基础之微博项目第1天-OC版
  8. AngularJs学习笔记--Modules
  9. 华为内部存储转sd卡_华为tit al00怎么将手机存储内容转移到sd卡
  10. Android修改kernel logo和开机动画(android)
  11. matlab 固态 机械_固态硬盘无法识别或数据删除还能恢复数据吗?
  12. 搜狗双拼--提升打字效率
  13. matlab 去除图片坐标值和白边,并用saveas函数按需要分辨率(尺寸)保存
  14. 即将创业的我转发一篇鸡汤文---采访了 10 位身价过亿的 CEO,我终于看懂了有钱人的“奋斗”
  15. 用Python实现中文编程
  16. 技术人如何打造个人品牌?
  17. 2018-8-10-win10-uwp-读取保存WriteableBitmap-、BitmapImage
  18. sicily 1007. To and Fro(破译密码)
  19. 跟i9处理器差不多的服务器芯片,AMD下一代服务器处理器代号“星河舰队”
  20. Monkey的测试原理和方法

热门文章

  1. tableau实战系列(六)-小面积图表如何完整显示标签
  2. 滴滴出行2020数据分析面试题
  3. dapper mysql 批量_MySQL数据库之c#mysql批量更新的两种方法
  4. 知识点讲解四:栈溢出(stack overflow)问题解决方案
  5. Python编程基础:第三十九节 面向对象编程Object Oriented Programming
  6. 第7章 PCA与梯度上升法
  7. 史上最全的MySQL高性能优化实战总结!
  8. API Gateways – An Evaluation of Zuul 2
  9. spring mvc DispatcherServlet详解之二---request通过Controller获取ModelAndView过程
  10. C语言中extern的用法--转