1. 基本环境

操作系统:win7 64位系统

python版本:3.6

2.安装配套环境

(1)首先安装OCR字符识别库Tesseract    下载网址:https://digi.bib.uni-mannheim.de/tesseract/

下载下图对应的版本

下载后双击进行安装,这里因为我们要识别中文字符,所以在安装界面中需要进行额外的语言勾选,展开Additional language data

然后按照下图进行勾选

然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径)。我的路径为:

D:\toolplace\OCR\Tesseract-OCR

接下来配置环境变量。

通过控制面板找到环境变量配置界面如下(找不到环境变量配置的自行百度):

分别对用户变量PATH和系统变量Path添加刚才的安装目录  D:\toolplace\OCR\Tesseract-OCR;         这里注意各个变量之间隔开用英文的分号。

环境变量修改好之后验证下是否安装成功。打开cmd命令行工具   敲入命令:

Tesseract -v

出来如下界面说明成功

(2)安装python环境

pip install Pillow==5.2.0
pip install pytesseract==0.2.4

3.测试

编写python脚本

#!/usr/bin/env python3
# -*- coding: utf-8 -*-import pytesseract
from PIL import Image# open image
image = Image.open('2.jpg')
code = pytesseract.image_to_string(image, lang='chi_sim')
print(code)

这里通过读入图像2.jpg   然后实现对图像中的文字进行识别。效果图如下:

应该说整个识别效果对于规范化的(包括打印扫描)的中文识别还是不错的(一种方便的应用场景就是先用手机拍照然后qq截图再进行识别,可以省去重复敲入大量文字的工作)

我后来尝试了手写体识别,对于手写体来说识别效果还有待改进。

完整的测试脚本以及配套的安装包可以从下面的地址进行下载:

https://download.csdn.net/download/qianbin3200896/10694840

简单实用的基于python的OCR中文字符识别——基于windows平台(附代码)相关推荐

  1. 《 Python程序设计项目案例》— (期末大作业、课程设计、毕业设计)基于Python与Django的职工健康档案管理系统设计(附代码)

    基于Python与Django的职工健康档案管理系统的设计与实现 本文对基于Python与Django的职工健康档案管理系统的开发做了简单的介绍:项目的概述.项目整体的框架结构.项目部分的组成设计.项 ...

  2. python如何ocr_基于Python的OCR实现示例

    摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...

  3. python实现ocr识别算法_基于Python的OCR实现示例

    摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...

  4. python structure_GitHub - CYZYZG/Data_Structure_with_Python: 这是我在学习《基于Python的数据结构》的时候的笔记与代码...

    Data_Structure_with_Python 这是我在学习<基于Python的数据结构>的时候的笔记与代码 主要参考:数据结构与算法(Python) 对于算法的时间效率,我们可以用 ...

  5. python cmd 窗口 中文乱码 解决方法 (附:打印不同颜色)

    python cmd 窗口 中文乱码 解决方法 (附:打印不同颜色) 参考文章: (1)python cmd 窗口 中文乱码 解决方法 (附:打印不同颜色) (2)https://www.cnblog ...

  6. python点名代码_基于python tkinter的点名小程序功能的实例代码

    基于python tkinter的点名小程序功能的实例代码,花名册,次数,窗口,未找到,初始化 基于python tkinter的点名小程序功能的实例代码 易采站长站,站长之家为您整理了基于pytho ...

  7. 基于python的土壤细菌在kobas库的功能预测代码

    以下是一个基于Python的土壤细菌在KOBAS库的功能预测代码.在运行之前,需要先安装相关的Python库,如biopython.pandas.numpy.matplotlib等. # 导入必要的库 ...

  8. 基于python的全部开源的快速开发平台

    真正的大师,永远都怀着一颗学徒的心! 一.项目简介 今天说的这个软件是一款基于python的全部开源的快速开发平台. 二.实现功能 系统管理 菜单管理 部门管理 角色管理 用户管理 常规配置 字典管理 ...

  9. 基于python的九轴惯性传感器的数据预处理代码-中值滤波实验

    ** 基于python的九轴惯性传感器的数据预处理代码-中值滤波实验 ** import random import numpy as np import pandas as pd import sc ...

最新文章

  1. 基于CSDN完成TEASOFT的MOOC编辑整理
  2. HashMap中的hash函数
  3. centos7 安装 openssl
  4. 转 ios 里如何判断当前应用的定位服务是否可用
  5. 事务日志已满,原因为“ACTIVE_TRANSACTION”
  6. linux 批量同步,多主机目录到备份服务器批量同步脚本
  7. gtk linux 升级_Linux包系列的知识(附:Ubuntu16.04升级到18.04的案例)
  8. jQuery 引用地址{包括jquery和google提供的地址}, 节省你不必要的流量
  9. JVM初学之JVM的运行时数据区
  10. python操作mysql,增,删,改,查
  11. 英语计算机班,15计算机班英语第二次月考测试卷(2017).docx
  12. layui获取select 文本_小程序富文本编辑器editor初体验
  13. 企业大数据分析平台如何构建
  14. CCNP的实验设备注意事项
  15. 多年前的csdn账号找回啦
  16. 随机微分方程与 Ito Lemma 的关系
  17. Android studio百度地图之定位到国外
  18. 华为p8 root android6,华为P8root工具
  19. python 头条 上传_基于Python的免费新闻头条接口查询
  20. canon老的一体机在win10上无法直接安装成功

热门文章

  1. EMC设计中的”猪尾巴效应“
  2. Geoserver基础配图研究
  3. 利用Shape Context进行形状识别
  4. 网络安全等级保护测评高风险判定-安全通信网络
  5. 面试准备-根据自己简历
  6. Java核心技术36讲 第一讲:Java平台的理解
  7. .Net精美书籍大检阅(转载newsmth)
  8. 时间管理(番茄时钟工作法)
  9. 安卓开发Android studio学习笔记12:读取解析XML(案例演示)
  10. Deepfake版阿汤哥,在海外版抖音上收获了32万粉丝