刚接触,啥子都不会,按着教程走

需求:识别图片中的文字信息

环境:windows系统

开发语言:python3.5

使用工具类:1.pyocr

2.PIL

3.tesseract-ocr

步骤:

1.pyocr

网络通直接使用命令:

pip install pyocr

网络不通,转至https://pypi.python.org/pypi/pyocr/0.4.1下载安装

2.安装pil(一直没安装成功,好像没有对应的3.5的版本,要2.X的才行,不过这个可以跳过,不安装)

网络通直接使用命令:

pip install PIL

网络不通,转至http://www.pythonware.com/products/pil/index.htm下载安装

3.安装tesseract-ocr

exe文件,下载后直接安装,建议默认安装过程中的选项,安装目录默认C:\Program Files

(x86)\Tesseract-OCR

# coding=utf-8

__author__ = ‘yjj‘

#https://github.com/tesseract-ocr

import sys

import importlib

#reload(sys)

importlib.reload(sys);

#sys.setdefaultencoding(‘utf-8‘)

import os;

os.environ[‘NLS_LANG‘] = ‘SIMPLIFIED CHINESE_CHINA.UTF8‘

try:

from pyocr import pyocr

from PIL import Image

except ImportError:

print(‘模块导入错误,请使用pip安装,pytesseract依赖以下库:‘)

print(‘http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil‘)

print(‘http://code.google.com/p/tesseract-ocr/‘)

raise SystemExit

tools = pyocr.get_available_tools()[:]

if len(tools) == 0:

print("No OCR tool found")

sys.exit(1)

print("Using ‘%s‘" % (tools[0].get_name()))

print(tools[0].image_to_string(Image.open(‘D:\\123.png‘),lang=‘eng‘))

print(tools[0].image_to_string(Image.open(‘D:\\3434.png‘),lang=‘chi_sim‘))

#print tools[0].image_to_string(Image.open(‘D:\\3535.png‘),lang=‘chi_sim‘)

文件内容:(把图片放在D盘)

123.png

3434.png

输出:

Using ‘Tesseract (sh)‘

7364

求i只另U眈R第 1代

在整个过程中可能会遇到的问题

1.(有时候重新启动编译软件,错都不算什么了,奇怪的是没有错了,我就是这样)如果控制台直接输出:“No OCR tool found”,说明未成功安装tesseract-ocr,debug查看get_available_tools,在该方法中回去查看本机已经安装有的ocr识别库,有三种,

libtesseract,

tesseract,

cuneiform,

本文使用的是第二种tesseract,

tesseract具体安装请转至。

2.在识别带中文的图片,会遇到报“allow_blob_division”的错误,

需要下载tesseract-ocr的中文库,地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.chi_sim.tar.gz/download,里面包含tesseract多有的文字库,chi_sim.traineddata为简体中文库,将该文件放至C:\Program

Files

(x86)\Tesseract-OCR\tessdata目录下接下来的具体处理方法,转至:https://www.cnblogs.com/syqlp/p/5462459.html

python3 ocr_OCR识别-python3.5版相关推荐

  1. python3web库_基于 Python3 写的极简版 webserver

    基于 Python3 写的极简版 webserver.用于学习 HTTP协议,及 WEB服务器 工作原理.笔者对 WEB服务器 的工作原理理解的比较粗浅,仅是基于个人的理解来写的,存在很多不足和漏洞, ...

  2. ubuntu python3.5升级3.6_ubuntu16.04升级Python3.5到Python3.7

    因为python3.5和python3.6之后的版本差异很大,所有需要改变python的版本 简易安装python后得到的3版本的版本号是python3.5. 可以使用下面的命令查看py版本: pyt ...

  3. python3.9 执行python3.6生成的随机森林模型model.pkl报错,警告版本不一致

    python3.9 执行python3.6生成的随机森林模型model.pkl报错 UserWarning: Trying to unpickle estimator RandomForestClas ...

  4. centos6.5下安装python3安装、python3虚拟环境创建venv

    原因:在安装完centos6.5后,通过命令行键入python时,默认为python2.6.6版本,系统并没有安装python3版本.又想学习python3,因此需要在centos6.5下安装pyth ...

  5. ubuntu python3.5安装_ubuntu16.04升级Python3.5到Python3.7的方法步骤

    ubuntu16.04自带python有两个版本,一个2版本,使用的是python:另一个是3版本,使用的是python3. 简易安装python后得到的3版本的版本号是python3.5. 可以使用 ...

  6. linux卸载python3.6,当python3.6位于/usr/local/bin/python3.6时,如何在ubuntu上卸载它

    所以我默认的python3版本是3.7.5which python3 /usr/bin/python3 现在我的python3.6安装在:which python3.6 /usr/local/bin/ ...

  7. Linux系统安装python3和创建python3虚拟环境

    Python3安装 参考 https://www.cnblogs.com/kimyeee/p/7250560.html 按照步骤安装完成后,进入虚拟环境,pip install xxx ,安装某个第三 ...

  8. python3 exe_Windows10下python3和python2同时安装 python2.exe、python3.exe和pip2、pip3设置

    1.添加python2到系统环境变量 打开,控制面板\系统和安全\系统,选择高级系统设置,环境变量,选择Path,点击编辑,新建,分别添加D:\Python\python27和D:\Python\py ...

  9. python3 -c 和 python3 -m

    python3 -c 和 python3 -m python -m service_manager.sm.sm python3 -c "import app_manager.main as ...

最新文章

  1. 根号三的用计算机怎么表示,计算器根号3怎么打
  2. S5PV210开发 -- I2C 你知道多少?(二)
  3. Live Wallpaper HD for Mac(天气动态壁纸软件)
  4. matlab常用函数——软件常用函数
  5. promtail 配置详解_基于loki+promtail+grafana技术的日志集合
  6. 真的有无人工厂吗,IoT 怎么在产业界落地?| 赠书
  7. linspace函数matlab_Matlab入门2-莫比乌斯环
  8. Doris之Rollup的注意事项和常见问题
  9. 浅谈Peer Review(同行评审)
  10. 国产奶粉争上游,“河北奶王”君乐宝出了一半力
  11. com组件 的劫持_2345.com/365j.com的IE首页劫持手动修复方法+修复工具
  12. 弗兰克赫兹实验matlab画图,物理实验论文
  13. 完美解决鼠标单击变双击问题^_^
  14. 计算机网络学习日记——网络层
  15. 关于Linux运行steam的解决方案
  16. 一篇不大正经的有关素数的小结
  17. VC++ 中主线程等待子线程结束的方法
  18. 人工智能实战2019第七次作业(OpenPAI) 16721088 焦宇恒
  19. DSP/DMP/SSP/RTB概念解释
  20. 游戏 AI 设计之 FSM 有限状态机

热门文章

  1. Oracle物化视图
  2. Redis 命令整理
  3. 2022-2028年中国新能源公交车行业深度调研及投资前景预测报告
  4. Linux内核分析——可执行程序的装载
  5. 神奇的FireFox
  6. ios Develop mark
  7. UNICODE使用的一些知识和技巧
  8. MD5 - Bump Mapping
  9. 《计算机网络应用基础》模拟试卷(六),《计算机与网络应用基础知识1》模拟试卷...
  10. TensorFlow常用操作:代码示例