python3 ocr_OCR识别-python3.5版
刚接触,啥子都不会,按着教程走
需求:识别图片中的文字信息
环境:windows系统
开发语言:python3.5
使用工具类:1.pyocr
2.PIL
3.tesseract-ocr
步骤:
1.pyocr
网络通直接使用命令:
pip install pyocr
网络不通,转至https://pypi.python.org/pypi/pyocr/0.4.1下载安装
2.安装pil(一直没安装成功,好像没有对应的3.5的版本,要2.X的才行,不过这个可以跳过,不安装)
网络通直接使用命令:
pip install PIL
网络不通,转至http://www.pythonware.com/products/pil/index.htm下载安装
3.安装tesseract-ocr
exe文件,下载后直接安装,建议默认安装过程中的选项,安装目录默认C:\Program Files
(x86)\Tesseract-OCR
# coding=utf-8
__author__ = ‘yjj‘
#https://github.com/tesseract-ocr
import sys
import importlib
#reload(sys)
importlib.reload(sys);
#sys.setdefaultencoding(‘utf-8‘)
import os;
os.environ[‘NLS_LANG‘] = ‘SIMPLIFIED CHINESE_CHINA.UTF8‘
try:
from pyocr import pyocr
from PIL import Image
except ImportError:
print(‘模块导入错误,请使用pip安装,pytesseract依赖以下库:‘)
print(‘http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil‘)
print(‘http://code.google.com/p/tesseract-ocr/‘)
raise SystemExit
tools = pyocr.get_available_tools()[:]
if len(tools) == 0:
print("No OCR tool found")
sys.exit(1)
print("Using ‘%s‘" % (tools[0].get_name()))
print(tools[0].image_to_string(Image.open(‘D:\\123.png‘),lang=‘eng‘))
print(tools[0].image_to_string(Image.open(‘D:\\3434.png‘),lang=‘chi_sim‘))
#print tools[0].image_to_string(Image.open(‘D:\\3535.png‘),lang=‘chi_sim‘)
文件内容:(把图片放在D盘)
123.png
3434.png
输出:
Using ‘Tesseract (sh)‘
7364
求i只另U眈R第 1代
在整个过程中可能会遇到的问题
1.(有时候重新启动编译软件,错都不算什么了,奇怪的是没有错了,我就是这样)如果控制台直接输出:“No OCR tool found”,说明未成功安装tesseract-ocr,debug查看get_available_tools,在该方法中回去查看本机已经安装有的ocr识别库,有三种,
libtesseract,
tesseract,
cuneiform,
本文使用的是第二种tesseract,
tesseract具体安装请转至。
2.在识别带中文的图片,会遇到报“allow_blob_division”的错误,
需要下载tesseract-ocr的中文库,地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.chi_sim.tar.gz/download,里面包含tesseract多有的文字库,chi_sim.traineddata为简体中文库,将该文件放至C:\Program
Files
(x86)\Tesseract-OCR\tessdata目录下接下来的具体处理方法,转至:https://www.cnblogs.com/syqlp/p/5462459.html
python3 ocr_OCR识别-python3.5版相关推荐
- python3web库_基于 Python3 写的极简版 webserver
基于 Python3 写的极简版 webserver.用于学习 HTTP协议,及 WEB服务器 工作原理.笔者对 WEB服务器 的工作原理理解的比较粗浅,仅是基于个人的理解来写的,存在很多不足和漏洞, ...
- ubuntu python3.5升级3.6_ubuntu16.04升级Python3.5到Python3.7
因为python3.5和python3.6之后的版本差异很大,所有需要改变python的版本 简易安装python后得到的3版本的版本号是python3.5. 可以使用下面的命令查看py版本: pyt ...
- python3.9 执行python3.6生成的随机森林模型model.pkl报错,警告版本不一致
python3.9 执行python3.6生成的随机森林模型model.pkl报错 UserWarning: Trying to unpickle estimator RandomForestClas ...
- centos6.5下安装python3安装、python3虚拟环境创建venv
原因:在安装完centos6.5后,通过命令行键入python时,默认为python2.6.6版本,系统并没有安装python3版本.又想学习python3,因此需要在centos6.5下安装pyth ...
- ubuntu python3.5安装_ubuntu16.04升级Python3.5到Python3.7的方法步骤
ubuntu16.04自带python有两个版本,一个2版本,使用的是python:另一个是3版本,使用的是python3. 简易安装python后得到的3版本的版本号是python3.5. 可以使用 ...
- linux卸载python3.6,当python3.6位于/usr/local/bin/python3.6时,如何在ubuntu上卸载它
所以我默认的python3版本是3.7.5which python3 /usr/bin/python3 现在我的python3.6安装在:which python3.6 /usr/local/bin/ ...
- Linux系统安装python3和创建python3虚拟环境
Python3安装 参考 https://www.cnblogs.com/kimyeee/p/7250560.html 按照步骤安装完成后,进入虚拟环境,pip install xxx ,安装某个第三 ...
- python3 exe_Windows10下python3和python2同时安装 python2.exe、python3.exe和pip2、pip3设置
1.添加python2到系统环境变量 打开,控制面板\系统和安全\系统,选择高级系统设置,环境变量,选择Path,点击编辑,新建,分别添加D:\Python\python27和D:\Python\py ...
- python3 -c 和 python3 -m
python3 -c 和 python3 -m python -m service_manager.sm.sm python3 -c "import app_manager.main as ...
最新文章
- 根号三的用计算机怎么表示,计算器根号3怎么打
- S5PV210开发 -- I2C 你知道多少?(二)
- Live Wallpaper HD for Mac(天气动态壁纸软件)
- matlab常用函数——软件常用函数
- promtail 配置详解_基于loki+promtail+grafana技术的日志集合
- 真的有无人工厂吗,IoT 怎么在产业界落地?| 赠书
- linspace函数matlab_Matlab入门2-莫比乌斯环
- Doris之Rollup的注意事项和常见问题
- 浅谈Peer Review(同行评审)
- 国产奶粉争上游,“河北奶王”君乐宝出了一半力
- com组件 的劫持_2345.com/365j.com的IE首页劫持手动修复方法+修复工具
- 弗兰克赫兹实验matlab画图,物理实验论文
- 完美解决鼠标单击变双击问题^_^
- 计算机网络学习日记——网络层
- 关于Linux运行steam的解决方案
- 一篇不大正经的有关素数的小结
- VC++ 中主线程等待子线程结束的方法
- 人工智能实战2019第七次作业(OpenPAI) 16721088 焦宇恒
- DSP/DMP/SSP/RTB概念解释
- 游戏 AI 设计之 FSM 有限状态机