【python文字识别OCR】
问题
python实现文字识别
方法
tesseract-OCR方法,没有环境限制,pytorch还是tensorflow都可以用
步骤
1. 下载 tesseract-ocr 的exe文件
文件名称:tesseract-ocr-w64-setup-v4.1.0.20190314.exe(根据自己电脑位数下载)
链接:https://digi.bib.uni-mannheim.de/tesseract/
2. 双击安装 tesseract-ocr.exe 文件
中途安装需要在select components时,add language (最后一行小加号)中选中所有Chinese开头的四个中文包,然后一直点击确认安装
3. 安装需要的包
在python环境中安装两个包:
pip install pytesseract
pip install Pillow
4.识别代码
import pytesseract as pt
from PIL import Image
'''识别中文的代码
'''
# 刚才安装tesseract-ocr的tesseract.exe的路径
path = r'~/Tesseract-OCR/tesseract.exe'
pt.pytesseract.tesseract_cmd = path
img = Image.open('9999.png')
text = pt.image_to_string(img, lang='chi_sim').strip()
print(text)# ===================================================
'''识别英文的代码
'''
path = r'~/Tesseract-OCR/tesseract.exe'
pt.pytesseract.tesseract_cmd = path
img = Image.open('.png')
text = pt.image_to_string(img)
print(text)
注意:
- 中文识别的时候报错,可以替换 Tesseract-OCR/tessdata 中chi_sim.traineddata(中文识别包)
- tesseract方法对图像像素要求高,也就说图像像素点越多,识别准确率越高
【python文字识别OCR】相关推荐
- python实现文字识别软件_文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别...
文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别 发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...
- 如何使用Python实现图像文字识别OCR
要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...
- python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
- 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR
作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...
- 轻量级图片文字识别 OCR Paddle 使用说明
百度轻量级 图片文字识别OCR 1.原文链接:https://www.paddlepaddle.org.cn/hub/scene/ocr 2.快速安装 https://github.com/P ...
- 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...
- Python文字识别之tesseract-ocr和EasyOCR
Python文字识别之tesseract-ocr和EasyOCR 本文主要是将手机拍摄的图片文字通过Python OCR转换成Word文件,并尝试通过tesseract-ocr和EasyOCR两种方式 ...
- 通用文字识别 OCR 等免费 API 大全分享
智能识别 OCR 类 API 通用文字识别OCR:多场景.多语种.高精度的整图文字检测和识别服务,多项指标行业领先,可识别中.英.日.韩.法.德多种语言. 二维码识别OCR:对图片中的二维码.条形码进 ...
- halcon ocr 生成样本变体_Halcon简单文字识别OCR的使用
重要:本文最后更新于2019-10-18 08:49:28,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 突然想起网上有很多打码挣钱的活动,于是灵光一闪,用C#搞个自动识别验证码的 ...
最新文章
- Maven 的dependency 的 classifier的作用
- linux ora01075,操作系统时间被修改导致ORA-01075和ORA-00600[2252]
- 计算机无法上网的软件故障,解决你99%无法联网问题,高手教你只用1招轻松搞定...
- 关于xinetd报错
- 计算机排名考研,计算机考研学校排名
- 新荣耀员工现金补偿最高可拿 N+5;天津立法禁止采集人脸识别信息;IntelliJ IDEA 新版发布|极客头条...
- unity player 显示播放错误时的解决办法
- Android显示PDF文件之PDFviewer
- DirectX 9 游戏汉化详解
- Linux常用命令(四)
- CentOS7.5下载及安装过程
- html 通过name选择器,用name方式获得选择器总结
- 华为手机助手 android,华为手机助手(安卓版)
- 怎么去搭建聚合支付系统比较划算
- 新闻发布管理系统/新闻网站
- pcb 布线电容 影响延时--信号跨分割
- 汽车SoC安全故障的自动识别(下):案例展示和指标分析
- 无法卸载 LiveUpdate Notice 的问题
- 谷歌54亿收购Mandiant:提高自身谷歌云竞争性
- Linux IPC 进程间通信——消息队列message