问题

python实现文字识别

方法

tesseract-OCR方法,没有环境限制,pytorch还是tensorflow都可以用

步骤

1. 下载 tesseract-ocr 的exe文件

文件名称:tesseract-ocr-w64-setup-v4.1.0.20190314.exe(根据自己电脑位数下载)
链接:https://digi.bib.uni-mannheim.de/tesseract/

2. 双击安装 tesseract-ocr.exe 文件

中途安装需要在select components时,add language (最后一行小加号)中选中所有Chinese开头的四个中文包,然后一直点击确认安装

3. 安装需要的包

在python环境中安装两个包:
pip install pytesseract
pip install Pillow

4.识别代码

import pytesseract as pt
from PIL import Image
'''识别中文的代码
'''
# 刚才安装tesseract-ocr的tesseract.exe的路径
path = r'~/Tesseract-OCR/tesseract.exe'
pt.pytesseract.tesseract_cmd = path
img = Image.open('9999.png')
text = pt.image_to_string(img, lang='chi_sim').strip()
print(text)# ===================================================
'''识别英文的代码
'''
path = r'~/Tesseract-OCR/tesseract.exe'
pt.pytesseract.tesseract_cmd = path
img = Image.open('.png')
text = pt.image_to_string(img)
print(text)

注意:

  • 中文识别的时候报错,可以替换 Tesseract-OCR/tessdata 中chi_sim.traineddata(中文识别包)
  • tesseract方法对图像像素要求高,也就说图像像素点越多,识别准确率越高

【python文字识别OCR】相关推荐

  1. python实现文字识别软件_文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别...

    文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别 发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...

  2. 如何使用Python实现图像文字识别OCR

    要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...

  3. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  4. 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR

    作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...

  5. 轻量级图片文字识别 OCR Paddle 使用说明

    百度轻量级 图片文字识别OCR 1.原文链接:https://www.paddlepaddle.org.cn/hub/scene/ocr 2.快速安装     https://github.com/P ...

  6. 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

    开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...

  7. Python文字识别之tesseract-ocr和EasyOCR

    Python文字识别之tesseract-ocr和EasyOCR 本文主要是将手机拍摄的图片文字通过Python OCR转换成Word文件,并尝试通过tesseract-ocr和EasyOCR两种方式 ...

  8. 通用文字识别 OCR 等免费 API 大全分享

    智能识别 OCR 类 API 通用文字识别OCR:多场景.多语种.高精度的整图文字检测和识别服务,多项指标行业领先,可识别中.英.日.韩.法.德多种语言. 二维码识别OCR:对图片中的二维码.条形码进 ...

  9. halcon ocr 生成样本变体_Halcon简单文字识别OCR的使用

    重要:本文最后更新于2019-10-18 08:49:28,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 突然想起网上有很多打码挣钱的活动,于是灵光一闪,用C#搞个自动识别验证码的 ...

最新文章

  1. Maven 的dependency 的 classifier的作用
  2. linux ora01075,操作系统时间被修改导致ORA-01075和ORA-00600[2252]
  3. 计算机无法上网的软件故障,解决你99%无法联网问题,高手教你只用1招轻松搞定...
  4. 关于xinetd报错
  5. 计算机排名考研,计算机考研学校排名
  6. 新荣耀员工现金补偿最高可拿 N+5;天津立法禁止采集人脸识别信息;IntelliJ IDEA 新版发布|极客头条...
  7. unity player 显示播放错误时的解决办法
  8. Android显示PDF文件之PDFviewer
  9. DirectX 9 游戏汉化详解
  10. Linux常用命令(四)
  11. CentOS7.5下载及安装过程
  12. html 通过name选择器,用name方式获得选择器总结
  13. 华为手机助手 android,华为手机助手(安卓版)
  14. 怎么去搭建聚合支付系统比较划算
  15. 新闻发布管理系统/新闻网站
  16. pcb 布线电容 影响延时--信号跨分割
  17. 汽车SoC安全故障的自动识别(下):案例展示和指标分析
  18. 无法卸载 LiveUpdate Notice 的问题
  19. 谷歌54亿收购Mandiant:提高自身谷歌云竞争性
  20. Linux IPC 进程间通信——消息队列message

热门文章

  1. Panaya进入中国市场 或引领ERP行业变革
  2. OMP 设置线程的3种方法
  3. 2012第23周国内Android应用下载排行榜动态
  4. 怎么用安卓高版本玩低版本游戏?
  5. 一起自学SLAM算法:3.4 图像特征点提取
  6. Qt虚拟键盘更新,支持手写识别功能
  7. 天津大学计算机科学学院,孙富春-天津大学计算机科学与技术学院.PDF
  8. 大学毕业设计答辩PPT模板
  9. Vue3 mixin 选项混入 “混合“
  10. MATLAB之优劣解距离法Topsis模型