Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。Tesseract目前已作为开源项目发布在Google Project.

运行环境:

windows10 + python 3.6 + tesseract 4.0.0-beta.1

先看效果:

一、安装python模块

pip3 install pytesseract

二、安装tesseract orc

下载地址:https://github.com/UB-Mannheim/tesseract/wiki 点击“tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe”下载安装。

注意:安装的时候选中中文包。

本人安装目录:C:\Users\Administrator\AppData\Local\Tesseract-OCR

使用命令,查看版本号和支持语言:

cd C:\Users\Administrator\AppData\Local\Tesseract-OCR tesseract -v tesseract --list-langs  #查看Tesseract-OCR支持语言

三、配置tesseract运行文件

C:\Python36\Lib\site-packages\pytesseract\pytesseract.py 找到文件:

tesseract_cmd = 'tesseract'

修改为:

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

四、代码识别

from PIL import Image
import pytesseractpath = "img\\text-img.png"text = pytesseract.image_to_string(Image.open(path), lang='chi_sim')
print(text)

作为非常优秀的Ocr识别库,tesseract当然可以训练自己的数据模型,从而达到为我所用目的,后续文字会介绍如果训练自己的文字识别库。

Tesseract Ocr文字识别相关推荐

  1. Tesseract Ocr文字识别实战(新版本,扩展手写文字识别)

    目录 1.Tesseract Ocr文字识别 1.1 运行环境 1.2 python模块 1.3 配置tesseract运行文件 1.4 代码识别 2. 手写汉字识别 2.1 下载库 2.2 代码 1 ...

  2. Windows下使用Tesseract进行OCR文字识别

    Windows下使用Tesseract进行OCR文字识别 Tesseract最初由惠普实验室支持,用于电子版文字识别,1996年被移植到Windows上,1998年进行了C++化,在2005年Tess ...

  3. GitHub开源:支持100多种语言的OCR文字识别

    之前为给位朋友分享过:GitHub开源:17M超轻量级中文OCR模型.支持NCNN推理,该项目仅仅支持中文OCR识别,本篇博文将分享支持100多种语言的OCR文字识别项目:Tesseract OCR. ...

  4. OCR文字识别笔记总结

    OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...

  5. opencv学习笔记五--文件扫描+OCR文字识别

    opencv学习笔记五--文件扫描+OCR文字识别 文件扫描 定义函数 边缘检测 获取轮廓 变换 OCR文字识别 环境配置 代码 文件扫描 # 导入工具包 import numpy as np imp ...

  6. 诚之和:简单应用JavaCV实现图片OCR文字识别

    现在识别的产品非常的多,例如人脸识别.文字识别以及语音识别等等.下面,分享一篇用短短几行的Java代码就可以实现图片OCR文字识别的文章,有兴趣的小伙伴们可以参考学习本文章. spring boot项 ...

  7. 好用免费的OCR文字识别网站有哪些?亲测好用

    在日常的工作当中我们难免会遇到需要用到将图片转为文字(OCR)的时候,以下是笔者收集的几个免费且好用的OCR文字识别网站,这些网站都是我亲测过且觉得好用的网站: 1.金鸣识别免费版(https://w ...

  8. Python制作简易OCR文字识别系统

    前不久看了一篇"如何使用Python检测和识别车牌?"用OpenCV对输入图像进行预处理,用imutils将原始输入图像裁剪成所需的大小,用pytesseract将提取车牌字符转换 ...

  9. OCR文字识别软件的快速任务功能如何用

    2019独角兽企业重金招聘Python工程师标准>>> 在使用ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,经常会执行一系列相同的步骤,如扫 ...

最新文章

  1. hibernate oracle 读写分离_利用FDW进行ORACLE到Postgresql的数据迁移
  2. 「完结」你对深度学习模型的理解是否足够深刻,这12篇文章了解下
  3. NIO详解(三):IO多路复用模型之select、poll、epoll
  4. 速读训练软件_记忆力训练:如何提高注意力呢?
  5. tensorflow随笔-读取图像文件数据(1)
  6. boost::math模块二项式分布来预测概率 抛硬币时的正面和反面的测试程序
  7. pod实例数是什么意思_[灌水] Kubernetes In Action: Pod
  8. python nameko用于生产_用 Python、 RabbitMQ 和 Nameko 实现微服务
  9. Codeforces 1005D Polycarp and Div 3
  10. mybatis中collection中的ofType=“String“时
  11. 产业链加入爆料行列!2019年新iPhone:外形无变化 后置摄像头升级
  12. python自己写包_如何将自己的Python包发布到PyPI
  13. 软件测试经典面试题(一)给你一个水杯如何测试
  14. git 远程代码回滚master
  15. HDU 1789 Doing Homework again(贪心)
  16. [javascript]Ex站阅读器
  17. [原创]安全系列之端口敲门服务(Port Knocking for Ubuntu 14.04 Server)
  18. 剑指Offer——腾讯+360+搜狗校招笔试题+知识点总结
  19. macOS SwiftUI 教程之 06 绘图实现正弦波,通过调整频率和步进值来更新正弦波视图 (教程含源码)
  20. vue2响应式通过数组下标赋值响应式问题

热门文章

  1. 『收藏向 期末SSM课设救急』 教你从搭建到测试运行手撸一个SSM项目实战,附带源码,前端页面、解析和一般遇到的问题(排雷)
  2. logstash-filter模块
  3. Go实现简单的RESTful_API
  4. Exchange server 2013(十四)WSUS部署及组策略设置(2)
  5. Squid服务日志分析
  6. shell timeout
  7. openssl漏洞检查
  8. 堆和栈、值类型与引用类型、装箱与拆箱
  9. lua中文教程(第一章 起点)
  10. JDBC通过连接池链接数据库总是失败的解决办法