Tesseract Ocr文字识别
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。Tesseract目前已作为开源项目发布在Google Project.
运行环境:
windows10 + python 3.6 + tesseract 4.0.0-beta.1
先看效果:
一、安装python模块
pip3 install pytesseract
二、安装tesseract orc
下载地址:https://github.com/UB-Mannheim/tesseract/wiki 点击“tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe”下载安装。
注意:安装的时候选中中文包。
本人安装目录:C:\Users\Administrator\AppData\Local\Tesseract-OCR
使用命令,查看版本号和支持语言:
cd C:\Users\Administrator\AppData\Local\Tesseract-OCR tesseract -v tesseract --list-langs #查看Tesseract-OCR支持语言
三、配置tesseract运行文件
C:\Python36\Lib\site-packages\pytesseract\pytesseract.py 找到文件:
tesseract_cmd = 'tesseract'
修改为:
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
四、代码识别
from PIL import Image
import pytesseractpath = "img\\text-img.png"text = pytesseract.image_to_string(Image.open(path), lang='chi_sim')
print(text)
作为非常优秀的Ocr识别库,tesseract当然可以训练自己的数据模型,从而达到为我所用目的,后续文字会介绍如果训练自己的文字识别库。
Tesseract Ocr文字识别相关推荐
- Tesseract Ocr文字识别实战(新版本,扩展手写文字识别)
目录 1.Tesseract Ocr文字识别 1.1 运行环境 1.2 python模块 1.3 配置tesseract运行文件 1.4 代码识别 2. 手写汉字识别 2.1 下载库 2.2 代码 1 ...
- Windows下使用Tesseract进行OCR文字识别
Windows下使用Tesseract进行OCR文字识别 Tesseract最初由惠普实验室支持,用于电子版文字识别,1996年被移植到Windows上,1998年进行了C++化,在2005年Tess ...
- GitHub开源:支持100多种语言的OCR文字识别
之前为给位朋友分享过:GitHub开源:17M超轻量级中文OCR模型.支持NCNN推理,该项目仅仅支持中文OCR识别,本篇博文将分享支持100多种语言的OCR文字识别项目:Tesseract OCR. ...
- OCR文字识别笔记总结
OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...
- opencv学习笔记五--文件扫描+OCR文字识别
opencv学习笔记五--文件扫描+OCR文字识别 文件扫描 定义函数 边缘检测 获取轮廓 变换 OCR文字识别 环境配置 代码 文件扫描 # 导入工具包 import numpy as np imp ...
- 诚之和:简单应用JavaCV实现图片OCR文字识别
现在识别的产品非常的多,例如人脸识别.文字识别以及语音识别等等.下面,分享一篇用短短几行的Java代码就可以实现图片OCR文字识别的文章,有兴趣的小伙伴们可以参考学习本文章. spring boot项 ...
- 好用免费的OCR文字识别网站有哪些?亲测好用
在日常的工作当中我们难免会遇到需要用到将图片转为文字(OCR)的时候,以下是笔者收集的几个免费且好用的OCR文字识别网站,这些网站都是我亲测过且觉得好用的网站: 1.金鸣识别免费版(https://w ...
- Python制作简易OCR文字识别系统
前不久看了一篇"如何使用Python检测和识别车牌?"用OpenCV对输入图像进行预处理,用imutils将原始输入图像裁剪成所需的大小,用pytesseract将提取车牌字符转换 ...
- OCR文字识别软件的快速任务功能如何用
2019独角兽企业重金招聘Python工程师标准>>> 在使用ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,经常会执行一系列相同的步骤,如扫 ...
最新文章
- hibernate oracle 读写分离_利用FDW进行ORACLE到Postgresql的数据迁移
- 「完结」你对深度学习模型的理解是否足够深刻,这12篇文章了解下
- NIO详解(三):IO多路复用模型之select、poll、epoll
- 速读训练软件_记忆力训练:如何提高注意力呢?
- tensorflow随笔-读取图像文件数据(1)
- boost::math模块二项式分布来预测概率 抛硬币时的正面和反面的测试程序
- pod实例数是什么意思_[灌水] Kubernetes In Action: Pod
- python nameko用于生产_用 Python、 RabbitMQ 和 Nameko 实现微服务
- Codeforces 1005D Polycarp and Div 3
- mybatis中collection中的ofType=“String“时
- 产业链加入爆料行列!2019年新iPhone:外形无变化 后置摄像头升级
- python自己写包_如何将自己的Python包发布到PyPI
- 软件测试经典面试题(一)给你一个水杯如何测试
- git 远程代码回滚master
- HDU 1789 Doing Homework again(贪心)
- [javascript]Ex站阅读器
- [原创]安全系列之端口敲门服务(Port Knocking for Ubuntu 14.04 Server)
- 剑指Offer——腾讯+360+搜狗校招笔试题+知识点总结
- macOS SwiftUI 教程之 06 绘图实现正弦波,通过调整频率和步进值来更新正弦波视图 (教程含源码)
- vue2响应式通过数组下标赋值响应式问题