Tesseract学习(一)
最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。
官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点此处
识别过程大概可以分为以下几个步骤:
1.下载tesseract-ocr-3.02.exe,并安装。
2.打开cmd命令框,键入tesseract可以查看使用说明:Usage
其中imagename 为图片路径,outputbase为输出文本路径,默认保存为txt格式 ,lang为语言包路径 ,pagesegmode为识别方式,下面介绍有不同数字代表的含义。
3.键入键入:
(可省略“-l eng”,默认使用的就是安装包中tessdata中的英文语言包,另外图片必须给出后缀,输出路径不要写txt)。
下面以一张图片为例演示识别过程:
-〉待识别的图片(在D盘根目录)
4.进入D盘,发现有一个1.txt的文件,打开:
这种识别方法满足基本的需求还是没问题的,但如何在程序中使用呢?下篇博客将介绍如何在程序中调用客户端程序。
Tesseract学习(一)相关推荐
- Tesseract学习(四)
本文将介绍如何在C#下调用Tesseract-OCR,由于现在已经有编译好的dll文件,所以只需添加引用到项目中即可. dll文件可在此处下载,下载后添加到项目中.另外需要自己下载语言库(注意版本为3 ...
- Tesseract学习(五)
前面讲的都是对于标准字的识别,但对于验证码或者手写字体识别率就会非常低.为了让Tesseract识别自己的语言,可以通过训练语言库的方式来解决.下面通过一个识别手写字体的例子来了解Tesseract提 ...
- Tesseract学习(三)
前两篇博客讲的都是通过调用客户端程序的方式来识别图像,但一旦要识别的图片很多的话,识别速度将很不乐观,因为频繁的打开关闭进程.频繁的访问文件都会严重影响程序的时间效率. 接下来我将介绍通过调用API的 ...
- 刷票大战(三)——C#自动POST数据
前言:前面两篇已经很大程度上解放了人力,但我想别人的刷票软件是怎么制作出来的呢,肯定有办法让程序自动发包.由此,利用C#写了个小程序,自动POST数据到服务器处理程序,但这只是一个半成品,由于今天投票 ...
- python爬虫学习笔记 3.9 (了解参考:训练Tesseract)
python爬虫学习笔记 3.9 (了解参考:训练Tesseract) 参考阅读:训练Tesseract 要使用 Tesseract 的功能,比如后面的示例中训练程序识别字母,要先在系统中设置一 个新 ...
- tesseract-ocr的字库学习步骤(训练自己的文库),关于ocr的对图片的解析,包括tesseract的安装(史上最全)
tesseract-ocr的字库学习步骤(训练自己的文库) 简介:在网上看了很多案列.都不是很完整.然后自己用了一天时间进行整理,第一次写文章,希望对大家有帮助. 一.安装tesseract 下载地址 ...
- python学习⑥|基于tesseract的视频字幕提取
文章目录 一.准备工作 1.正常流程 2.持续报错及解决 jupyter持续路径报错 解决jupyter环境变量问题 如何找到特定的路径 二.正式开始 1.最基本的识别-从读图开始 基本思路 2.提取 ...
- 使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 在这篇文章中,我们将使用 OpenCV 在图像的选定区域上应用 O ...
- 基于深度学习OpenCV与python进行字符识别
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 当我们在处理图像数据集时,总是会想有没有什么办法以简单的文本格式检 ...
最新文章
- 30条HTML代码编写指南 for入门者
- 百度bae mysql_微信公众号开发第二课 百度BAE搭建和数据库使用
- JMeter Sampler之BeanShellSampler的使用
- 算法学习:manacher
- 配置文件详解_Keepalived配置文件详解
- 如何测试 SAP OData的filter功能
- datatables 响应式
- python 输入正方形_Python打印正方形
- 人脸对齐(四)--CLM算法及概率图模型改进
- pyqt5菜鸟教程_PyQt5教程(一)——第一个PyQt5程序
- CISSP考试经验分享
- JAVA下载的详细教程
- javaweb单点登录的三种实现方式
- IPV4组播地址解析以及IPV4地址详解
- 程序员在囧途之垃圾创业团队 .
- html flash 上传插件,flash 插件上传文件 | 浩然东方
- 首批5G手机概念热炒,但你真的敢用?
- R语言plotly可视化:plotly可视化回归面(plane)、使用mesh3d和add_surface实现三维回归曲面
- 心胸有多大,成就有多大
- 【安卓逆向】CTF实战分析