最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。

    官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点此处

             识别过程大概可以分为以下几个步骤:

        1.下载tesseract-ocr-3.02.exe,并安装。

        2.打开cmd命令框,键入tesseract可以查看使用说明:Usage

           

其中imagename 为图片路径,outputbase为输出文本路径,默认保存为txt格式  ,lang为语言包路径 ,pagesegmode为识别方式,下面介绍有不同数字代表的含义。

      3.键入键入:

      (可省略“-l eng”,默认使用的就是安装包中tessdata中的英文语言包,另外图片必须给出后缀,输出路径不要写txt)。

        下面以一张图片为例演示识别过程:

    -〉待识别的图片(在D盘根目录)

4.进入D盘,发现有一个1.txt的文件,打开:

     这种识别方法满足基本的需求还是没问题的,但如何在程序中使用呢?下篇博客将介绍如何在程序中调用客户端程序。

Tesseract学习(一)相关推荐

  1. Tesseract学习(四)

    本文将介绍如何在C#下调用Tesseract-OCR,由于现在已经有编译好的dll文件,所以只需添加引用到项目中即可. dll文件可在此处下载,下载后添加到项目中.另外需要自己下载语言库(注意版本为3 ...

  2. Tesseract学习(五)

    前面讲的都是对于标准字的识别,但对于验证码或者手写字体识别率就会非常低.为了让Tesseract识别自己的语言,可以通过训练语言库的方式来解决.下面通过一个识别手写字体的例子来了解Tesseract提 ...

  3. Tesseract学习(三)

    前两篇博客讲的都是通过调用客户端程序的方式来识别图像,但一旦要识别的图片很多的话,识别速度将很不乐观,因为频繁的打开关闭进程.频繁的访问文件都会严重影响程序的时间效率. 接下来我将介绍通过调用API的 ...

  4. 刷票大战(三)——C#自动POST数据

    前言:前面两篇已经很大程度上解放了人力,但我想别人的刷票软件是怎么制作出来的呢,肯定有办法让程序自动发包.由此,利用C#写了个小程序,自动POST数据到服务器处理程序,但这只是一个半成品,由于今天投票 ...

  5. python爬虫学习笔记 3.9 (了解参考:训练Tesseract)

    python爬虫学习笔记 3.9 (了解参考:训练Tesseract) 参考阅读:训练Tesseract 要使用 Tesseract 的功能,比如后面的示例中训练程序识别字母,要先在系统中设置一 个新 ...

  6. tesseract-ocr的字库学习步骤(训练自己的文库),关于ocr的对图片的解析,包括tesseract的安装(史上最全)

    tesseract-ocr的字库学习步骤(训练自己的文库) 简介:在网上看了很多案列.都不是很完整.然后自己用了一天时间进行整理,第一次写文章,希望对大家有帮助. 一.安装tesseract 下载地址 ...

  7. python学习⑥|基于tesseract的视频字幕提取

    文章目录 一.准备工作 1.正常流程 2.持续报错及解决 jupyter持续路径报错 解决jupyter环境变量问题 如何找到特定的路径 二.正式开始 1.最基本的识别-从读图开始 基本思路 2.提取 ...

  8. 使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 在这篇文章中,我们将使用 OpenCV 在图像的选定区域上应用 O ...

  9. 基于深度学习OpenCV与python进行字符识别

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 当我们在处理图像数据集时,总是会想有没有什么办法以简单的文本格式检 ...

最新文章

  1. 30条HTML代码编写指南 for入门者
  2. 百度bae mysql_微信公众号开发第二课 百度BAE搭建和数据库使用
  3. JMeter Sampler之BeanShellSampler的使用
  4. 算法学习:manacher
  5. 配置文件详解_Keepalived配置文件详解
  6. 如何测试 SAP OData的filter功能
  7. datatables 响应式
  8. python 输入正方形_Python打印正方形
  9. 人脸对齐(四)--CLM算法及概率图模型改进
  10. pyqt5菜鸟教程_PyQt5教程(一)——第一个PyQt5程序
  11. CISSP考试经验分享
  12. JAVA下载的详细教程
  13. javaweb单点登录的三种实现方式
  14. IPV4组播地址解析以及IPV4地址详解
  15. 程序员在囧途之垃圾创业团队 .
  16. html flash 上传插件,flash 插件上传文件 | 浩然东方
  17. 首批5G手机概念热炒,但你真的敢用?
  18. R语言plotly可视化:plotly可视化回归面(plane)、使用mesh3d和add_surface实现三维回归曲面
  19. 心胸有多大,成就有多大
  20. 【安卓逆向】CTF实战分析

热门文章

  1. 基于增强现实的室内导航系统如何设计架构
  2. 微信小程序实现简单的点击切换功能(微信开发者工具)
  3. Ubuntu 中文字体美化方案大全 (1): 概述篇
  4. 华为AR路由器的无线AC和AP分别是指什么
  5. Unity 第三方SDK框架接入 (Android Studio)
  6. vc 键盘按键KeyValue值
  7. CTFshow - 七夕杯复现
  8. R 加权最小二乘 代码_如何用EXCEL的规划求解功能优化投资组合的阿尔法值(最小二乘估计法)?...
  9. 牛客网:两两配对值最小
  10. 为什么没人再提勤劳致富了?