开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下:

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

从上面的排名可以看到,Tesseract是排在第一名的,所以咱们就先研究和测试它吧!

首先下载Tesseract在Windows下的安装版。(因为在国外访问不了谷歌,所以我翻墙下载了下来,这里给大家百度网盘链接)

tesseract-ocr-setup-3.02.02.exe_免费高速下载|百度网盘-分享无限制

下载下来之后一路Next安装好,然后在开始菜单找到其控制台引导程序,如下图所示:

上面的安装包里自带了已经训练好的英文-拉丁文识别数据~所以我们先来测试一下英文字符的识别吧~识别图像如下:

上面这幅图片的下载链接:03.jpg_免费高速下载|百度网盘-分享无限制

把上面的图片放到Tesseract的安装目录下,如下图所示:

然后打开上面提到的控制台窗口,如下图所示:

在窗口中输入命令:“tesseract.exe 03.jpg 3”,并回车,如下图所示:

解释一下:03.jpg代表待识别的源文件,3代表输出文件名,默认输出格式是txt文件格式!

如果你不知道命令的参数格式,可以像下面这样查询:

注意,上面的 lang之前是-l 而不是-1!

输入命令“tesseract.exe 03.jpg 3”后,在安装目录下生成了3.txt文件,这是识别结果,如下图所示:

可见,对英文字符的识别率还是挺不错的。

接下来,我们测试下对中文的识别。首先要把中文训练数据放到目录C:\Program Files (x86)\Tesseract-OCR\tessdata 下边,如下图所示:

图片中的chi_tra.traineddata下载链接:tesseract-ocr-3.02.chi_tra.tar.gz_免费高速下载|百度网盘-分享无限制

然后在目录中放入测试图片04.jpg 05.jpg 这两幅图的下载链接为:04.jpg_免费高速下载|百度网盘-分享无限制

如下图所示:

  

然后在CMD窗口中分别输入如下命令:

tesseract.exe 04.jpg 5 -l chi_tra

tesseract.exe 05.jpg 5_2 -l chi_tra

运行结果如下图所示:

 

可见,结果非常不理想,所以接下来的任务就是要研究怎样提高识别率了,当然这是后话了,本文就先写到这样!

Google开源OCR项目Tesseract安装版在Windows下的使用测试记录相关推荐

  1. Google开源OCR项目Tesseract训练(自己训练的记录,未成功)

    图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章  ...

  2. Google 开源的项目集合

    原链接 文为大家整理了 Google 开源的项目,看看有没有感兴趣的,排名顺序按照 Github ★Star 数排列. 0.机器学习系统 TensorFlow★Star 62533 TensorFlo ...

  3. Google开源实时通信项目WebRTC

    Google开源实时通信项目WebRTC 作者 崔康 发布于 2011年6月3日 最近,Google正式开源了WebRTC实时通信项目,希望浏览器厂商能够将该技术内建在浏览器中,从而使Web应用开发人 ...

  4. 开源实时音视频技术WebRTC在Windows下的简明编译教程

    1.前言 随着音视频技术的不断普及,Google推出的 WebRTC 越来越受到大家的喜欢.现在很多直播产品都是基于WebRTC 进行二次开发做出来的. WebRTC是提供了一整套处理实时音视频的开源 ...

  5. OCR之Tesseract安装

    Tesseract安装 一.Tesseract下载 二.添加环境变量 三.配置Tesseract中文识别语言包 四.下载相关库 五.示例程序 1.待识别图片 2.识别程序 3.识别结果 Tessera ...

  6. python2.7手机版下载_Python 2.7 64位2.7.13 安装版 下载 - 51下载网

    51下载网提供<Python 2.7 64位>2.7.13 安装版下载,该软件为免费软件,文件大小为18.5 MB,推荐指数5颗星,作为国外软件中的顶尖厂商,完全可以放心下载哦! Pyth ...

  7. DEDECMS最新5.7版在Windows下的Memcache安装

    一,织梦后台后台设置进入系统后台,在[系统基本参数]下面的"性能选项"卡当中,关于memcache进行如下配置: cfg_memcache_enable : 是否启用memcach ...

  8. 开源you-get项目爬虫,以及基于python+selenium的自动测试利器

    写在前面 爬虫和自动测试,对于python来说是最合适不过也是最擅长的. 开源的项目也很多,例如you-get项目https://github.com/soimort/you-get.盗链和爬虫神器. ...

  9. mysql 64 免安装_MYSQL 免安装版(windows 7/64)

    本文介绍在本地安装MYSQL数据库,免安装版相关配置 一.下载 mysql下载地址1:http://dev.mysql.com/downloads/mysql/ 二.解压MySQL压缩包 将已下载的M ...

最新文章

  1. 简明 HTML CSS 开发规范
  2. SQL的基本数据类型
  3. python第七周答案_马哥2016全新Linux+Python高端运维班第七周作业
  4. java学习笔记2022.1.11
  5. app inventor HTML5,[App Inventor] Web客戶端元件 POST 傳值的使用方式
  6. bzoj 5302: [Haoi2018]奇怪的背包
  7. 5G 准备向 Wi-Fi 的 6GHz 频段下手了?
  8. PowerShell设置命令别名Alias
  9. 21个TensorFlow项目转换tfrecord:TypeError: 'RGB' has type str, but expected one of: bytes(法二)
  10. C++刷题——2802: 推断字符串是否为回文
  11. 各种强大的资源搜索引擎及搜索各大网盘资源的方法
  12. MAC编译OpenJDK8:error: ‘‘ within ‘||‘ [-Werror,-Wlogical-op-parentheses]
  13. 计算机管理五大功能,操作系统五大管理功能包括哪些介绍大全
  14. leetcode【链表—中等】707.设计链表
  15. 三种嵌入式操作系统(Palm OS 、Windows CE 和Linux)的深入分析与比较
  16. 报告下集 |《认文识字·中文字信息精准化》报告
  17. ClickHouse 之 FORMAT 应用
  18. 02Hadoop3分布式文件系统HDFS-01HDFS Shell文件操作
  19. 教你学Python38-利用SVD简化数据
  20. 中文输入法无论如何都要占用Ctrl+Space快捷键终极解决!

热门文章

  1. python怎么学最快-浅谈:从为什么学习python到如何学好python
  2. 用python画猫咪怎么画-Python海龟画图工具绘制叮当猫程序
  3. python序列类型-python序列类型有哪些
  4. 用python处理excel数据的优势-python处理excel的优势是什么
  5. 怎么学python-新手如何自学python课程?
  6. python常见错误-python常见的错误提示有什么
  7. python哪个版本好-python下载哪个版本好
  8. python语言可以在哪系统操作-python能检测到它运行的是哪个操作系统?
  9. python爬虫详细步骤-Python爬虫的步骤和工具
  10. python下载后如何使用-如何使用python下载文件?