Google开源OCR项目Tesseract安装版在Windows下的使用测试记录
开源OCR项目有很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下:
https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software
从上面的排名可以看到,Tesseract是排在第一名的,所以咱们就先研究和测试它吧!
首先下载Tesseract在Windows下的安装版。(因为在国外访问不了谷歌,所以我翻墙下载了下来,这里给大家百度网盘链接)
tesseract-ocr-setup-3.02.02.exe_免费高速下载|百度网盘-分享无限制
下载下来之后一路Next安装好,然后在开始菜单找到其控制台引导程序,如下图所示:
上面的安装包里自带了已经训练好的英文-拉丁文识别数据~所以我们先来测试一下英文字符的识别吧~识别图像如下:
上面这幅图片的下载链接:03.jpg_免费高速下载|百度网盘-分享无限制
把上面的图片放到Tesseract的安装目录下,如下图所示:
然后打开上面提到的控制台窗口,如下图所示:
在窗口中输入命令:“tesseract.exe 03.jpg 3”,并回车,如下图所示:
解释一下:03.jpg代表待识别的源文件,3代表输出文件名,默认输出格式是txt文件格式!
如果你不知道命令的参数格式,可以像下面这样查询:
注意,上面的 lang之前是-l 而不是-1!
输入命令“tesseract.exe 03.jpg 3”后,在安装目录下生成了3.txt文件,这是识别结果,如下图所示:
可见,对英文字符的识别率还是挺不错的。
接下来,我们测试下对中文的识别。首先要把中文训练数据放到目录C:\Program Files (x86)\Tesseract-OCR\tessdata 下边,如下图所示:
图片中的chi_tra.traineddata下载链接:tesseract-ocr-3.02.chi_tra.tar.gz_免费高速下载|百度网盘-分享无限制
然后在目录中放入测试图片04.jpg 05.jpg 这两幅图的下载链接为:04.jpg_免费高速下载|百度网盘-分享无限制
如下图所示:
然后在CMD窗口中分别输入如下命令:
tesseract.exe 04.jpg 5 -l chi_tra
tesseract.exe 05.jpg 5_2 -l chi_tra
运行结果如下图所示:
可见,结果非常不理想,所以接下来的任务就是要研究怎样提高识别率了,当然这是后话了,本文就先写到这样!
Google开源OCR项目Tesseract安装版在Windows下的使用测试记录相关推荐
- Google开源OCR项目Tesseract训练(自己训练的记录,未成功)
图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章 ...
- Google 开源的项目集合
原链接 文为大家整理了 Google 开源的项目,看看有没有感兴趣的,排名顺序按照 Github ★Star 数排列. 0.机器学习系统 TensorFlow★Star 62533 TensorFlo ...
- Google开源实时通信项目WebRTC
Google开源实时通信项目WebRTC 作者 崔康 发布于 2011年6月3日 最近,Google正式开源了WebRTC实时通信项目,希望浏览器厂商能够将该技术内建在浏览器中,从而使Web应用开发人 ...
- 开源实时音视频技术WebRTC在Windows下的简明编译教程
1.前言 随着音视频技术的不断普及,Google推出的 WebRTC 越来越受到大家的喜欢.现在很多直播产品都是基于WebRTC 进行二次开发做出来的. WebRTC是提供了一整套处理实时音视频的开源 ...
- OCR之Tesseract安装
Tesseract安装 一.Tesseract下载 二.添加环境变量 三.配置Tesseract中文识别语言包 四.下载相关库 五.示例程序 1.待识别图片 2.识别程序 3.识别结果 Tessera ...
- python2.7手机版下载_Python 2.7 64位2.7.13 安装版 下载 - 51下载网
51下载网提供<Python 2.7 64位>2.7.13 安装版下载,该软件为免费软件,文件大小为18.5 MB,推荐指数5颗星,作为国外软件中的顶尖厂商,完全可以放心下载哦! Pyth ...
- DEDECMS最新5.7版在Windows下的Memcache安装
一,织梦后台后台设置进入系统后台,在[系统基本参数]下面的"性能选项"卡当中,关于memcache进行如下配置: cfg_memcache_enable : 是否启用memcach ...
- 开源you-get项目爬虫,以及基于python+selenium的自动测试利器
写在前面 爬虫和自动测试,对于python来说是最合适不过也是最擅长的. 开源的项目也很多,例如you-get项目https://github.com/soimort/you-get.盗链和爬虫神器. ...
- mysql 64 免安装_MYSQL 免安装版(windows 7/64)
本文介绍在本地安装MYSQL数据库,免安装版相关配置 一.下载 mysql下载地址1:http://dev.mysql.com/downloads/mysql/ 二.解压MySQL压缩包 将已下载的M ...
最新文章
- 简明 HTML CSS 开发规范
- SQL的基本数据类型
- python第七周答案_马哥2016全新Linux+Python高端运维班第七周作业
- java学习笔记2022.1.11
- app inventor HTML5,[App Inventor] Web客戶端元件 POST 傳值的使用方式
- bzoj 5302: [Haoi2018]奇怪的背包
- 5G 准备向 Wi-Fi 的 6GHz 频段下手了?
- PowerShell设置命令别名Alias
- 21个TensorFlow项目转换tfrecord:TypeError: 'RGB' has type str, but expected one of: bytes(法二)
- C++刷题——2802: 推断字符串是否为回文
- 各种强大的资源搜索引擎及搜索各大网盘资源的方法
- MAC编译OpenJDK8:error: ‘‘ within ‘||‘ [-Werror,-Wlogical-op-parentheses]
- 计算机管理五大功能,操作系统五大管理功能包括哪些介绍大全
- leetcode【链表—中等】707.设计链表
- 三种嵌入式操作系统(Palm OS 、Windows CE 和Linux)的深入分析与比较
- 报告下集 |《认文识字·中文字信息精准化》报告
- ClickHouse 之 FORMAT 应用
- 02Hadoop3分布式文件系统HDFS-01HDFS Shell文件操作
- 教你学Python38-利用SVD简化数据
- 中文输入法无论如何都要占用Ctrl+Space快捷键终极解决!
热门文章
- python怎么学最快-浅谈:从为什么学习python到如何学好python
- 用python画猫咪怎么画-Python海龟画图工具绘制叮当猫程序
- python序列类型-python序列类型有哪些
- 用python处理excel数据的优势-python处理excel的优势是什么
- 怎么学python-新手如何自学python课程?
- python常见错误-python常见的错误提示有什么
- python哪个版本好-python下载哪个版本好
- python语言可以在哪系统操作-python能检测到它运行的是哪个操作系统?
- python爬虫详细步骤-Python爬虫的步骤和工具
- python下载后如何使用-如何使用python下载文件?