OCR 开源软件 Tesseract 的下载和入门使用
资源下载
tesseract-ocr-setup-3.05.01.exe
注: 安装的时候选好要识别的语言
tesseract-4.0-with-LSTM#400-alpha-for-windows
Windows中运行tesseract
1.tesseract
是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
imagename
The name of the input image. Most image file formats (anything readable by
Leptonica) are supported.(输入图片的文件名,可以是Leptonica支持的各种图片格式)outputbase
The basename of the output file (to which the appropriate extension will be
appended). By default the output will be named outbase.txt.(输出文件的文件名,
默认输出文件是txt格式的,还可以指定Hocr和pdf格式)
2.举个栗子:识别myscan.png
图像,将识别结果存入out.txt
,命令行:
tesseract myscan.png out
3.指定特定语言,指定识别简体中文和英文-l chi_sim+eng
,命令行:
tesseract myscan.png out -l chi_sim+eng
4.指定输出文件格式,在命令行最后加上文件格式即可,可以指定Hocr和pdf格式,hOCR是
是一种HTML文件,它对每个识别的字词会后一些参数的说明。tesseract 3.03及以上的版本才
支持pdf格式,命令行为:
hOCR: tesseract myscan.png out hocr
pdf: tesseract myscan.png out pdf
Github 参考文件
运行tesseract
参数说明
OCR 开源软件 Tesseract 的下载和入门使用相关推荐
- i-p2psearcher开源软件源码下载
小学生写的都是命题作文,总的来说,i-p2psearcher开源软件源码下载:http://www.i-p2psearcher.com/ 形成了几种不同类型的作文题,我小心翼翼地从脸上慢慢往下刮,因此 ...
- Ubuntu Linux 操作系统-清华大学开源软件镜像站下载
Ubuntu 是一个由全球化的专业开发团队建造的操作系统.它包含了所有您需要的应用程序:浏览器.Office 套件.多媒体程序.即时消息等.Ubuntu 是一个 Windows 和 Office 的开 ...
- OCR开源库Tesseract汉字识别训练
用python OCR库pytesseract 写的一个OCR识别身份证程序:https://github.com/iChenwin/pytesseractID 先用中文做个示例: 拿到一张chi.p ...
- 常用开源软件官网下载地址
转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/81032427 本文出自[我是干勾鱼的博客] Ingredients: Langu ...
- Maven Repository下载开源软件jar包
https://jingyan.baidu.com/article/a681b0de6217243b1843462b.html 百度搜索Maven Repository,单击如下链接进入Maven官方 ...
- 如何下载编译Linux下RJMCMCMT1D(可逆跳跃马尔科夫链门特卡罗一维大地电磁反演)开源软件
如何下载编译Linux下RJMCMCMT1D(可逆跳跃马尔科夫链门特卡罗一维大地电磁反演)开源软件 1. 软件包下载 在Bing里搜rjmcmcmt 就可以找到: 点进去下载即可: 打开rjmcmcm ...
- 谈钱太俗!难道开源软件只能讲道义?
自古以来,读书人多以清贫自居,陶渊明不为五斗米折腰更成为千古佳话:而与书香相对立的是铜臭,铜臭一词可参考<后汉书·崔烈传>中崔烈与其子崔钧的对话. 时至今日,市场经济已成为经济主体,人们对 ...
- 2022年中国开源软件产业研究报告
下载报告去公众号:硬核刘大 后台回复" 开源软件 ",即可下载完整PDF文件. 更多报告内容,可加微信:yw5201a1 领取.(ps:加过微信:chanpin628 的不要再加 ...
- 截屏、文字提取一气呵成,超实用 OCR 开源小工具
点击上方"逆锋起笔",关注领取学习资源 ☞ 程序员进阶必备资源免费送「各种技术!」 ☜ 本文转载自机器之心 这个文本 OCR 小工具,能让你「所截即所得」. 在我们办公时,是不是经 ...
最新文章
- 数据挖掘·数据变换与离散化·概念分层与离散化·3-4-5规则
- 超有趣的几个Linux小命令
- mysql Tablespace exists解决
- 40 | 案例篇:网络请求延迟变大了,我该怎么办?
- VMware虚拟机的三种联网方法及原理
- ubuntu下安装latex
- WordPress实践:上传文件时提示“缺少临时文件夹”
- jQuery关于复制(复制隐藏文字+显示文字)跳转,Clipboard
- 算法工程师必备技能(Python 优化提速小技巧)
- MFC控件响应鼠标中键OnMouseWheel
- 如何利用cyclone对SPC560离线烧写
- 点燃我温暖你 爱心代码python
- 1259_STM32CubeProgrammer的简单使用
- HP-EVA4400故障导致的oracle数据库丢失的恢复过程
- idea智能提示设置和修改提示快捷键
- SAP中通过BOM物料清单应用程序配置来解决BOM清单显示及导出问题实例
- shell几个基础问题(基础进阶)
- sql 如果不存在则插入,存在则不操作或修改
- 关于山寨版istream_iterator的实现……
- qq影音qlv转mp4工具软件电脑pc版