资源下载

tesseract-ocr-setup-3.05.01.exe
注: 安装的时候选好要识别的语言

tesseract-4.0-with-LSTM#400-alpha-for-windows

Windows中运行tesseract

1.tesseract 是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]

imagename
The name of the input image. Most image file formats (anything readable by
Leptonica) are supported.(输入图片的文件名,可以是Leptonica支持的各种图片格式)outputbase
The basename of the output file (to which the appropriate extension will be
appended). By default the output will be named outbase.txt.(输出文件的文件名,
默认输出文件是txt格式的,还可以指定Hocr和pdf格式)

2.举个栗子:识别myscan.png 图像,将识别结果存入out.txt,命令行:

tesseract myscan.png out

3.指定特定语言,指定识别简体中文和英文-l chi_sim+eng,命令行:

tesseract myscan.png out -l chi_sim+eng

4.指定输出文件格式,在命令行最后加上文件格式即可,可以指定Hocr和pdf格式,hOCR是
是一种HTML文件,它对每个识别的字词会后一些参数的说明。tesseract 3.03及以上的版本才
支持pdf格式,命令行为:

hOCR: tesseract myscan.png out hocr
pdf: tesseract myscan.png out pdf

Github 参考文件

运行tesseract
参数说明

OCR 开源软件 Tesseract 的下载和入门使用相关推荐

  1. i-p2psearcher开源软件源码下载

    小学生写的都是命题作文,总的来说,i-p2psearcher开源软件源码下载:http://www.i-p2psearcher.com/ 形成了几种不同类型的作文题,我小心翼翼地从脸上慢慢往下刮,因此 ...

  2. Ubuntu Linux 操作系统-清华大学开源软件镜像站下载

    Ubuntu 是一个由全球化的专业开发团队建造的操作系统.它包含了所有您需要的应用程序:浏览器.Office 套件.多媒体程序.即时消息等.Ubuntu 是一个 Windows 和 Office 的开 ...

  3. OCR开源库Tesseract汉字识别训练

    用python OCR库pytesseract 写的一个OCR识别身份证程序:https://github.com/iChenwin/pytesseractID 先用中文做个示例: 拿到一张chi.p ...

  4. 常用开源软件官网下载地址

    转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/81032427 本文出自[我是干勾鱼的博客] Ingredients: Langu ...

  5. Maven Repository下载开源软件jar包

    https://jingyan.baidu.com/article/a681b0de6217243b1843462b.html 百度搜索Maven Repository,单击如下链接进入Maven官方 ...

  6. 如何下载编译Linux下RJMCMCMT1D(可逆跳跃马尔科夫链门特卡罗一维大地电磁反演)开源软件

    如何下载编译Linux下RJMCMCMT1D(可逆跳跃马尔科夫链门特卡罗一维大地电磁反演)开源软件 1. 软件包下载 在Bing里搜rjmcmcmt 就可以找到: 点进去下载即可: 打开rjmcmcm ...

  7. 谈钱太俗!难道开源软件只能讲道义?

    自古以来,读书人多以清贫自居,陶渊明不为五斗米折腰更成为千古佳话:而与书香相对立的是铜臭,铜臭一词可参考<后汉书·崔烈传>中崔烈与其子崔钧的对话. 时至今日,市场经济已成为经济主体,人们对 ...

  8. 2022年中国开源软件产业研究报告

    下载报告去公众号:硬核刘大  后台回复" 开源软件 ",即可下载完整PDF文件. 更多报告内容,可加微信:yw5201a1 领取.(ps:加过微信:chanpin628 的不要再加 ...

  9. 截屏、文字提取一气呵成,超实用 OCR 开源小工具

    点击上方"逆锋起笔",关注领取学习资源 ☞ 程序员进阶必备资源免费送「各种技术!」 ☜ 本文转载自机器之心 这个文本 OCR 小工具,能让你「所截即所得」. 在我们办公时,是不是经 ...

最新文章

  1. 数据挖掘·数据变换与离散化·概念分层与离散化·3-4-5规则
  2. 超有趣的几个Linux小命令
  3. mysql Tablespace exists解决
  4. 40 | 案例篇:网络请求延迟变大了,我该怎么办?
  5. VMware虚拟机的三种联网方法及原理
  6. ubuntu下安装latex
  7. WordPress实践:上传文件时提示“缺少临时文件夹”
  8. jQuery关于复制(复制隐藏文字+显示文字)跳转,Clipboard
  9. 算法工程师必备技能(Python 优化提速小技巧)
  10. MFC控件响应鼠标中键OnMouseWheel
  11. 如何利用cyclone对SPC560离线烧写
  12. 点燃我温暖你 爱心代码python
  13. 1259_STM32CubeProgrammer的简单使用
  14. HP-EVA4400故障导致的oracle数据库丢失的恢复过程
  15. idea智能提示设置和修改提示快捷键
  16. SAP中通过BOM物料清单应用程序配置来解决BOM清单显示及导出问题实例
  17. shell几个基础问题(基础进阶)
  18. sql 如果不存在则插入,存在则不操作或修改
  19. 关于山寨版istream_iterator的实现……
  20. qq影音qlv转mp4工具软件电脑pc版

热门文章

  1. tf.keras.Input函数
  2. Javascript数据类型及存储位置
  3. 贪心——洛谷P4995 跳跳!
  4. 语文阅读教学“四何”问题设计
  5. Nodejs入门学习,nodejs web开发入门,npm、express、socket配置安装、nodejs聊天室开发
  6. 【老九学堂】【Java】位运算符
  7. 【引用】单边桥图解(121法)
  8. unity实现自转及公转
  9. python 移动文件语句_[转]Python文件操作
  10. C语言时间函数gmtime和localtime