**

Tesseract-OCR 4.0LSTM训练流程 (Windows环境下)**

目前网上关于tesseract3.0版本的训练过程很多,但是基于lstm的4.0版本的训练几乎没有,自己深受困扰,后经过自己努力终于成功训练,特地写下来希望可以av帮助需要的人。

首先根据网上的教程安装tesseract4.0以上的版本,这里不详细说明如何安装。

1. 准备训练文本.txt格式的文件和字体文件font,里边包含.ttf格式的字体文件


2. 利用text2image生成.tif和.box文件
从font和.txt所在的目录下,通过cmd进入命令窗口,输入以下内容

text2image --text="D:\new_05\text.txt" --outputbase="D:\new_05\zth.font.exp0" --fontconfig_tmpdir="%temp%"--font="HGMaruGothicMPRO" --fonts_dir="D:\new_05\font"

其中每个参数的意义为:

–text=“D:\new_05\text.txt” 是要进行训练的样本文件路径

–outputbase=“D:\new_05\zth.font.exp0” 表示生成的.tif和.box文件的路劲和命名(注意命名方式,可参照3.0的介绍)

–fontconfig_tmpdir="%temp%" 指明configer,这个在windows中默认这么写,不写会报错

–font=“HGMaruGothicMPRO” font文件夹中的字体名称

–fonts_dir=“D:\new_05\font” font文件夹的路径

至此,会在D:\new_05文件夹下生成两个新的文件,分别为.tif和.box格式的文件

注:当你的训练文本只有图片时,可以利用jTessBoxEditor工具生成.tif和.box格式的文件,可以参照网上3.0训练的步骤介绍。
3. 利用.tif和.box文件生成.lstmf文件用于lstm训练

tesseract zth.font.exp0.tif zth.font.exp0 -l jpn --psm 6 lstm.train

其中每个参数的意义为

zth.font.exp0.tif 上一步生成的.tif 格式的文件

zth.font.exp0 指明要生成的.lstmf文件的名称

-l jpn 表示用到的语言,这个我训练的是日语

–psm 6 表示采用的识别模式,通常6 效果会好些

运行后会多出一个zth.font.exp0.lstmf文件

4. 从已有的.traineddata中提取.lstm文件

tessedata_best中的.traineddata文件 从该链接中下载所需语言的.traineddata文件

注:一定要用从上述链接中下载的.traineddata文件,如果利用原有的下载好的tesseract-OCR中的tessdata文件夹中的.traineddata文件中提取.lstm文件会造成无法进行训练。

将下载好的.traineddata文件拷贝到上述文件夹下
输入命令行:

combine_tessdata -e jpn.traineddata jpn.lstm

运行上述代码,会从.traineddata文件中提取出jpn.lstm 文件
5. 创建jpn.training_files.txt文件,里边的内容为.lstmf文件的路径地址

6. 进行训练

lstmtraining --model_output="D:\new_05\output\output" --continue_from="D:\new_05\jpn.lstm"
--train_listfile="D:\new_05\jpn.training_files.txt" --traineddata="D:\new_05\jpn.traineddata"
--debug_interval -1 --max_iterations 800

各个参数的意义:

–modeloutput 模型训练输出的路径(我在new_05文件夹中新建了一个名为output的文件夹用来存输出的文件)

–continue_from 训练从哪里继续,这里指定从第4步中提取的jpn.lstm文件,

–train_listfile 指定上一步创建的文件的路径

–traineddata 第4步中下载的.traineddata文件的路径

–debug_interval 当值为-1时,训练结束,会显示训练的一些结果参数

–max_iterations 指明训练遍历次数

此时命令窗口中会有滚动的训练历程

训练结束后,在output文件夹中会生成i一个output_checkpoint文件和多个类似output0.012_3.checkpoint的.checkpoint文件
7. 将checkpoint文件和.traineddata文件合并成新的.traineddata文件

lstmtraining --stop_training --continue_from="D:\new_05\output\output_checkpoint"
--traineddata="D:\new_05\jpn.traineddata" --model_output="D:\new_05\output\zth.traineddata"

各个参数的意义:

–stop_training 默认要有的

–continue_from 上一步生成的output_checkpoint文件路径

–traineddata 第4步中下载的.traineddata文件的路径

–model_output zth.traineddata 输出的路径
8. 将新生成的zth.traineddata文件拷贝到tesseract-OCR\tessdata文件夹下,通过代码进行识别

Tesseract-OCR 4.0LSTM训练流程 (Windows环境下)相关推荐

  1. Windows环境下训练OpenCV分类器

    首先说一下我的经历吧!不想看的可以直跳到教程.之前在树莓派上训练分类器,发现树莓派内存过小,训练几张照片还ok,但是训练十几张照片进程直接就被系统扼杀掉,,所以这次选择用笔记本训练.经过测试,用400 ...

  2. thinkPhp开发流程之一(Windows环境下)

    thinkPhp开发流程之一(Windows环境下) 一.开启多应用(只有一个应用的不需要开启) 二.创建一个应用(只有一个应用的不需要) 三.开启视图层 四.thinkphp项目结构 一.开启多应用 ...

  3. 硬盘克隆带linux系统,一种Windows环境下基于DiskGenius克隆Linux系统的方法及系统与流程...

    本发明涉及服务器操作系统技术领域,特别是一种windows环境下基于diskgenius克隆linux系统的方法及系统. 背景技术: 服务器在测试过程中需要反复安装linux操作系统用于服务器的各种测 ...

  4. 腾讯云CMQ消息队列在Windows环境下的使用

    版权声明:本文由李少华原创文章,转载请注明出处:  文章原文链接:https://www.qcloud.com/community/article/100 来源:腾云阁 https://www.qcl ...

  5. Windows环境下MinGW/gcc安装和环境配置

    MinGW,是Minimalist GNUfor Windows的缩写.它是一个可自由使用和自由发布的Windows特定头文件和使用GNU工具集导入库的集合,允许你在GNU/Linux和Windows ...

  6. DeepLearning:windows环境下C++环境实现Tensorflow编译部署

    [写在前面] 都说深度学习的这条大船上来了就应该不惧风雨,可是在配置环境这条路上的坑真是刚出旧坑又入新坑,2021年最后一天了.想想rensorflow的源代码在windows 环境下的编译历程,就忍 ...

  7. 在没有网的windows环境下安装Python模块

    在安装python环境以及python的一些模块时,可能需要在没有网的windows环境下安装Python模块. python模块下载地址,几乎所有的模块都有:https://www.lfd.uci. ...

  8. Windows环境下的安装gcc

    Windows具有良好的界面和丰富的工具,所以目前linux开发的流程是,windows下完成编码工作,linux上实现编译工作. 为了提高工作效率,有必要在windows环境下搭建一套gcc,gdb ...

  9. windows环境下 安装gcc

    要在windows环境中的git bash中执行make命令 需要安装 gcc ,MinGW是window下的gcc Windows具有良好的界面和丰富的工具,所以目前linux开发的流程是,wind ...

  10. Windows环境下32位汇编语言程序设计(典藏版)(含CD光盘1张)

    Windows环境下32位汇编语言程序设计(典藏版)(含CD光盘1张)(畅销10年,经典再现!) 罗云彬 著 ISBN 978-7-121-20759-4 2013年7月出版 定价:99.00元 75 ...

最新文章

  1. 网络营销外包——网站搜索框设计不同人群网络营销外包有不同设计
  2. 2019计算机视觉论文精选速递(2019/1/23-2018/1/28)
  3. php中如何固定表格宽度,实例讲解DataTables固定表格宽度(设置横向滚动条)
  4. 关于perl和shell的参数传递
  5. php最新版本的安装,centos安装新PHP版本
  6. Mariadb安装及主从搭建,基于centos7
  7. Docker学习文档之一 安装软件-Windows环境
  8. 各种编译环境中如何为C++添加命令行参数(Command-line parameter)
  9. 前脚修复,后脚放 PoC:马上修复这个严重的SAP Recon 漏洞!
  10. word自带公式右侧编号
  11. html搜索框代码_解放双手 | 10行Python代码实现一款网页自动化工具
  12. linux 批量进行:解压缩某一类压缩文件类型的文件
  13. Windows Service开发点滴20130622
  14. 一起艳恶学习电商项目
  15. oracle同义词6,oracle 同义词,oracle同义词是什么意思?
  16. TESLA M40折腾笔记
  17. Timeout waiting for connection from pool
  18. C#毕业设计——基于C#+asp.net+sqlserver的教务管理平台设计与实现(毕业论文+程序源码)——教务管理平台
  19. 同步,异步,并行概念的歪解
  20. C语言小游戏之五子棋

热门文章

  1. 硬件信息查看PHP,如何查看电脑硬件信息|查看电脑硬件信息软件 查看电脑CPU/显卡/内存条/主板型号等配置...
  2. 同样是VPS,为什么RAKsmart更受欢迎
  3. uni-app应用中单选按钮自定义样式1(实心圆点)
  4. nofollow的使用以及作用
  5. 手把手教你写电商爬虫-第五课 京东商品评论爬虫 一起来对付反爬虫
  6. 正式工作后的一些变化和感受
  7. 基于若依框架项目点击登录时出现TypeError: Cannot read properties of undefined (reading ‘user‘)
  8. fastbin attack学习总结
  9. Win7 64位重装系统之后,IE11安装失败、升级失败之解决办法
  10. surface屏幕自动调节亮度无法关闭