tesseract训练
1.安装Tesseract.exe文件并配置Path 复制安装路径“C:\Program Files (x86)\Tesseract-OCR”,右键点击“计算机”,进入属性系统,然后点击“高级系统设置”Windows环境安装tesseract-OCR并配置环境变量
点击环境变量,进入配置以下界面把刚才的安装路径“C:\Program Files (x86)\Tesseract-OCR”添加到红线划的PATH和Path,注意,添加时候开头用“;”跟之前的变量隔开,结尾以“;”结尾。下面是我的配置信息样本, 配置好了点击确定保存。Windows环境安装tesseract-OCR并配置环境变量
Windows环境安装tesseract-OCR并配置环境变量window+r,输入cmd,打开命令终端,输入:tesseract -v,可以看到版本信息2.打开jTessBoxEditor-2.2.1 (train.bat)进行训练;
3.把训练生成的库添加到引用包中。
CMD:
识别
tesseract test.jpg result -l chi_sim
生成box文件
tesseract mjorcen.normal.exp0.png mjorcen.normal.exp0 -l chi_sim batch.nochop makebox
tesseract mjorcen.normal.exp1.png mjorcen.normal.exp1 -l chi_sim batch.nochop makebox一,CMD 将光标切换到目标文件夹
Dos: D:cd D:桌面\Test二,更改图片名称例如:将1.png改为 Song.Ti.exp0.png (exp0,exp1)三,生成box文件用于训练cmd窗口输入:Tesseract Song.Ti.exp0.peng Song.Ti.exp0 -l chi_sim batch.nochop makebox四,打开jTessBoxEditor-2.2.1 (train.bat)进行训练;
1.BOX——》Editor 》open 选择 Song.Ti.exp0.png 进行文字修改
2.Trainer 设置 Traning Data (保存路径) Language (生成的字库名) RTL (格式)
3.点击Run即可生成字库(Song)五,识别
cmd输入 Tesseract 1.png txt文件名 -l Song(生成的字库 放在Tesseract的安装目录)
tesseract训练相关推荐
- 使用Tesseract训练lang文件并OCR识别集装箱号
https://lonelygo.github.io/2017/07/21/使用Tesseract训练lang文件并OCR识别集装箱号/index.html
- Tesseract训练中文字体识别(转)
原文地址:http://www.jianshu.com/p/31afd7fc5813 前言 网上已经有大量的tesseract的识别教程,但是主要有两个缺点: 大多数比较老,有部分内容已经不适用. 大 ...
- Tesseract训练识别数字
Tesseract训练识别数字 一.软件环境 1.安装Tesseract 3.0.2 2.安装jTessBoxEditorFX训练工具 二.训练前需要准备的素材 1.多张包含数字的图片 三.开始训练 ...
- Tesseract训练新字体
最近工作需要,要对特定字体准确识别,用官方下载的eng识别库,错误率比较高,不能满足要求,所以就踏上了训练字库的征程,我说下我寻找的几种训练方法 注意: Tesseract-OCR 和 Tessera ...
- Windows下Tesseract训练音符识别
Windows下Tesseract训练音符识别 背景 开局一张图:现在有这么一个需求,要将数字简谱中的数字带点的内容识别出来做进一步的处理,比如 6 1 6 641 533 . . ... 识别成 F ...
- Tesseract: 训练(续)
为什么80%的码农都做不了架构师?>>> 目录 更易配置和使用的训练工具 获取工具 配置 训练 字符识别歧义校正 旧版本格式 新版本格式 词典: DAWG 文件 续上篇: &l ...
- 基于Tesseract训练的数字识别研究
征地档案数字识别研究与应用 1 永州市自然资源与规划勘测事务中心 湖南 永州425000 摘要:针对征地档案数据整理建库工作中界址点坐标电子数据缺失现象,当前主要通过人工识别档案资料并且将坐标数据抄录 ...
- Google开源OCR项目Tesseract训练(自己训练的记录,未成功)
图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章 ...
- Tesseract训练笔记
[参考] http://www.cnblogs.com/samlin/p/Tesseract-OCR.html https://code.google.com/p/tesseract-ocr/wiki ...
- ocr python tesseract训练_tesseract-ocr怎么大量训练
3000和功能培训fortesseract已针对此问题停止了培训示例,在多次提出请求后,原因有两个:1.无法找到文件font_properties: 2.找不到num.dont.exp0.tr; 在线 ...
最新文章
- AIoT开放平台及应用
- Java代码注释规约
- Spring Boot的学习之路(03):基础环境搭建,做好学习前的准备工作
- android novate乱码,Android RxJava+Retrofit2+RxBinding
- L1-036 A乘以B
- javaScript第六天(2)
- 快应用比赛_我的应用如何在国际学生比赛中获得第三名
- SVN卸载,修复,等问题:依赖服务或组无法启动.(0x8007042c)解决之一
- java sort排序
- Python3 SSH远程连接服务器
- 【已解决】ModuleNotFoundError: No module named ‘web’的解决办法:
- mysql协议分析1,MySQL协议分析(1)
- 【教程分享】2018最新pHp视频教程
- 怎么删除内网计算机IP地址,如何能在局域网中隐藏电脑及IP地址
- PADS2007教程(三)——原理图和PCB封装建立关联
- matlab 系统辨识,系统辨识的Matlab实现方法(手把手)..docx
- cordova打包APP更改图标和APP名字
- 逆向分析商业软件 010 Editor 及注册机编写
- LeetCode -- Word Ladder
- 关于打印机打印网页出现字迹显示不全的问题心得