1.安装Tesseract.exe文件并配置Path 复制安装路径“C:\Program Files (x86)\Tesseract-OCR”,右键点击“计算机”,进入属性系统,然后点击“高级系统设置”Windows环境安装tesseract-OCR并配置环境变量
点击环境变量,进入配置以下界面把刚才的安装路径“C:\Program Files (x86)\Tesseract-OCR”添加到红线划的PATH和Path,注意,添加时候开头用“;”跟之前的变量隔开,结尾以“;”结尾。下面是我的配置信息样本,    配置好了点击确定保存。Windows环境安装tesseract-OCR并配置环境变量
Windows环境安装tesseract-OCR并配置环境变量window+r,输入cmd,打开命令终端,输入:tesseract -v,可以看到版本信息2.打开jTessBoxEditor-2.2.1 (train.bat)进行训练;
3.把训练生成的库添加到引用包中。
CMD:
识别
tesseract test.jpg result -l chi_sim
生成box文件
tesseract mjorcen.normal.exp0.png mjorcen.normal.exp0 -l chi_sim batch.nochop makebox
tesseract mjorcen.normal.exp1.png mjorcen.normal.exp1 -l chi_sim batch.nochop makebox一,CMD 将光标切换到目标文件夹
Dos:  D:cd D:桌面\Test二,更改图片名称例如:将1.png改为 Song.Ti.exp0.png (exp0,exp1)三,生成box文件用于训练cmd窗口输入:Tesseract Song.Ti.exp0.peng  Song.Ti.exp0 -l chi_sim batch.nochop makebox四,打开jTessBoxEditor-2.2.1 (train.bat)进行训练;
1.BOX——》Editor 》open 选择 Song.Ti.exp0.png 进行文字修改
2.Trainer 设置 Traning Data (保存路径)  Language (生成的字库名)  RTL (格式)
3.点击Run即可生成字库(Song)五,识别
cmd输入 Tesseract 1.png txt文件名 -l Song(生成的字库 放在Tesseract的安装目录)

tesseract训练相关推荐

  1. 使用Tesseract训练lang文件并OCR识别集装箱号

    https://lonelygo.github.io/2017/07/21/使用Tesseract训练lang文件并OCR识别集装箱号/index.html

  2. Tesseract训练中文字体识别(转)

    原文地址:http://www.jianshu.com/p/31afd7fc5813 前言 网上已经有大量的tesseract的识别教程,但是主要有两个缺点: 大多数比较老,有部分内容已经不适用. 大 ...

  3. Tesseract训练识别数字

    Tesseract训练识别数字 一.软件环境 1.安装Tesseract 3.0.2 2.安装jTessBoxEditorFX训练工具 二.训练前需要准备的素材 1.多张包含数字的图片 三.开始训练 ...

  4. Tesseract训练新字体

    最近工作需要,要对特定字体准确识别,用官方下载的eng识别库,错误率比较高,不能满足要求,所以就踏上了训练字库的征程,我说下我寻找的几种训练方法 注意: Tesseract-OCR 和 Tessera ...

  5. Windows下Tesseract训练音符识别

    Windows下Tesseract训练音符识别 背景 开局一张图:现在有这么一个需求,要将数字简谱中的数字带点的内容识别出来做进一步的处理,比如 6 1 6 641 533 . . ... 识别成 F ...

  6. Tesseract: 训练(续)

    为什么80%的码农都做不了架构师?>>>    目录 更易配置和使用的训练工具 获取工具 配置 训练 字符识别歧义校正 旧版本格式 新版本格式 词典: DAWG 文件 续上篇: &l ...

  7. 基于Tesseract训练的数字识别研究

    征地档案数字识别研究与应用 1 永州市自然资源与规划勘测事务中心 湖南 永州425000 摘要:针对征地档案数据整理建库工作中界址点坐标电子数据缺失现象,当前主要通过人工识别档案资料并且将坐标数据抄录 ...

  8. Google开源OCR项目Tesseract训练(自己训练的记录,未成功)

    图像处理开发需求.图像处理接私活挣零花钱,请加微信/QQ 2487872782 图像处理开发资料.图像处理技术交流请加QQ群,群号 271891601 本文训练Tesseract用的方法主要参考文章  ...

  9. Tesseract训练笔记

    [参考] http://www.cnblogs.com/samlin/p/Tesseract-OCR.html https://code.google.com/p/tesseract-ocr/wiki ...

  10. ocr python tesseract训练_tesseract-ocr怎么大量训练

    3000和功能培训fortesseract已针对此问题停止了培训示例,在多次提出请求后,原因有两个:1.无法找到文件font_properties: 2.找不到num.dont.exp0.tr; 在线 ...

最新文章

  1. AIoT开放平台及应用
  2. Java代码注释规约
  3. Spring Boot的学习之路(03):基础环境搭建,做好学习前的准备工作
  4. android novate乱码,Android RxJava+Retrofit2+RxBinding
  5. L1-036 A乘以B
  6. javaScript第六天(2)
  7. 快应用比赛_我的应用如何在国际学生比赛中获得第三名
  8. SVN卸载,修复,等问题:依赖服务或组无法启动.(0x8007042c)解决之一
  9. java sort排序
  10. Python3 SSH远程连接服务器
  11. 【已解决】ModuleNotFoundError: No module named ‘web’的解决办法:
  12. mysql协议分析1,MySQL协议分析(1)
  13. 【教程分享】2018最新pHp视频教程
  14. 怎么删除内网计算机IP地址,如何能在局域网中隐藏电脑及IP地址
  15. PADS2007教程(三)——原理图和PCB封装建立关联
  16. matlab 系统辨识,系统辨识的Matlab实现方法(手把手)..docx
  17. cordova打包APP更改图标和APP名字
  18. 逆向分析商业软件 010 Editor 及注册机编写
  19. LeetCode -- Word Ladder
  20. 关于打印机打印网页出现字迹显示不全的问题心得

热门文章

  1. SGU278 Fuel【凸包】
  2. 计算机毕设(附源码)JAVA-SSM基于协同过滤算法的食谱定制系统
  3. Nginx日志配置(超详细)
  4. 10代i3能用matlab吗,intel终于是有压力了,十代i3被i7灵魂附体!
  5. 苹果新专利:玻璃机身iPhone也耐摔
  6. 机器人布里茨说什么_lol机器说的话
  7. Jmeter响应断言多个结果均为通过
  8. 呼入型呼叫中心系统的ACD排队规则
  9. coupang批量上传产品遇到的问题
  10. 非常棒的几款chrome插件