背景:项目需要扫描识别技术,比较了微软(智能识别技术)和谷歌的(Tess4J),决定使用这个开源的东东。

建议:

1、可以到GitHub找相关的Tess4J项目

一、项目结构:使用eclipse 构建java项目,下图为项目结构

构建TestTess4j.java,(勾选作为main函数)

public class TestTess4j {

public static void main(String args[]) {

File imageFile = new File("eurotext.tif");

Tesseract instance = Tesseract.getInstance();

try {

String result = instance.doOCR(imageFile);

System.out.println(result);

} catch (Exception e) {

System.err.println(e.getCause());

}

}

}

右击运行,java application ,选择你的main类,TestTess4j。

输出成功。

注意:jar包和dll文件是对应的,更高版本的dll文件在jar包中,可以不引用dll文件。

二、创建web项目,引用具有多个API接口类的Tess4J项目。

三、整个过程碰到的问题

1、找不到tess4j

原因,仅仅在class path中引入了jar包,没有在WEB-INF的lib目录下拷贝jar包,总是报错。

2、找不到模块

一个jar包,对应一个dll,每个dll版本不同名称不同,系统也区分32--64,在LoadLibs.java中有

这个302代表的是和jar包对应的dll文件

如果不清楚版本号,可以使用ZAR打开jar包,查看里面的dll文件名称。

注意:lept4j.jar 和test4J.jar的版本要对应,因为它们里面打包了dll文件,需要匹配。

这个属于tessract实例化的时候,默认找不到tessdata包,因为这个包里面有对应的语言训练包,需要指定

这里直接使用了绝对路径

4、java.jna.pointer报错

这个是因为tess4j的jar包问题,需要更换对应的版本

这个是因为dll文件不能正常加载的问题,这个有很多可能性

(1)、dll文件和你本地系统的c++环境不匹配,不同的libtesseract3**貌似使用的是不同版本的vs编辑器,

我的302最终,我重新到微软的官网下载了运行的配件

(2)、dll文件缺失或者错误匹配

例如302.dll需要匹配168

而305则需要匹配174

这个可以通过dll检测软件来查询,

找对应的dll文件

使用Dependency Walker工具查看DLL文件,通过软件打开libtesseract302.dll如果缺少liblept***.dll则会出现黄色叹号,

(3)你的系统可能缺少必要的dll文件,通过刚才的软件,打开dll后,看到黄色叹号,表示缺少软件

经测试,有叹号的情况也能正常运行。

三、web项目的目录结构

java tess4j ddl_使用Tess4J碰到的各路问题相关推荐

  1. [文字识别-tess4j]java文字识别之tess4j

    1.tess4j使用 先说结论,不好用.文字识别还是需要训练. 无法做到单图多语言识别 tess4j依赖语言包文件做OCR,语言选择需要在有语言包文件时在代码中 setLanguage,默认eng , ...

  2. Java提取图片文字 tess4j

    1.下载中文语言包 https://tesseract-ocr.github.io/tessdoc/Data-Files 下载 chi_sim.traineddata 2.maven依赖 <!- ...

  3. java tess4j ddl_JAVA 截图+tess4j识别

    我们先来看看要识别的图片和效果图 效果图: 图片识别需要用到tess4j这个包,下面是下载地址: 我们拿到包以后解压出来,随便你放到哪个目录 解压出来后 把tessdata和dist里面的tess4j ...

  4. java tess4j mave_java初探Tess4j识别图片文字

    想学习下识别图片中的文字,找到了Tess4j图文识别的方式,于是就初步探究下,玩下识别验证码. 第一步,下载 1.以3.4.2版本为例,下载Tess4j-3.4.2-src.zip. 2.下载中文字库 ...

  5. java tess4j 示例_Java Tess4J Demo

    [实例简介] Java Tess4J 实现OCR 可运行Demo [实例截图] [核心代码] Java_OCR └── Java_OCR ├── bin │   ├── com │   │   ├── ...

  6. Java 验证码识别(Tess4J初体验)

    Tess4J官方描述:A Java JNA wrapper for Tesseract OCR API. demo下载 1.先去官网下载:http://tess4j.sourceforge.net/ ...

  7. Tess4j linux 32,Tess4j文字识别库的相关研究

    Tess4j是Tesseract文字识别引擎的基于Java的Wrapper. 用Gradle引入 调用Tess4j的Gradle: dependencies { testCompile group: ...

  8. java override例子_java经常碰到的@Override标签

    无论是在netBeans还是在eclipse开发环境中,写java代码的时候经常会碰到@Override标签,平时只知道是覆盖的意思就好了~那么这个标签的价值就只有这些吗? 最近一次,重翻<Th ...

  9. java redirect 跨域_碰到了跨域问题, Redirect is not allowed for a preflight request

    liubx: 后端配置: @Configuration public class CorsConfigure implements WebMvcConfigurer { @Override publi ...

最新文章

  1. C++的STL 栈实现 判断栈的出栈顺序是否合理
  2. [No000011B]为什么有些程序员悄无声息渡过35岁中年危机?
  3. Linux学习笔记(三)|Vim编辑器
  4. SAP Spartacus not found页面的显示触发机制 - ErrorPageTemplate
  5. python装饰器带参数函数_当我使用带参数的python装饰器时,如何将参数传递给最内部的函数?...
  6. tomcat 参数最佳实践_一线架构师开发总结:剖析并发编程+JVM性能,深入Tomcat与MySQL...
  7. Xcode6 管理provisioning profile
  8. 微软 Edge bug 导致黑客窃取用户在任意站点的机密信息,颁发2万美元奖金
  9. 国内android源码下载方法
  10. eclipse上安装并配置tomcat
  11. 一文详解 NanoHttpd 微型服务器原理
  12. js中的几种随机排序方案
  13. windows11安装日语输入法(添加输入法)
  14. Layui多文件上传,java后台(servlet实现)
  15. 如果我恨一个人,我就领他到中关村买相机。
  16. 编程 - 变量的命名方法
  17. 设计模式-到底什么是builder模式
  18. ncode2019安装教程_nCode2019免费版
  19. 防火墙允许mysql_如何设置mysql远程访问及防火墙设置
  20. 什么是全连接神经网络?

热门文章

  1. [CSS]CSS3新增属性
  2. 超详细的新手React入门教程
  3. 范德蒙德和Teoplitz方程组的解法
  4. 软件开发中的上游和下游
  5. 前员工揭内幕:10年了,为何谷歌还搞不定知识图谱?\n
  6. 数据结构_非递归遍历二叉树(C语言)
  7. 大数据之路、阿里巴巴大数据实践读书笔记 --- 第十一章、事实表设计
  8. HDR技术之带参数估计的经典Reinhard色调映射算法的改进(嵌入了亮度均衡/暗光增强算法)
  9. android版本号不能是float,Android知识点笔记
  10. 录教程:录屏、录音、显示按键、鼠标高亮