tesseract想必大家都知道(不知道自个查去),tess4j是java对tesseract的封装。

Description: A Java JNA wrapper for Tesseract OCR API. Tess4J is released and distributed under the Apache License, v2.0. ## Features: The library provides optical character recognition (OCR) support for: TIFF, JPEG, GIF, PNG, and BMP image formats Multi-page TIFF images PDF document format

python调用tesseract的案例有很多,网上一搜一大堆,在此也不细说了。

最近有个小需求,需要使用java来提取图片里的文字,首先想到的就是用tess4j,其实tess4j的使用也比较简单,在pom里引入

       <dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.3.1</version></dependency>

测试方法:

@Testpublic void test1() {String path = "";       //我的项目存放路径File file = new File("WechatIMG1436.png");ITesseract instance = new Tesseract();File directory = new File(path);String courseFile = null;try {courseFile = directory.getCanonicalPath();} catch (IOException e) {e.printStackTrace();}//设置训练库的位置instance.setDatapath("/tessdata");instance.setLanguage("chi_sim");//chi_sim :简体中文, eng   根据需求选择语言库String result = null;try {long startTime = System.currentTimeMillis();result =  instance.doOCR(file);long endTime = System.currentTimeMillis();System.out.println("Time is:" + (endTime - startTime) + " 毫秒");} catch (TesseractException e) {e.printStackTrace();}System.out.println("result: ");System.out.println(result);}

比较奇特的是上面一段代码在windows里是完全没问题的,在mac下就完全执行不了

tess4j报错信息

google了半天,大多在重复瞎扯,什么一会java不支持tesseract都能扯出来,后面在Stack Overflow上看到有人在python下调用tesseract也会报这个错,然后他们的解决方式是在代码里加上

import locale
locale.setlocale(locale.LC_ALL, 'C')

其实就是增加一个环境变量,那么我在java里执行前也加上这个环境变量不就行了。。so,在idea里加了个参数,果然好了。。

下面是一张图片的测试结果;

下面是我在python下测试的输出:

可以看到识别结果是有区别的,不过这个区别应该是模型文件的不同导致,在java里面指定了一个单独下载的模型文件。

pom文件报错_解决mac下tess4j文字识别报错问题相关推荐

  1. mac mysql密码错误_解决mac 下mysql安装后root用户登录密码错误问题

    使用的mac OS 10.11  安装mysql后访问root/root用户失败,网上找了一些解决办法,下面记录下解决方法方便以后自己查询 概述(看懂下面就不用看了): 停服务:sudo /usr/l ...

  2. mac下mysql不支持中文_解决mac下mysql无法使用中文的问题

    MySQL.png 针对 mac 系统下 mysql 无法使用中文,在网上查找解决办法,大部分都是将 mysql 下的 default.cnf 复制到 /etc下并修改为 my.cnf 然后对文件进行 ...

  3. Mac下Tesseract-OCR文字识别新手使用入门

    引 最近要倒腾一下文字识别,直接上手iOS的识别遇到了一些困难,于是决定先在Mac上做一做,会比较简单. 有一个经常听到的词汇叫做OCR,OCR是什么呢?Optical Character Recog ...

  4. 解决mac下webstorm编辑器识别less的问题

    之前在使用webstorm开发vue项目过程中,发现代码里的less有些地方总是飘红报错,虽然不影响整体代码运行,但是看起来总是很乱很难受,如下图(由于当时忘记截图,在网上找别人的图片,但是遇到问题是 ...

  5. Mac 下使用brew install 报错: Error: Cowardly refusing to `sudo brew install'

    Mac 下使用brew install 报错: localhost:infer-osx-v0.6.0 admin$ sudo brew install opam Error: Cowardly ref ...

  6. 解决Mac下npm权限问题

    解决Mac下npm权限问题 参考文章: (1)解决Mac下npm权限问题 (2)https://www.cnblogs.com/bfc0517/p/10186882.html 备忘一下.

  7. 解决mac下ssh空闲一段时间自动断开的问题

    解决mac下ssh空闲一段时间自动断开的问题 参考文章: (1)解决mac下ssh空闲一段时间自动断开的问题 (2)https://www.cnblogs.com/maoaji/p/7820287.h ...

  8. 解决MAC下MySQL忘记初始密码的方法

    解决MAC下MySQL忘记初始密码的方法分享给大家,供大家参考,具体内容如下 第一步: 点击系统偏好设置->最下边点MySQL,在弹出页面中,关闭服务 第二步: 进入终端输入:cd /usr/l ...

  9. 解决mac下的Sourcetree每次拉取提交都需要输入密码

    解决mac下的Sourcetree每次拉取提交都需要输入密码 最近重装了一次mac,并且重做了一下开发环境,结果以前的sourceTree项目的GIT密码始终保存不到Mac的钥匙串中,明明在钥匙串中是 ...

最新文章

  1. 基于octree的空间划分及搜索操作
  2. Anaconda 安装 opencv3(Win10)
  3. exp oracle所有数据库命令,oracle数据库exp命令
  4. PHP 连接 MSSQL用port时候的注意事项
  5. 支付宝app支付对接2(文档和对接注意问题)
  6. php中的魔术函数以及魔术常量
  7. 上传第三方jar包到nexus
  8. Linux搜索无线网络命令,Linux操作系统的无线网络命令
  9. spring cloud微服务分布式云架构-整合企业架构的技术点
  10. Javascript面向对象全面剖析 —创建对象
  11. 借助Sigar API获取网络信息
  12. LaTeX入门——如何独立排版出一篇期刊论文
  13. 中国机读目录格式(CNMARC)
  14. fullPage学习
  15. c#如何使用webservice、存储过程及存储过程的创建(简单模仿类似QQ统计用户在线时间为例)
  16. 【Windows10】远程桌面共享多个显示屏
  17. WeChat 微信防撤回的方法 plus
  18. 基于FMCW的测距原理及matlab仿真
  19. Python库pillow(PIL)的使用
  20. 加密芯片ATSHA204之使用

热门文章

  1. ES权威指南[官方文档学习笔记]-8
  2. XHR(XMLHttpRequest)与Linux下的CGI交互
  3. 反编译中内部类调用外部类成员问题
  4. 树回归--python Tkinter库创建GUI(2)
  5. python 中 feedparser的简单用法
  6. python中的os操作文件,文件路径
  7. Jquery的Split二次分割
  8. MongoDB for PHP扩展操作类
  9. Linux下创建用于并指定该用户的主目录和相关权限
  10. 用稳压管保护单片机引脚_零基础入门单片机(2)学会控制IO引脚你就入门啦