Java OCR tess4j 图片识别技术(三)
先贴代码段
tess4j整个的代码调用到时是蛮简单的。
1.先去官网下载:http://tess4j.sourceforge.net/
我的是Tess4J-3.4.0版,目录如下:
2.新建项目,将lib,tessdata,src复制到新建的项目中
3.将lib下的jar包加到build path 中
项目目录如下:
接下来就可以写一写测试了:
import java.io.File;import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;public class Tess4j {public static void main(String[] args) {//图片所在文件夹testTess4j("E:\\TestCode");}public static void testTess4j(String filePath){File root = new File(filePath); ITesseract instance = new Tesseract(); try { File[] files = root.listFiles(); for (File file : files) { String result = instance.doOCR(file); String fileName = file.toString().substring(file.toString().lastIndexOf("\\")+1); System.out.println("图片名:" + file.toString() +" 识别结果:"+result); } } catch (TesseractException e) { System.err.println(e.getMessage()); } }
}
4.这时候可以运行了,但是会报错,如下:
Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract304': Native library (win32-x86-64/libtesseract304.dll) not found in resource path ([file:/G:/Eclipse/Demo/bin/, file:/G:/Eclipse/Demo/lib/commons-beanutils-1.9.2.jar, file:/G:/Eclipse/Demo/lib/commons-io-2.4.jar, file:/G:/Eclipse/Demo/lib/commons-logging-1.2.jar, file:/G:/Eclipse/Demo/lib/ghost4j-1.0.1.jar, file:/G:/Eclipse/Demo/lib/hamcrest-core-1.3.jar, file:/G:/Eclipse/Demo/lib/itext-2.1.7.jar, file:/G:/Eclipse/Demo/lib/jai-imageio-core-1.3.1.jar, file:/G:/Eclipse/Demo/lib/jna-4.2.2.jar, file:/G:/Eclipse/Demo/lib/jul-to-slf4j-1.7.19.jar, file:/G:/Eclipse/Demo/lib/junit-4.12.jar, file:/G:/Eclipse/Demo/lib/lept4j-1.1.2.jar, file:/G:/Eclipse/Demo/lib/log4j-1.2.17.jar, file:/G:/Eclipse/Demo/lib/logback-classic-1.1.6.jar, file:/G:/Eclipse/Demo/lib/logback-core-1.1.6.jar, file:/G:/Eclipse/Demo/lib/rococoa-core-0.5.jar, file:/G:/Eclipse/Demo/lib/slf4j-api-1.7.19.jar, file:/G:/Eclipse/Demo/lib/xmlgraphics-commons-1.5.jar])
** 解决方法是:将lib下的win32-x86-64放到项目的bin文件夹下
5.执行结果
tess4j的数字+字母 识别效果比tesseract工具要好一些。
中文的话后期探索!
Java OCR tess4j 图片识别技术(三)相关推荐
- java零碎要点---Tesseract 3.0,Java OCR 图像智能字符识别技术,可识别中文
2.Java OCR 图像智能字符识别技术,可识别中文 几天一直在研究OCR技术,据我了解的情况,国内最专业的OCR软件只有2家,清华TH-OCR和汉王OCR,看了很多的OCR 技术发现好多对英文与 ...
- 我的世界java下载慢怎么办_只需要这三步,用Java也能图片识别
作者:不学无数的程序员 最近闲来无事研究了一下用 Java 如何模拟浏览器的行为,在实验登录的步骤时碰到了识别验证码的问题,于是在网上查找了关于 Java 如何进行图片识别验证码,由于根据网上查找的相 ...
- java ocr识别中文_java零碎要点—Tesseract 3.0,Java OCR 图像智能字符识别技术,可识别中文 | 学步园...
2.Java OCR 图像智能字符识别技术,可识别中文 几天一直在研究OCR技术,据我了解的情况,国内最专业的OCR软件只有2家,清华TH-OCR和汉王OCR,看了很多的OCR 技术发现好多对英文与数 ...
- java ocr 表格票据识别_OCR表格票据识别技术。
今天继续给大家带来OCR文字识别技术的产品,而今天为大家带来的产品是一款万能的产品哦,它就是--OCR表格票据识别技术. 表格票据识别产品SDK是一项通用的数据批量采集技术,适用于处理具有固定格式的表 ...
- Jmeter识别登录验证码_使用百度AI图片识别技术
Jmeter识别登录验证码_使用百度AI图片识别技术 一.环境准备 1.下载并引用以下Jar包 2.将下载的jar包放至Jmeter中的lib目录中即可使用 二.使用步骤 1.在获得验证码的请求后使用 ...
- python 百度识图_python截图+百度ocr(图片识别)+ 百度翻译
python截图+百度ocr(图片识别)+ 百度翻译 一直想用python做一个截图并自动翻译的工具,恰好最近有时间就在网上找了资料,根据资料以及自己的理解做了一个简单的截图翻译工具.整理一下并把代码 ...
- Java图片识别技术
一.技术介绍 OCR(Optical Character Recognition):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗.亮的模式确定其形状,然后用字符识别 ...
- OCR检测与识别技术
在过去的数年中,腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐.海量大数据分析及挖掘等领域的技术研发与落地.特别是在广告推荐领域,团队自研的基于深度在线点击率预估算法及全流程实 ...
- 使用Java做ORC图片识别
1. 下载训练库 下载地址:https://github.com/tesseract-ocr/tessdata 不用全部下载,中文识别下载那个chi_sim.traineddata即可. 2. 添加依 ...
- linux安装tesseract支持tess4j图片识别
简介 因公司需求要识别上传图片中的相关信息,因此选择了tees4j实现相关功能,其中直接通过tess4j识别不是很好,所以通过java代码对图片进行了处理之后再用tess4j进行识别,在部署到linu ...
最新文章
- 静态分析C语言生成函数调用关系的利器——cflow
- java-第十三章-类的无参方法(一)-实现客户姓名的添加和显示
- halcon学习笔记——(5)HDevelop language(异常处理)
- spring_Spring MVC控制器的单元测试:配置
- 深度学习概述:从感知机到深度网络
- Vmware中安装Ubuntu的步骤
- app-debug.apk does not exist on disk
- C#ADO.NET操作数据代码汇总
- [Python] L1-026. I Love GPLT-PAT团体程序设计天梯赛GPLT
- ASP.NET 首页性能的4大做法
- 什么技术才值得你长期投入? | 凌云时刻
- 小程序开发工具代码保存编译后,程序没变
- 计算机打印东西怎么横向打印机,打印机横向打印怎么设置,打印机不能横向打印...
- 计算机管理删除打印机驱动,彻底删除打印机驱动的方法
- 2019CBA全明星周末举行正赛 南方明星队获胜
- 完美解决Excel复制后粘贴空白的问题
- 项目四:学生信息管理系统
- 报错: mysqldump: Got errno 28 on write
- 计算机主机的跳线怎么接,电脑主机的开关线怎么接,如何接电脑主板电源线 详细始末...
- office2007之PPT模版更换与应用
热门文章
- grep -A -B -C -a -c -n -v -i等
- NETWARE系统加入服务器,Linux操作系统下配置Netware服务器方法
- c语言叠阵题目怎么做,选出下列词语书写全正确的一组[]A、贪婪点辍忍军不禁玲珑剔透B、辜负骚扰擎天旱地多姿多采C、小憩茁壮怡然自得头昏目眩D、玷污糟蹋蜂围叠阵明察秋豪...
- 钉钉打卡作弊软件案件的介绍
- NLP入门学习(一):搜狗新闻语料库的获取与预处理
- 搜狗新闻爬取怎么破解反爬机制呀,求指教
- ios7下弹出新浪微博界面,一出现就消失的问题
- 【PR】pr在导入rst字幕文件后,修改的样式无法显示在视频画面中
- 自组织映射(SOM)聚类分析Python第三方库实现<minisom>
- 站群服务器找11火星软件