java图片片识别中文_Java中使用tess4J进行图片文字识别(支持中文)
Java 版本:建议JDK1.8
使用的软件是tesseractocr3.02,3以后的版本才支持中文, 这个软件需要安装在本地电脑中,安装的过程中全部都按照默认进行安装(以便于Java直接调用)
代码及所使用的软件插件及jar包地址如下:
https://download.csdn.net/download/weixin_40461281/10609983
该软件默认的识别的是英文,如果相要能识别中文,需要将中文的训练文本chi_sim.traineddata存放到(安装路径下\Tesseract-OCR\tessdata)中
Java中识别的话很简单 , 下面是封装的工具类
import net.sourceforge.tess4j.Tesseract;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
public class OCR {
/**
*
* @param srImage 图片路径
* @param ZH_CN 是否使用中文训练库,true-是
* @return 识别结果
*/
public static String FindOCR(String srImage, boolean ZH_CN) {
try {
System.out.println("start");
double start=System.currentTimeMillis();
File imageFile = new File(srImage);
if (!imageFile.exists()) {
return "图片不存在";
}
BufferedImage textImage = ImageIO.read(imageFile);
Tesseract instance=Tesseract.getInstance();
instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");//设置训练库
if (ZH_CN)
instance.setLanguage("chi_sim");//中文识别
String result = null;
result = instance.doOCR(textImage);
double end=System.currentTimeMillis();
System.out.println("耗时"+(end-start)/1000+" s");
return result;
} catch (Exception e) {
e.printStackTrace();
return "发生未知错误";
}
}
public static void main(String[] args) throws Exception {
String result=FindOCR("D:\\test2.png",true);
System.out.println(result);
}
}
java图片片识别中文_Java中使用tess4J进行图片文字识别(支持中文)相关推荐
- Java中使用tess4J进行图片文字识别(支持中文)
Java 版本:建议JDK1.8 使用的软件是tesseractocr3.02,3以后的版本才支持中文, 这个软件需要安装在本地电脑中,安装的过程中全部都按照默认进行安装(以便于Java直接调用) ...
- java 异常 中文_Java中所有的运行时异常,带中文解释
展开全部 算术异常类:ArithmeticExecption 空指针异常类:NullPointerException 类型强制转换异常:ClassCastException 数组负下标异常:Negat ...
- java 图像识别包_Java基于百度API的图片文字识别免费源码和jar包
1.准备工作(jdk1.8) 使用之前需要获取对应的项目API_KEY,SECRET_KEY,这些参数在使用API的时候必须用到,用于生成access_token. 如何获取这些参数? 登陆后创建一个 ...
- tess4j识别中文在linux,基于Tess4j的OCR文字识别(附部署方案)
整个项目是基于springboot的 暂时只完成了基本的功能html 应用 能够用来解决爬虫的文字反爬问题,以及其余文字识别的场景.java 开放接口 Type:post 返回格式:json 请求参数 ...
- note 文字识别one_小试Office OneNote 2010的图片文字识别功能(OCR)
自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型信息,极为方便. 它的图片内容识别功能是一个很少被用到的功能,但有时候却非常有 ...
- Android百度文字识别bitmap,Android集成Tesseract OCR实现图片文字识别
最近项目需要做图片上的文字识别,在网上找了很久,这方面的知识挺多的,但是很杂.将最近学习到的东西整理一下,仅供参考. 1.Tesseract OCR 介绍我就不说了,自行百度,或者访问:https:/ ...
- python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
- 图片文字识别:如何实现高效准确的文字识别应用?
随着科技的不断发展,图片文字识别技术已经成为了一种非常重要的应用技术,可以广泛应用于多个领域,如文档管理.信息检索.人工智能等.本文将从图片文字识别的基本原理.应用场景以及未来发展趋势三个方面进行阐述 ...
- 【图片识别】java 图片文字识别 ocr (转)
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
最新文章
- C++中substr()函数用法详解
- Google Palette算法详解以及OC化
- 用vue制作饿了么首页(1)
- 有感而发,恍然大悟。
- 链接在HTML的英文,英文:A链接标记ie下会自动补全href_HTML/Xhtml_网页制作
- 永辉发布元宵数据:汤圆销售明显提升,多个民生产品增长超150%
- 单片机烧录文件的几种格式
- Tomcat安装及配置教程(超详细的图文教程)
- linux麦克风增强软件,如何在Windows,Mac,Linux中消除背景麦克风噪音
- DCD、DTR、DSR、RTS及CTS等五个状态指示分别代表什么意思?
- 智能硬件Linux效能更高,Android软硬件巧妙整合的开发技 - 嵌入式操作系统 - 电子发烧友网...
- c# InvokeRequired和Invoke
- 帮师妹写的裁判文书内容提取程序:可做进一步提取模板
- 每日一题10003-津津不高兴
- 设置textview字体样式
- frp-内网穿透-远程桌面
- Oracle数据库综合试题
- Python编程错误:参数错误([_ctypes.COMError: (-2147024809, ‘参数错误。‘, (None, None, None, 0, ...
- ECharts图表坐标轴数据超出显示范围,以及坐标轴刻度标签显示不全解决方法
- java规约运算的signature_Java8笔记第七篇(Stream API 的操作-规约,收集 )
热门文章
- linux下的vconfig配置_Linux系统下安装配置-OpenLDAP-phpLDAPadmin
- Destoon源数据库配置文件在哪_数据库监控软件Lepus安装部署详解
- jenkins 集成java搅拌_java-Jenkins中的集成测试
- mysql连接查询on_MySql 连接查询中 on 和 where 的区别
- 从0开始学golang--1--部署本地服务器
- Spring框架中的控制反转和依赖注入
- spring的整体架构分析一
- 思卡乐科技发布SR3系列RFID产品
- [jQuery1.9]Cannot read property ‘msie’ of undefined错误的解决方法
- js设置时间在ie中部兼容总是NAN的问题