Java 版本:建议JDK1.8

使用的软件是tesseractocr3.02,3以后的版本才支持中文, 这个软件需要安装在本地电脑中,安装的过程中全部都按照默认进行安装(以便于Java直接调用)

代码及所使用的软件插件及jar包地址如下:

https://download.csdn.net/download/weixin_40461281/10609983

该软件默认的识别的是英文,如果相要能识别中文,需要将中文的训练文本chi_sim.traineddata存放到(安装路径下\Tesseract-OCR\tessdata)中

Java中识别的话很简单 , 下面是封装的工具类

import net.sourceforge.tess4j.Tesseract;

import javax.imageio.ImageIO;

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

public class OCR {

/**

*

* @param srImage 图片路径

* @param ZH_CN 是否使用中文训练库,true-是

* @return 识别结果

*/

public static String FindOCR(String srImage, boolean ZH_CN) {

try {

System.out.println("start");

double start=System.currentTimeMillis();

File imageFile = new File(srImage);

if (!imageFile.exists()) {

return "图片不存在";

}

BufferedImage textImage = ImageIO.read(imageFile);

Tesseract instance=Tesseract.getInstance();

instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");//设置训练库

if (ZH_CN)

instance.setLanguage("chi_sim");//中文识别

String result = null;

result = instance.doOCR(textImage);

double end=System.currentTimeMillis();

System.out.println("耗时"+(end-start)/1000+" s");

return result;

} catch (Exception e) {

e.printStackTrace();

return "发生未知错误";

}

}

public static void main(String[] args) throws Exception {

String result=FindOCR("D:\\test2.png",true);

System.out.println(result);

}

}

java图片片识别中文_Java中使用tess4J进行图片文字识别(支持中文)相关推荐

  1. Java中使用tess4J进行图片文字识别(支持中文)

    Java 版本:建议JDK1.8  使用的软件是tesseractocr3.02,3以后的版本才支持中文, 这个软件需要安装在本地电脑中,安装的过程中全部都按照默认进行安装(以便于Java直接调用) ...

  2. java 异常 中文_Java中所有的运行时异常,带中文解释

    展开全部 算术异常类:ArithmeticExecption 空指针异常类:NullPointerException 类型强制转换异常:ClassCastException 数组负下标异常:Negat ...

  3. java 图像识别包_Java基于百度API的图片文字识别免费源码和jar包

    1.准备工作(jdk1.8) 使用之前需要获取对应的项目API_KEY,SECRET_KEY,这些参数在使用API的时候必须用到,用于生成access_token. 如何获取这些参数? 登陆后创建一个 ...

  4. tess4j识别中文在linux,基于Tess4j的OCR文字识别(附部署方案)

    整个项目是基于springboot的 暂时只完成了基本的功能html 应用 能够用来解决爬虫的文字反爬问题,以及其余文字识别的场景.java 开放接口 Type:post 返回格式:json 请求参数 ...

  5. note 文字识别one_小试Office OneNote 2010的图片文字识别功能(OCR)

    自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型信息,极为方便. 它的图片内容识别功能是一个很少被用到的功能,但有时候却非常有 ...

  6. Android百度文字识别bitmap,Android集成Tesseract OCR实现图片文字识别

    最近项目需要做图片上的文字识别,在网上找了很久,这方面的知识挺多的,但是很杂.将最近学习到的东西整理一下,仅供参考. 1.Tesseract OCR 介绍我就不说了,自行百度,或者访问:https:/ ...

  7. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  8. 图片文字识别:如何实现高效准确的文字识别应用?

    随着科技的不断发展,图片文字识别技术已经成为了一种非常重要的应用技术,可以广泛应用于多个领域,如文档管理.信息检索.人工智能等.本文将从图片文字识别的基本原理.应用场景以及未来发展趋势三个方面进行阐述 ...

  9. 【图片识别】java 图片文字识别 ocr (转)

    http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...

最新文章

  1. C++中substr()函数用法详解
  2. Google Palette算法详解以及OC化
  3. 用vue制作饿了么首页(1)
  4. 有感而发,恍然大悟。
  5. 链接在HTML的英文,英文:A链接标记ie下会自动补全href_HTML/Xhtml_网页制作
  6. 永辉发布元宵数据:汤圆销售明显提升,多个民生产品增长超150%
  7. 单片机烧录文件的几种格式
  8. Tomcat安装及配置教程(超详细的图文教程)
  9. linux麦克风增强软件,如何在Windows,Mac,Linux中消除背景麦克风噪音
  10. DCD、DTR、DSR、RTS及CTS等五个状态指示分别代表什么意思?
  11. 智能硬件Linux效能更高,Android软硬件巧妙整合的开发技 - 嵌入式操作系统 - 电子发烧友网...
  12. c# InvokeRequired和Invoke
  13. 帮师妹写的裁判文书内容提取程序:可做进一步提取模板
  14. 每日一题10003-津津不高兴
  15. 设置textview字体样式
  16. frp-内网穿透-远程桌面
  17. Oracle数据库综合试题
  18. Python编程错误:参数错误([_ctypes.COMError: (-2147024809, ‘参数错误。‘, (None, None, None, 0, ...
  19. ECharts图表坐标轴数据超出显示范围,以及坐标轴刻度标签显示不全解决方法
  20. java规约运算的signature_Java8笔记第七篇(Stream API 的操作-规约,收集 )

热门文章

  1. linux下的vconfig配置_Linux系统下安装配置-OpenLDAP-phpLDAPadmin
  2. Destoon源数据库配置文件在哪_数据库监控软件Lepus安装部署详解
  3. jenkins 集成java搅拌_java-Jenkins中的集成测试
  4. mysql连接查询on_MySql 连接查询中 on 和 where 的区别
  5. 从0开始学golang--1--部署本地服务器
  6. Spring框架中的控制反转和依赖注入
  7. spring的整体架构分析一
  8. 思卡乐科技发布SR3系列RFID产品
  9. [jQuery1.9]Cannot read property ‘msie’ of undefined错误的解决方法
  10. js设置时间在ie中部兼容总是NAN的问题