java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j

最近有个需要,小程序端手写中文之后生成图像,后端需识别图片上中文..;刚开始想到第三方收费api试试,先用了百度AI开放平台的通用字体识别的API,后来又找到了Tessearct-OCR,参考了几篇文摘整合了一下

准备:

1.下载Tessearct-COR 3.0以上版本:https://download.csdn.net/download/qq_26161693/10646074

2. 在安装时选择chi_sim.traineddata 语言库;之后在程序中需加载安装目录tessdata下的中文包(chi_sim.traineddata );

maven依赖:

net.sourceforge.tess4j

tess4j

3.2.1

Demo:

/**

* @param srImage 图片路径

* @param ZH_CN 是否使用中文训练库,true-是

* @return 识别结果

public static String discernWord(String imagePath) {

try {

File image = new File(imagePath);

BufferedImage textImage = ImageIO.read(image);

Tesseract instance = Tesseract.getInstance();

instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");// 设置语言库

instance.setLanguage("chi_sim");// 中文识别

String words = null;

words = instance.doOCR(textImage);

return words;

}

catch (Exception e) {

e.printStackTrace();

}

Test:

public static void main(String[] args) throws Exception {

String words = discernWord("F:/test_used_url/ocr/originalPic/hotkidclub.jpg", true);//需识别的图文件路径

System.out.println(words);

}

ps:

在window开发环境下先安装了tesseract亲测可行,不过没试过不安装exe只加载语言包的情;况

随后在部署到Linux环境下运行会有种种的坑

解决:1)linux安装Tesseract-OCR之后,将.so相关文件复制到/usr/lib目录

2)在项目的根目录(maven的话就是resources)下添加:linux-86-64文件夹

3)配置Linux的语言环境变量

4)若访问量大的情况tomcat也容易崩掉,需设置好线程数或并发量;

详情参考:http://www.cnblogs.com/zlAurora/p/9266039.html;

java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j相关推荐

c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端amp;服务器
摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...
c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端服务器
摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...
ios开发ocr识别_传统图像处理技术，ocr识别技术算法
关键词:文字识别,OCR识别,清华文通,OCR识别SDK 清华文通th ocr是一款专业的文字识别软件.软件不仅在电脑上可以使用,还支持移动端iOS以及Andeoid系统,支持中英文拍照识别,但是,都 ...
使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别
使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别两年多之前我在"ex公司"的时候,有一个明确的项目需求是集装箱识别并计数 ...
python图片转文字easyocr_Easy Screen OCR for Mac(文字识别转换工具)
原标题:Easy Screen OCR for Mac(文字识别转换工具) Easy Screen OCR for Mac(文字识别转换工具)带给大家!Easy Screen OCR文字识别转换工具可 ...
java 一维码架包_Java 生成、识别条形码
条形码是由一定的字符,数字及符号组成,用以表达一组信息的图形标识符.它可以标出物品的商品名称.生产日期.图书分类号,邮件起止地点等.因而在商品流通.图书管理.邮政管理等许多领域得以广泛的应用.本文将通 ...
android智能识别技术,基于Android平台的OCR识别技术研究与实现
摘要: 随着智能手机市场的迅猛发展和普及,Android成为所占市场份额最高的手机操作系统,与此同时,人们希望在手机终端享受更丰富舒适的应用功能.将OCR和Android智能终端相结合,依托光学字符识 ...
java pdf 文字_Java给pdf文件添加文字等信息
2019独角兽企业重金招聘Python工程师标准>>> maven依赖 4.0.0 com.ttxit artifact 1.0.0 war javax.servlet javax. ...
java 判断手机运营商_Java开发中识别手机运营商的方法
在Java开发中程序需要根据用户输入的号码判断运营商,这该怎么实现呢?而我们需要根据不同的运营商进行相应的处理,下面是爱站技术频道小编介绍的Java开发中识别手机运营商的方法. js实现方法: var ...
ABBYY FineReader：PDF转换、一键OCR、图片转文字等，OCR识别一遍帮你搞定。
ABBYY公司发布 ABBYY FineReader 15 大更新,ABBYY FineReader 15 使专业人士在数字化工作场所能够最大限度地提高效率,它采用了 ABBYY 最新推出的基于 AI ...

java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j

java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j相关推荐

最新文章

热门文章