java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j
最近有个需要,小程序端手写中文之后生成图像,后端需识别图片上中文..;刚开始想到第三方收费api试试,先用了百度AI开放平台的通用字体识别的API,后来又找到了Tessearct-OCR,参考了几篇文摘整合了一下
准备:
1.下载Tessearct-COR 3.0以上版本:https://download.csdn.net/download/qq_26161693/10646074
2. 在安装时选择chi_sim.traineddata 语言库;之后在程序中需加载安装目录tessdata下的中文包(chi_sim.traineddata );
maven依赖:
net.sourceforge.tess4j
tess4j
3.2.1
Demo:
/**
*
* @param srImage 图片路径
* @param ZH_CN 是否使用中文训练库,true-是
* @return 识别结果
*/
public static String discernWord(String imagePath) {
try {
File image = new File(imagePath);
BufferedImage textImage = ImageIO.read(image);
Tesseract instance = Tesseract.getInstance();
instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");// 设置语言库
instance.setLanguage("chi_sim");// 中文识别
String words = null;
words = instance.doOCR(textImage);
return words;
}
catch (Exception e) {
e.printStackTrace();
}
}
Test:
public static void main(String[] args) throws Exception {
String words = discernWord("F:/test_used_url/ocr/originalPic/hotkidclub.jpg", true);//需识别的图文件路径
System.out.println(words);
}
ps:
在window开发环境下先安装了tesseract亲测可行,不过没试过不安装exe只加载语言包的情;况
随后在部署到Linux环境下运行会有种种的坑
解决:1)linux安装Tesseract-OCR之后,将.so相关文件复制到/usr/lib目录
2)在项目的根目录(maven的话就是resources)下添加:linux-86-64文件夹
3)配置Linux的语言环境变量
4)若访问量大的情况tomcat也容易崩掉,需设置好线程数或并发量;
详情参考:http://www.cnblogs.com/zlAurora/p/9266039.html;
java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j相关推荐
- c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端amp;服务器
摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...
- c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端服务器
摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...
- ios开发ocr识别_传统图像处理技术,ocr识别技术算法
关键词:文字识别,OCR识别,清华文通,OCR识别SDK 清华文通th ocr是一款专业的文字识别软件.软件不仅在电脑上可以使用,还支持移动端iOS以及Andeoid系统,支持中英文拍照识别,但是,都 ...
- 使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别
使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别 两年多之前我在"ex公司"的时候,有一个明确的项目需求是集装箱识别并计数 ...
- python图片转文字easyocr_Easy Screen OCR for Mac(文字识别转换工具)
原标题:Easy Screen OCR for Mac(文字识别转换工具) Easy Screen OCR for Mac(文字识别转换工具)带给大家!Easy Screen OCR文字识别转换工具可 ...
- java 一维码架包_Java 生成、识别条形码
条形码是由一定的字符,数字及符号组成,用以表达一组信息的图形标识符.它可以标出物品的商品名称.生产日期.图书分类号,邮件起止地点等.因而在商品流通.图书管理.邮政管理等许多领域得以广泛的应用.本文将通 ...
- android智能识别技术,基于Android平台的OCR识别技术研究与实现
摘要: 随着智能手机市场的迅猛发展和普及,Android成为所占市场份额最高的手机操作系统,与此同时,人们希望在手机终端享受更丰富舒适的应用功能.将OCR和Android智能终端相结合,依托光学字符识 ...
- java pdf 文字_Java给pdf文件添加文字等信息
2019独角兽企业重金招聘Python工程师标准>>> maven依赖 4.0.0 com.ttxit artifact 1.0.0 war javax.servlet javax. ...
- java 判断手机运营商_Java开发中识别手机运营商的方法
在Java开发中程序需要根据用户输入的号码判断运营商,这该怎么实现呢?而我们需要根据不同的运营商进行相应的处理,下面是爱站技术频道小编介绍的Java开发中识别手机运营商的方法. js实现方法: var ...
- ABBYY FineReader:PDF转换、一键OCR、图片转文字等,OCR识别一遍帮你搞定。
ABBYY公司发布 ABBYY FineReader 15 大更新,ABBYY FineReader 15 使专业人士在数字化工作场所能够最大限度地提高效率,它采用了 ABBYY 最新推出的基于 AI ...
最新文章
- 利用计算思维解决问题人和计算机都能完成,第1课计算机与计算思维.ppt
- 分布式系统的面试题14
- mysql dba系统学习(4)mysql的多实例multi启动停止
- spark on yarn提交任务后总是accepted以及通过yarn关闭application
- SAP C4C的一个错误消息 - Security token does not match
- SilverlightCMS开发之3经典三页面CMS浮现
- python词云的简单使用
- amazon 设计 4 vending machine
- pythondict函数_Python的dict()函数
- 人工智能(2)---从0开始搭建产品经理的AI知识框架:计算机视觉
- 降序php,以降序php读取文件
- oracle ssl jdbc 架构,我与数据库的JDBC连接是否使用SSL?
- 数据库索引应用(ms-sql)
- 阅读《经济学人》,学会这样查词典,从此英语学习不求人
- 内温的整体优先效应实验_认知
- Windows鼠标右键添加cmd
- 文华财经指标公式大全,通达信指标加密破解DLL加密防破解技术方法
- Charles抓包(数据)
- Java习题练习:幸运数
- java数据结构通讯录管理系统_数据结构课程设计—通讯录管理系统