最近有个需要,小程序端手写中文之后生成图像,后端需识别图片上中文..;刚开始想到第三方收费api试试,先用了百度AI开放平台的通用字体识别的API,后来又找到了Tessearct-OCR,参考了几篇文摘整合了一下

准备:

1.下载Tessearct-COR 3.0以上版本:https://download.csdn.net/download/qq_26161693/10646074

2. 在安装时选择chi_sim.traineddata 语言库;之后在程序中需加载安装目录tessdata下的中文包(chi_sim.traineddata );

maven依赖:

net.sourceforge.tess4j

tess4j

3.2.1

Demo:

/**

*

* @param srImage 图片路径

* @param ZH_CN 是否使用中文训练库,true-是

* @return 识别结果

*/

public static String discernWord(String imagePath) {

try {

File image = new File(imagePath);

BufferedImage textImage = ImageIO.read(image);

Tesseract instance = Tesseract.getInstance();

instance.setDatapath("C:\\Program Files (x86)\\Tesseract-OCR\\tessdata");// 设置语言库

instance.setLanguage("chi_sim");// 中文识别

String words = null;

words = instance.doOCR(textImage);

return words;

}

catch (Exception e) {

e.printStackTrace();

}

}

Test:

public static void main(String[] args) throws Exception {

String words = discernWord("F:/test_used_url/ocr/originalPic/hotkidclub.jpg", true);//需识别的图文件路径

System.out.println(words);

}

ps:

在window开发环境下先安装了tesseract亲测可行,不过没试过不安装exe只加载语言包的情;况

随后在部署到Linux环境下运行会有种种的坑

解决:1)linux安装Tesseract-OCR之后,将.so相关文件复制到/usr/lib目录

2)在项目的根目录(maven的话就是resources)下添加:linux-86-64文件夹

3)配置Linux的语言环境变量

4)若访问量大的情况tomcat也容易崩掉,需设置好线程数或并发量;

详情参考:http://www.cnblogs.com/zlAurora/p/9266039.html;

java识别手写文字_Java 实现OCR 识别图像文字(手写中文)----tess4j相关推荐

  1. c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端amp;服务器

    摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...

  2. c#和java部署pytorch同事识别两个图片_身份证OCR识别移动端服务器

    摘要:由Web Service和其相关网站接收客户端上传的需要识别的图片.当Web Service接收到图片后将其转发给调度服务器,由任务调度程序再把识别请求分发给空闲的识别服务器,终由Web Ser ...

  3. ios开发ocr识别_传统图像处理技术,ocr识别技术算法

    关键词:文字识别,OCR识别,清华文通,OCR识别SDK 清华文通th ocr是一款专业的文字识别软件.软件不仅在电脑上可以使用,还支持移动端iOS以及Andeoid系统,支持中英文拍照识别,但是,都 ...

  4. 使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别

    使用Tensorflow Object Detection API进行集装箱识别并对集装箱号进行OCR识别 两年多之前我在"ex公司"的时候,有一个明确的项目需求是集装箱识别并计数 ...

  5. python图片转文字easyocr_Easy Screen OCR for Mac(文字识别转换工具)

    原标题:Easy Screen OCR for Mac(文字识别转换工具) Easy Screen OCR for Mac(文字识别转换工具)带给大家!Easy Screen OCR文字识别转换工具可 ...

  6. java 一维码架包_Java 生成、识别条形码

    条形码是由一定的字符,数字及符号组成,用以表达一组信息的图形标识符.它可以标出物品的商品名称.生产日期.图书分类号,邮件起止地点等.因而在商品流通.图书管理.邮政管理等许多领域得以广泛的应用.本文将通 ...

  7. android智能识别技术,基于Android平台的OCR识别技术研究与实现

    摘要: 随着智能手机市场的迅猛发展和普及,Android成为所占市场份额最高的手机操作系统,与此同时,人们希望在手机终端享受更丰富舒适的应用功能.将OCR和Android智能终端相结合,依托光学字符识 ...

  8. java pdf 文字_Java给pdf文件添加文字等信息

    2019独角兽企业重金招聘Python工程师标准>>> maven依赖 4.0.0 com.ttxit artifact 1.0.0 war javax.servlet javax. ...

  9. java 判断手机运营商_Java开发中识别手机运营商的方法

    在Java开发中程序需要根据用户输入的号码判断运营商,这该怎么实现呢?而我们需要根据不同的运营商进行相应的处理,下面是爱站技术频道小编介绍的Java开发中识别手机运营商的方法. js实现方法: var ...

  10. ABBYY FineReader:PDF转换、一键OCR、图片转文字等,OCR识别一遍帮你搞定。

    ABBYY公司发布 ABBYY FineReader 15 大更新,ABBYY FineReader 15 使专业人士在数字化工作场所能够最大限度地提高效率,它采用了 ABBYY 最新推出的基于 AI ...

最新文章

  1. 利用计算思维解决问题人和计算机都能完成,第1课计算机与计算思维.ppt
  2. 分布式系统的面试题14
  3. mysql dba系统学习(4)mysql的多实例multi启动停止
  4. spark on yarn提交任务后总是accepted以及通过yarn关闭application
  5. SAP C4C的一个错误消息 - Security token does not match
  6. SilverlightCMS开发之3经典三页面CMS浮现
  7. python词云的简单使用
  8. amazon 设计 4 vending machine
  9. pythondict函数_Python的dict()函数
  10. 人工智能(2)---从0开始搭建产品经理的AI知识框架:计算机视觉
  11. 降序php,以降序php读取文件
  12. oracle ssl jdbc 架构,我与数据库的JDBC连接是否使用SSL?
  13. 数据库索引应用(ms-sql)
  14. 阅读《经济学人》,学会这样查词典,从此英语学习不求人
  15. 内温的整体优先效应实验_认知
  16. Windows鼠标右键添加cmd
  17. 文华财经指标公式大全,通达信指标加密破解DLL加密防破解技术方法
  18. Charles抓包(数据)
  19. Java习题练习:幸运数
  20. java数据结构通讯录管理系统_数据结构课程设计—通讯录管理系统

热门文章

  1. IntelliJ IDEA2017.3 破解
  2. 利用rpm命令安装软件
  3. PHP使用MQ消息队列
  4. epc项目设计流程图_EPC工程总承包管理流程图解。
  5. serializer嵌套序列化
  6. python下视频的包_Python——爬取包图网图片和视频
  7. postman虚拟服务器教程,postman安装与使用教程
  8. 常见JAVA IO/NIO模型
  9. 局域网DNS服务器搭建
  10. 形式语言与自动机第一课