使用tesseract-ocr进行文字识别

1.下载tesseract-ocr

https://digi.bib.uni-mannheim.de/tesseract/

2. 配置环境变量

即在path中增加ocr的安装路径

3. 测试是否配置成功

tesseract

4.下载语言包

https://github.com/tesseract-ocr/tessdata/releases/tag/4.1.0

将以下文件加入到tessdata目录下

5.命令行测试

1.tesseract + 图片路径 + 保存结果名 + -l 语言集示列: tesseract 1606150081.png 1606150081 -l chi_sim2.tesseract + 图片路径 +stdout -l +语言集示列: tesseract D:\test.png stdout -l chi_sim

5.程序实现,不需要引入任何第三方jar包

package com.example.demo.controller;import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;@RestController
public class OcrTestController {@PostMapping("/image/extract")public String reg(@RequestParam("file")MultipartFile file) throws IOException {System.out.println(System.getProperty("user.dir"));String result = "";String filename = file.getOriginalFilename();File save = new File(System.getProperty("user.dir")+"\\"+filename);if (!save.exists()){save.createNewFile();}file.transferTo(save);String cmd = String.format("C:\\Program Files (x86)\\Tesseract-OCR\\tesseract %s stdout -l %s",System.getProperty("user.dir")+"\\"+filename,"chi_sim");result = cmd(cmd);System.out.println(result);return result;}public static String cmd(String cmd) {BufferedReader br = null;try {Process p = Runtime.getRuntime().exec(cmd);br = new BufferedReader(new InputStreamReader(p.getInputStream()));String line = null;StringBuilder sb = new StringBuilder();while ((line = br.readLine()) != null) {sb.append(line + "\n");}return sb.toString();} catch (Exception e) {e.printStackTrace();}finally{if (br != null){try {br.close();} catch (Exception e) {e.printStackTrace();}}}return null;}
}

6.测序测试

使用tesseract-ocr进行文字识别相关推荐

php tesseract,PHP ocr:用Tesseract OCR进行文字识别
系统环境:centos7 安装tesseract: yum-config-manager --add-repo https://download.opensuse.org/repositories/h ...
一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104 转载于:https://www.cnblogs.com/chongdongxia ...
使用腾讯OCR进行文字识别
文章目录 OCR效果配置腾讯云OCR准备工作注册账号创建秘钥使用万象优图创建Bucket 操作指引实现代码生成签名配置网络请求,调用OCR识别接口写在后面使用腾讯智能文字识别 OCR ...
【PC工具】更新在线图片文字识别工具，OCR免费文字识别工具
微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 之前分享过两个windows上的OCR文字识别工具: [PC工具]更新!windows ...
阿里云 OCR 图片文字识别接口使用案例（java）
阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档前期需要完成购买阿里云服务购买服务可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试购买完成之 ...
Prizmo Pro for Mac(OCR图像文字识别工具)
Prizmo Pro mac版可以自动扫描相机中的图片,可根据用户选择的文档类型进行特殊处理,支持常用的扫描仪.数码相机.iPhone.iPad 等,也支持自动截图桌面部分区域然后识别出文字,非常的有 ...
OCR图片文字识别，人工手动图片标注软件安装过程
OCR图片文字识别,人工手动图片标注软件安装过程,本章关注标注软件的安装,启动过程 1. 下载 anaconda anaconda 下载慢的问题: 使用国内镜像地址下载: https://mirro ...
TOOLFK工具-在线OCR图片文字识别工具
本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...
比天若OCR，PandaOCR更方便使用的OCR扫描文字识别软件，易用AI
目前市面上各种各样的OCR软件从技术上大概可以分为两大类,离线版和云端在线版.离线版的代表如 Abbyy FineReader,在线版如各大头部AI平台开放的OCR接口能力.一般在线版比离线版的识别能 ...
ocr简易文字识别v1.41绿色版
ocr简易文字识别可以高效的将网络图片或者本地图片进行文字识别,并且效率非常高,错误率也比较低,同时支持导出TXT.WORD格式的文档,点击下载就可以下载了! 使用方法: 直接将需要的图片拖入软件即可 ...

使用tesseract-ocr进行文字识别

使用tesseract-ocr进行文字识别相关推荐

最新文章

热门文章