使用tesseract-ocr进行文字识别
1.下载tesseract-ocr
https://digi.bib.uni-mannheim.de/tesseract/
2. 配置环境变量
即在path中增加ocr的安装路径
3. 测试是否配置成功
tesseract
4.下载语言包
https://github.com/tesseract-ocr/tessdata/releases/tag/4.1.0
将以下文件加入到tessdata目录下
5.命令行测试
1.tesseract + 图片路径 + 保存结果名 + -l 语言集示列: tesseract 1606150081.png 1606150081 -l chi_sim2.tesseract + 图片路径 +stdout -l +语言集示列: tesseract D:\test.png stdout -l chi_sim
5.程序实现,不需要引入任何第三方jar包
package com.example.demo.controller;import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;@RestController
public class OcrTestController {@PostMapping("/image/extract")public String reg(@RequestParam("file")MultipartFile file) throws IOException {System.out.println(System.getProperty("user.dir"));String result = "";String filename = file.getOriginalFilename();File save = new File(System.getProperty("user.dir")+"\\"+filename);if (!save.exists()){save.createNewFile();}file.transferTo(save);String cmd = String.format("C:\\Program Files (x86)\\Tesseract-OCR\\tesseract %s stdout -l %s",System.getProperty("user.dir")+"\\"+filename,"chi_sim");result = cmd(cmd);System.out.println(result);return result;}public static String cmd(String cmd) {BufferedReader br = null;try {Process p = Runtime.getRuntime().exec(cmd);br = new BufferedReader(new InputStreamReader(p.getInputStream()));String line = null;StringBuilder sb = new StringBuilder();while ((line = br.readLine()) != null) {sb.append(line + "\n");}return sb.toString();} catch (Exception e) {e.printStackTrace();}finally{if (br != null){try {br.close();} catch (Exception e) {e.printStackTrace();}}}return null;}
}
6.测序测试
使用tesseract-ocr进行文字识别相关推荐
- php tesseract,PHP ocr:用Tesseract OCR进行文字识别
系统环境:centos7 安装tesseract: yum-config-manager --add-repo https://download.opensuse.org/repositories/h ...
- 一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104 转载于:https://www.cnblogs.com/chongdongxia ...
- 使用腾讯OCR进行文字识别
文章目录 OCR效果 配置腾讯云OCR准备工作 注册账号 创建秘钥 使用万象优图创建Bucket 操作指引 实现代码 生成签名 配置网络请求,调用OCR识别接口 写在后面 使用腾讯智能文字识别 OCR ...
- 【PC工具】更新在线图片文字识别工具,OCR免费文字识别工具
微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 之前分享过两个windows上的OCR文字识别工具: [PC工具]更新!windows ...
- 阿里云 OCR 图片文字识别接口使用案例(java)
阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...
- Prizmo Pro for Mac(OCR图像文字识别工具)
Prizmo Pro mac版可以自动扫描相机中的图片,可根据用户选择的文档类型进行特殊处理,支持常用的扫描仪.数码相机.iPhone.iPad 等,也支持自动截图桌面部分区域然后识别出文字,非常的有 ...
- OCR图片文字识别,人工手动图片标注软件安装过程
OCR图片文字识别,人工手动图片标注软件安装过程,本章关注标注软件的安装,启动过程 1. 下载 anaconda anaconda 下载慢的问题: 使用国内镜像地址下载: https://mirro ...
- TOOLFK工具-在线OCR图片文字识别工具
本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...
- 比天若OCR,PandaOCR更方便使用的OCR扫描文字识别软件,易用AI
目前市面上各种各样的OCR软件从技术上大概可以分为两大类,离线版和云端在线版.离线版的代表如 Abbyy FineReader,在线版如各大头部AI平台开放的OCR接口能力.一般在线版比离线版的识别能 ...
- ocr简易文字识别v1.41绿色版
ocr简易文字识别可以高效的将网络图片或者本地图片进行文字识别,并且效率非常高,错误率也比较低,同时支持导出TXT.WORD格式的文档,点击下载就可以下载了! 使用方法: 直接将需要的图片拖入软件即可 ...
最新文章
- java urlconn 下载慢_使用HttpURLConnection下载文件时出现 
java.io.FileNotFoundException彻底解决办法...
- Android 功耗(12)---如何查找待机唤醒源
- 5G iPhone SE起售价399美元 今年有望出货3000万部
- IPTABLES常用配置
- 爬虫-3.urllib请求
- An internal error occurred during: Retrieving archetypes:. GC overhead limit exceeded
- Linux printf()占位符
- php的public、protected、private三种访问控制模式的区别
- 《机器学习基石》笔记:第一讲
- CS61A第一章笔记
- Android HPSocket SE_SOCKET_CREATE (3)
- 转账设计测试用例-----必背
- Swing 美化包-JTattoo
- Oracle 数据压缩(Compression) 技术 说明
- php ses 发送邮件,使用 Amazon SES API 和 AWS SDK for PHP 版本 3 验证电子邮件身份 - 适用于 PHP 的 AWS 开发工具包...
- webpack 模块打包器
- 李宏毅学习笔记40.GAN.番外篇
- 计算机辅助工业设计应用软件,计算机辅助工业设计(CAID)
- sfc流程图怎么画_SFC顺序功能图教程
- 一次模拟餐馆的简单尝试