1.下载tesseract-ocr

https://digi.bib.uni-mannheim.de/tesseract/

2. 配置环境变量

即在path中增加ocr的安装路径

3. 测试是否配置成功

tesseract

4.下载语言包

https://github.com/tesseract-ocr/tessdata/releases/tag/4.1.0

将以下文件加入到tessdata目录下

5.命令行测试

1.tesseract + 图片路径 + 保存结果名 + -l 语言集示列: tesseract 1606150081.png 1606150081 -l chi_sim2.tesseract + 图片路径 +stdout -l +语言集示列: tesseract D:\test.png stdout -l chi_sim

5.程序实现,不需要引入任何第三方jar包

package com.example.demo.controller;import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;@RestController
public class OcrTestController {@PostMapping("/image/extract")public String reg(@RequestParam("file")MultipartFile file) throws IOException {System.out.println(System.getProperty("user.dir"));String result = "";String filename = file.getOriginalFilename();File save = new File(System.getProperty("user.dir")+"\\"+filename);if (!save.exists()){save.createNewFile();}file.transferTo(save);String cmd = String.format("C:\\Program Files (x86)\\Tesseract-OCR\\tesseract %s stdout -l %s",System.getProperty("user.dir")+"\\"+filename,"chi_sim");result = cmd(cmd);System.out.println(result);return result;}public static String cmd(String cmd) {BufferedReader br = null;try {Process p = Runtime.getRuntime().exec(cmd);br = new BufferedReader(new InputStreamReader(p.getInputStream()));String line = null;StringBuilder sb = new StringBuilder();while ((line = br.readLine()) != null) {sb.append(line + "\n");}return sb.toString();} catch (Exception e) {e.printStackTrace();}finally{if (br != null){try {br.close();} catch (Exception e) {e.printStackTrace();}}}return null;}
}

6.测序测试

使用tesseract-ocr进行文字识别相关推荐

  1. php tesseract,PHP ocr:用Tesseract OCR进行文字识别

    系统环境:centos7 安装tesseract: yum-config-manager --add-repo https://download.opensuse.org/repositories/h ...

  2. 一篇文章搞定百度OCR图片文字识别API

    一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104 转载于:https://www.cnblogs.com/chongdongxia ...

  3. 使用腾讯OCR进行文字识别

    文章目录 OCR效果 配置腾讯云OCR准备工作 注册账号 创建秘钥 使用万象优图创建Bucket 操作指引 实现代码 生成签名 配置网络请求,调用OCR识别接口 写在后面 使用腾讯智能文字识别 OCR ...

  4. 【PC工具】更新在线图片文字识别工具,OCR免费文字识别工具

    微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 之前分享过两个windows上的OCR文字识别工具: [PC工具]更新!windows ...

  5. 阿里云 OCR 图片文字识别接口使用案例(java)

    阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...

  6. Prizmo Pro for Mac(OCR图像文字识别工具)

    Prizmo Pro mac版可以自动扫描相机中的图片,可根据用户选择的文档类型进行特殊处理,支持常用的扫描仪.数码相机.iPhone.iPad 等,也支持自动截图桌面部分区域然后识别出文字,非常的有 ...

  7. OCR图片文字识别,人工手动图片标注软件安装过程

    OCR图片文字识别,人工手动图片标注软件安装过程,本章关注标注软件的安装,启动过程 1. 下载 anaconda anaconda  下载慢的问题: 使用国内镜像地址下载: https://mirro ...

  8. TOOLFK工具-在线OCR图片文字识别工具

    本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...

  9. 比天若OCR,PandaOCR更方便使用的OCR扫描文字识别软件,易用AI

    目前市面上各种各样的OCR软件从技术上大概可以分为两大类,离线版和云端在线版.离线版的代表如 Abbyy FineReader,在线版如各大头部AI平台开放的OCR接口能力.一般在线版比离线版的识别能 ...

  10. ocr简易文字识别v1.41绿色版

    ocr简易文字识别可以高效的将网络图片或者本地图片进行文字识别,并且效率非常高,错误率也比较低,同时支持导出TXT.WORD格式的文档,点击下载就可以下载了! 使用方法: 直接将需要的图片拖入软件即可 ...

最新文章

  1. java urlconn 下载慢_使用HttpURLConnection下载文件时出现 java.io.FileNotFoundException彻底解决办法...
  2. Android 功耗(12)---如何查找待机唤醒源
  3. 5G iPhone SE起售价399美元 今年有望出货3000万部
  4. IPTABLES常用配置
  5. 爬虫-3.urllib请求
  6. An internal error occurred during: Retrieving archetypes:. GC overhead limit exceeded
  7. Linux printf()占位符
  8. php的public、protected、private三种访问控制模式的区别
  9. 《机器学习基石》笔记:第一讲
  10. CS61A第一章笔记
  11. Android HPSocket SE_SOCKET_CREATE (3)
  12. 转账设计测试用例-----必背
  13. Swing 美化包-JTattoo
  14. Oracle 数据压缩(Compression) 技术 说明
  15. php ses 发送邮件,使用 Amazon SES API 和 AWS SDK for PHP 版本 3 验证电子邮件身份 - 适用于 PHP 的 AWS 开发工具包...
  16. webpack 模块打包器
  17. 李宏毅学习笔记40.GAN.番外篇
  18. 计算机辅助工业设计应用软件,计算机辅助工业设计(CAID)
  19. sfc流程图怎么画_SFC顺序功能图教程
  20. 一次模拟餐馆的简单尝试

热门文章

  1. Android VideoView 循环播放视频
  2. 将RT-Thread Nano移植到STM32F401CCU6
  3. Bribing FIPA
  4. T3 登陆报错 3709
  5. 【C++】(八)函数
  6. 明御:APT攻击预警平台
  7. 什么是不简单?把每一件简单的事做好就是不简单;什么是不平凡?能把每一件平凡的事做好就是不平凡。
  8. Linux家目录被误删除恢复
  9. 宝塔面板解除强制绑定手机账号限制教程
  10. Latex表格排版(三个表格并列、单元格内容自动换行)