利用Paddle OCR HubServing + Java Demo进行文字识别

需求描述

需要批量过滤一批本地图片,将含有网址水印的图片剔除

实现逻辑

使用python开源库 chinese_ocr_db_crnn_server 部署成本地http服务,使用Java进行http调用,获取图片中的文字信息,进行文字比较。

经测试,识别效果很好,准确率也很高,至于性能需要看服务器的配置了。

运行环境

名称 版本
操作系统 Centos7.9
python 3.7.0
pip3 22.1.1
paddlepaddle 2.3

1. 安装paddlepaddle

python -m pip install paddlepaddle==2.3.0 -i https://mirror.baidu.com/pypi/simple
## 验证安装是否成功,执行下面命令出现 PaddlePaddle is installed successfully 即是安装成功
python3
import paddle
paddle.utils.run_check()

安装的过程中由于硬件和操作系统环境不同,可能会出现某些依赖缺少的情况,需要自己进行排错安装

2. 下载Paddle OCR的源码

## git仓库克隆源码
git clone https://gitee.com/PaddlePaddle/PaddleOCR
## 移动源码到你想要的位置
mv ./PaddleOCR /PaddleOCR
##进入PaddleOCR目录进行依赖的安装
cd /PaddleOCR
pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 模型库下载

需要下载3个模型,分别是检测模型,方向分类器,识别模型

模型 链接
检测模型 https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_det_infer.tar
方向分类器 https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
识别模型 https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar

下载之后上传到PaddleOCR/interface目录下,interface如果无此目录则使用mkdir新建,然后解压

cd /PaddleOCR
mkdir interface
## 模型解压
tar -xvf ch_ppocr_mobile_v2.0_cls_infer.tar
tar -xvf ch_ppocr_server_v2.0_det_infer.tar
tar -xvf ch_ppocr_server_v2.0_rec_infer.tar

4. 安装HubServing服务

cd /PaddleOCR
export PYTHONPATH=.
## 下载服务模型
hub install chinese_ocr_db_crnn_server==1.1.1
## 服务启动
nohup hub serving start -m chinese_ocr_db_crnn_server >> /PaddleOCR/hub.log  2>&1 &
##出现 Running on http:/127.0.0.1:8866之类的信息表示启动成功
## 服务停止命令
kill -9 pid
## 或者
hub serving stop

5. 编写Java单元测试

package com.example.test.util;import java.io.*;
import java.util.ArrayList;
import java.util.List;/*** @autor Hou Dehong* @date 2022/5/19* @description*/
public class PaddleDemo2 {public static List<String> list = new ArrayList<>();public static void main(String[] args) throws Exception {String url = "http://10.10.102.208:8866/predict/chinese_ocr_db_crnn_server";String dirOri = "C:\\Users\\Administrator\\Desktop\\";String fileName = "test.jpg";// 读取文件byte[] imgData = readFileByBytes(dirOri + fileName);String imgStr = Base64Util.encode(imgData);String param = "{\"images\":[\"" + imgStr + "\"]}";System.out.println(fileName);String result = HttpUtil.postGeneralUrl(url, "application/json", param,"UTF-8");System.out.println(result);}public static byte[] readFileByBytes(String filePath) throws IOException {File file = new File(filePath);if (!file.exists()) {throw new FileNotFoundException(filePath);} else {ByteArrayOutputStream bos = new ByteArrayOutputStream((int) file.length());BufferedInputStream in = null;try {in = new BufferedInputStream(new FileInputStream(file));short bufSize = 1024;byte[] buffer = new byte[bufSize];int len1;while (-1 != (len1 = in.read(buffer, 0, bufSize))) {bos.write(buffer, 0, len1);}byte[] var7 = bos.toByteArray();return var7;} finally {try {if (in != null) {in.close();}} catch (IOException var14) {var14.printStackTrace();}bos.close();}}}
}
package com.example.test.util;/*** Base64 工具类*/
public class Base64Util {private static final char last2byte = (char) Integer.parseInt("00000011", 2);private static final char last4byte = (char) Integer.parseInt("00001111", 2);private static final char last6byte = (char) Integer.parseInt("00111111", 2);private static final char lead6byte = (char) Integer.parseInt("11111100", 2);private static final char lead4byte = (char) Integer.parseInt("11110000", 2);private static final char lead2byte = (char) Integer.parseInt("11000000", 2);private static final char[] encodeTable = new char[]{'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'};public Base64Util() {}public static String encode(byte[] from) {StringBuilder to = new StringBuilder((int) ((double) from.length * 1.34D) + 3);int num = 0;char currentByte = 0;int i;for (i = 0; i < from.length; ++i) {for (num %= 8; num < 8; num += 6) {switch (num) {case 0:currentByte = (char) (from[i] & lead6byte);currentByte = (char) (currentByte >>> 2);case 1:case 3:case 5:default:break;case 2:currentByte = (char) (from[i] & last6byte);break;case 4:currentByte = (char) (from[i] & last4byte);currentByte = (char) (currentByte << 2);if (i + 1 < from.length) {currentByte = (char) (currentByte | (from[i + 1] & lead2byte) >>> 6);}break;case 6:currentByte = (char) (from[i] & last2byte);currentByte = (char) (currentByte << 4);if (i + 1 < from.length) {currentByte = (char) (currentByte | (from[i + 1] & lead4byte) >>> 4);}}to.append(encodeTable[currentByte]);}}if (to.length() % 4 != 0) {for (i = 4 - to.length() % 4; i > 0; --i) {to.append("=");}}return to.toString();}
}
package com.example.test.util;import java.io.BufferedReader;
import java.io.DataOutputStream;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;/*** http 工具类*/
public class HttpUtil {public static String post(String requestUrl, String accessToken, String params)throws Exception {//String contentType = "application/x-www-form-urlencoded";String contentType = "application/json";return HttpUtil.post(requestUrl, accessToken, contentType, params);}public static String post(String requestUrl, String accessToken, String contentType, String params)throws Exception {String encoding = "UTF-8";if (requestUrl.contains("nlp")) {encoding = "GBK";}return HttpUtil.post(requestUrl, accessToken, contentType, params, encoding);}public static String post(String requestUrl, String accessToken, String contentType, String params, String encoding)throws Exception {// String url = requestUrl + "?access_token=" + accessToken;String url = requestUrl;return HttpUtil.postGeneralUrl(url, contentType, params, encoding);}public static String postGeneralUrl(String generalUrl, String contentType, String params, String encoding)throws Exception {URL url = new URL(generalUrl);// 打开和URL之间的连接HttpURLConnection connection = (HttpURLConnection) url.openConnection();connection.setRequestMethod("POST");// 设置通用的请求属性connection.setRequestProperty("Content-Type", contentType);// connection.setRequestProperty("Connection", "Keep-Alive");connection.setUseCaches(false);connection.setDoOutput(true);connection.setDoInput(true);// 得到请求的输出流对象DataOutputStream out = new DataOutputStream(connection.getOutputStream());out.write(params.getBytes(encoding));out.flush();out.close();// 建立实际的连接connection.connect();// 获取所有响应头字段Map<String, List<String>> headers = connection.getHeaderFields();// 遍历所有的响应头字段/* for (String key : headers.keySet()) {System.err.println(key + "--->" + headers.get(key));}*/// 定义 BufferedReader输入流来读取URL的响应BufferedReader in = null;in = new BufferedReader(new InputStreamReader(connection.getInputStream(), encoding));String result = "";String getLine;while ((getLine = in.readLine()) != null) {result += getLine;}in.close();// System.err.println("result:" + result);return result;}
}

6.调用返回结果

text中的即为识别出的文字,文字识别出来了,可以在java中进行text的获取判断,实现自己想实现的需求

{"msg":"","results":[{"data":[{"confidence":0.9984913468360901,"text":"只有自己变优秀了","text_box_position":[[182,357],[391,357],[391,380],[182,380]]},{"confidence":0.9871423244476318,"text":"其他的事情才会跟着好起来","text_box_position":[[181,391],[501,391],[501,414],[181,414]]}],"save_path":""}],"status":"000"}

测试图片

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-59HUgBiE-1656496465758)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20220629174229948.png)]

9984913468360901,“text”:“只有自己变优秀了”,“text_box_position”:[[182,357],[391,357],[391,380],[182,380]]},{“confidence”:0.9871423244476318,“text”:“其他的事情才会跟着好起来”,“text_box_position”:[[181,391],[501,391],[501,414],[181,414]]}],“save_path”:“”}],“status”:“000”}


测试图片
![在这里插入图片描述](https://img-blog.csdnimg.cn/a07158541f3449169bf7acb7ba7ee592.jpeg#pic_center)

利用Paddle OCR进行文字识别相关推荐

  1. Prizmo Pro for Mac(OCR图像文字识别工具)

    Prizmo Pro mac版可以自动扫描相机中的图片,可根据用户选择的文档类型进行特殊处理,支持常用的扫描仪.数码相机.iPhone.iPad 等,也支持自动截图桌面部分区域然后识别出文字,非常的有 ...

  2. 一篇文章搞定百度OCR图片文字识别API

    一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104 转载于:https://www.cnblogs.com/chongdongxia ...

  3. 使用腾讯OCR进行文字识别

    文章目录 OCR效果 配置腾讯云OCR准备工作 注册账号 创建秘钥 使用万象优图创建Bucket 操作指引 实现代码 生成签名 配置网络请求,调用OCR识别接口 写在后面 使用腾讯智能文字识别 OCR ...

  4. 【PC工具】更新在线图片文字识别工具,OCR免费文字识别工具

    微信关注 "DLGG创客DIY" 设为"星标",重磅干货,第一时间送达. 之前分享过两个windows上的OCR文字识别工具: [PC工具]更新!windows ...

  5. 阿里云 OCR 图片文字识别接口使用案例(java)

    阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...

  6. OCR图片文字识别,人工手动图片标注软件安装过程

    OCR图片文字识别,人工手动图片标注软件安装过程,本章关注标注软件的安装,启动过程 1. 下载 anaconda anaconda  下载慢的问题: 使用国内镜像地址下载: https://mirro ...

  7. TOOLFK工具-在线OCR图片文字识别工具

    本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...

  8. 比天若OCR,PandaOCR更方便使用的OCR扫描文字识别软件,易用AI

    目前市面上各种各样的OCR软件从技术上大概可以分为两大类,离线版和云端在线版.离线版的代表如 Abbyy FineReader,在线版如各大头部AI平台开放的OCR接口能力.一般在线版比离线版的识别能 ...

  9. ocr简易文字识别v1.41绿色版

    ocr简易文字识别可以高效的将网络图片或者本地图片进行文字识别,并且效率非常高,错误率也比较低,同时支持导出TXT.WORD格式的文档,点击下载就可以下载了! 使用方法: 直接将需要的图片拖入软件即可 ...

最新文章

  1. 有哪些时间管理的习惯?
  2. 自媒体敏感词大全_2020年自媒体软件大全,这里真的有大宝贝……
  3. MySQL 备份和恢复
  4. 日本原装进口雪平锅,煎炸炒煮全搞定,日本人用了 1000 年
  5. java获取数组的最小值_Java 数组获取最大和最小值的实例实现
  6. shell 脚本中 while 只执行一次
  7. 服务器上在哪修改my.in,wordpress plugin的SVN使用方法
  8. 『Python CoolBook』Cython_高效数组操作
  9. day3—python——文件操作
  10. Webstorm中html无Vue语法提示
  11. 网络安全扫盲贴 史上最全网络安全问题解答
  12. PS中部分常用快捷键整理
  13. 论坛mysql表设计_网站论坛如何制作—简单论坛数据库的设计与操作
  14. (原)red-green Image.合成三维立体效果, 红绿眼镜 3D图 ,三维图片的核心算法。googler.cc上面有完善的程序和源码下载。 网上以前的那个有错误,我纠正了下~!~
  15. mysql with ties_SQL SERVER使用WITH TIES获取前几行数据
  16. 【GO语言编程】(二)
  17. 网络安全学习第4篇-使用特征码和MD5对勒索病毒进行专杀,并对加密文件进行解密
  18. DLNA介绍(包括UPnP)
  19. 蓝桥杯 —— Web前端(数据交互类)【标题即题目链接,点击查看具体要求】
  20. 宠物之家网站大学生网页制作教程 学生HTML静态宠物网页设计作业成品 DIV布局简单动物网页制作代码

热门文章

  1. office2007无法将文件另存为PDF或发布XPS怎么办
  2. 安大计算机网络,浅谈计算机网络环境下的网络教学 安徽大学计算机教学部网络教学平台...
  3. 微信公众号 餐饮 前端源码_成都餐饮茶楼微信公众号开发方案
  4. 电子邮箱如何大量发送邮件?TOM VIP邮箱邮件群发的建议
  5. ping工作原理和使用
  6. ubuntu+for+android华为荣耀,华为荣耀magic book(锐龙版)安装ubuntu系统
  7. 教你如何使用免费的域名来访问电脑搭建的服务器
  8. Java重写+malformed,java.lang.IllegalArgumentException: MALFORMED 问题解决
  9. 简易矢量图形生成系统
  10. 怎么在线识别图片文字?说一个思路