Java快速集成OCR文字识别

  • 相关文章
  • 简介
  • 官方文档
  • Web 配置操作
    • 第一步:成为百度AI开放平台的开发者
    • 第二步:开通文字识别服务
      • 1. 领取免费测试资源
      • 2. 创建应用
    • 第三步:使用文字识别服务
      • 1. 添加OCR依赖
      • 2. 下载相关工具包
      • 3. 手写文字识别
      • 4. 获取access_token
    • 第四步:测试
  • 第五步:监控报表
  • 结束

相关文章

Java集成第三方OCR识别 ——代码篇

简介

文字识别OCR(Optical Character Recognition)提供多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一。广泛适用于金融服务、财税报销、法律政务、保险医疗、快递物流、交通出行、教育培训等场景,显著提升信息提取和录入效率,实现信息处理的“电子化”、“自动化”,助力企业加快数字化建设和智能化升级。

官方文档

https://cloud.baidu.com/doc/OCR/s/fk3h7xu7h

Web 配置操作

第一步:成为百度AI开放平台的开发者

要调用百度AI开放平台的文字识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者。

先点击注册百度账户,进入如下图的页面快速地建立一个百度账号。

第二步:开通文字识别服务

1. 领取免费测试资源

点击登录 文字识别控制台,找到「领取免费资源」按钮。


根据您的需求选择相应的文字识别接口,选择完成后点击「0元领取」,领取免费测试资源。

2. 创建应用

领取完免费测试资源后,您需要创建应用才可正式调用文字识别能力。

进入 文字识别控制台,点击 「创建应用」。


需要,填写完毕相应信息后,点击「立即创建」,即可完成应用的创建。应用创建完毕后,您可以点击左侧导航中的「应用列表」,进行应用查看。

然后就能看到创建完的应用 API KEY 以及 Secret KEY 了。以上两个信息是您应用实际开发的主要凭证,每个应用之间各不相同,请您妥善保管。

第三步:使用文字识别服务

1. 添加OCR依赖

     <dependency><groupId>com.google.code.gson</groupId><artifactId>gson</artifactId><version>2.8.6</version></dependency><dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>4.16.7</version></dependency>

2. 下载相关工具包

  • FileUtil
    https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
  • Base64Util
    https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
  • HttpUtil
    https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
  • GsonUtils
    https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3

3. 手写文字识别

注:这里以手写文字识别为例

package com.baidu.ai.aip;import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;import java.net.URLEncoder;/**
* 手写文字识别
*/
public class Handwriting {public static String handwriting(String picture) {String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting";try {String filePath = picture;byte[] imgData = FileUtil.readFileByBytes(filePath);String imgStr = Base64Util.encode(imgData);String imgParam = URLEncoder.encode(imgStr, "UTF-8");String param = "image=" + imgParam;// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。String accessToken = AuthService.getAuth();String result = HttpUtil.post(url, accessToken, param);System.out.println(result);return result;} catch (Exception e) {e.printStackTrace();}return null;}public static void main(String[] args) {Handwriting.handwriting("D:\\1493859062306177024.jpg");}}
}

access_token 通过API Key和Secret Key获取的access_token

4. 获取access_token


package com.baidu.ai.aip.auth;import org.json.JSONObject;import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;/*** 获取token类*/
public class AuthService {/*** 获取权限token* @return 返回示例:* {* "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",* "expires_in": 2592000* }*/public static String getAuth() {// 官网获取的 API Key 更新为你注册的String clientId = "*******************";// 官网获取的 Secret Key 更新为你注册的String clientSecret = "*******************";return getAuth(clientId, clientSecret);}/*** 获取API访问token* 该token有一定的有效期,需要自行管理,当失效时需重新获取.* @param ak - 百度云官网获取的 API Key* @param sk - 百度云官网获取的 Secret Key* @return assess_token 示例:* "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"*/public static String getAuth(String ak, String sk) {// 获取token地址String authHost = "https://aip.baidubce.com/oauth/2.0/token?";String getAccessTokenUrl = authHost// 1. grant_type为固定参数+ "grant_type=client_credentials"// 2. 官网获取的 API Key+ "&client_id=" + ak// 3. 官网获取的 Secret Key+ "&client_secret=" + sk;try {URL realUrl = new URL(getAccessTokenUrl);// 打开和URL之间的连接HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();connection.setRequestMethod("GET");connection.connect();// 获取所有响应头字段Map<String, List<String>> map = connection.getHeaderFields();// 遍历所有的响应头字段for (String key : map.keySet()) {System.err.println(key + "--->" + map.get(key));}// 定义 BufferedReader输入流来读取URL的响应BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));String result = "";String line;while ((line = in.readLine()) != null) {result += line;}/*** 返回结果示例*/System.err.println("result:" + result);JSONObject jsonObject = new JSONObject(result);String access_token = jsonObject.getString("access_token");return access_token;} catch (Exception e) {System.err.printf("获取token失败!");e.printStackTrace(System.err);}return null;}}

第四步:测试

  • 识别图片

  • 获取access_token

  • 识别文字

第五步:监控报表

在管理控制台可查看流量情况

结束

这样我们 使用Java实现第三方OCR识别功能就完成了,小伙伴们可以稍作修改,集成到各自的项目里,博主已经将自己集成的项目放在上方了,小伙伴们可自己下载安装。另外都已经看了这么久就关注博主和博主一起学习吧!

Java集成第三方OCR识别——文档篇相关推荐

  1. Java集成第三方支付宝(会员卡)——文档篇

    Java集成第三方会员卡--文档篇 简介 官方文档 相关文章 接入准备 获取会员信息 简介 API列表 商户会员卡 简介 API列表 文件上传 会员卡模板管理 开卡组件 会员卡管理 简介 获取会员信息 ...

  2. java 集成 v8_J2V8首页、文档和下载 - V8 的 Java 封装版本

    J2V8 是 V8 引擎的 Java 封装版本,注重性能和紧密集成. 示例代码:V8 v8 = V8.createV8Runtime(); V8Array result = v8.executeArr ...

  3. Java集成第三方oss对象存储——文档篇

    Java集成第三方oss对象存储--文档篇 相关文章 简介 官方文档 应用场景 Web 配置操作 添加依赖 创建存储空间 相关文章 简介 阿里云对象存储OSS(Object Storage Servi ...

  4. knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案

    knife4j knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案,前身是swagger-bootstrap-ui,取名kni4j是希望它能像一把匕首一样小巧,轻量, ...

  5. (一)JAVA基于OPENXML的word文档插入、合并、替换操作系列之基础篇

    (一)JAVA基于OPENXML的word文档插入.合并.替换操作系列之基础篇 前言 什么是Open Xml? Open XML SDK 这系列笔记要做点什么? 涉及技术点 关于word.openxm ...

  6. OCR技术识别文档的技术

    OCR技术识别文档的概括 我们常说的OCR.文字识别.OCR技术识别文档是指通过电子设备等将纸质上的文字识别出来,形成可编辑的文字. OCR技术识别文档的流程 随着扫描仪的普及与广泛应用,再加上摄像头 ...

  7. (五)、JAVA基于OPENXML的word文档插入、合并、替换操作系列之word文件合并[支持多文件]

    (五).JAVA基于OPENXML的word文档插入.合并.替换操作系列之word文件合并[支持多文件] 二.word合并的多种方案简单比较 三.基于Open Xml WordprocessingML ...

  8. java openxml 操作 word,(三)、JAVA基于OPENXML的word文档插入、合并、替换操作系列之html转word...

    (三).JAVA基于OPENXML的word文档插入.合并.替换操作系列之html转word 系列笔记传送门 富文本转word文档 准备待转换内容 内容清理与格式化 转换成word文档 输出结果展示 ...

  9. Java使用POI将doc文档转为Html

    Java使用POI将doc文档转为Html 前提 几个使用到的类 几个方法的理解 converter.setPicturesManager(xxxx) converter.processDocumen ...

最新文章

  1. 特斯拉AI总监:我复现了LeCun 33年前的神经网络,发现和现在区别不大
  2. Java的知识点20——包装类基本知识、包装类的用途、自动装箱和拆箱、包装类的缓存问题
  3. The Famous Clock(著名的钟)
  4. 程序员捅了个P0故障,公司股价反而涨了10%!
  5. 华为回怼特朗普;中兴首款 5G 上市;iPhone 可免息分期购买 | 极客头条
  6. python实现时间戳和时间格式转换以及当前时间,特定时间的前后偏移
  7. 数字盲打怎么练_键盘上的数字键怎么练才能盲打?
  8. 一款非常好用的日期插件(强烈推荐)
  9. 有哪些 Java 源代码看了后让你收获很多,代码思维和能力有较大的提升?
  10. 微信小程序通过code去获取微信用户的加密信息
  11. Linux rsync命令用法
  12. Mysql8.0 忘记密码怎么办
  13. Java static与final详细讲解
  14. 数据存储|信息安全技术在SSD中的应用分享
  15. Android屏幕刷新——源码分析
  16. 对对碰java_Java开发学习之用Java打造一款对对碰游戏(下篇)
  17. 运放电路正负反馈判断方法--瞬时极性法
  18. java mp4 视频时间戳_如何在MP4视频文件上批量修改时间戳记元数据
  19. 自动化脚本编程框架(代码篇)
  20. 摩拜胡玮炜卸任CEO了!破产大潮下,一个造富假象的破裂

热门文章

  1. linux添加清华源,添加清华大学的源
  2. 每种情况的最佳编程语言
  3. 批量删除订阅kindle、kindle touch 推送
  4. well-posed problem and ill-posed problem
  5. shell编程扩展----文本编辑器
  6. ais解码算法c语言,AIS数据解码分析.pdf
  7. 【论文总结】Meta-Learning for semi-supervised few-shot classification(附翻译)
  8. 微信小程序之页面之间四种通讯方式
  9. Nginx 网站使用 acme配置 https证书访问步骤
  10. 什么是Redis ?