百度云官网:

百度智能云-智能时代基础设施百度智能云专注云计算、智能大数据、人工智能服务,提供稳定的云服务器、云主机、云存储、CDN、域名注册、物联网等云服务,支持API对接,快速备案等专业解决方案。https://cloud.baidu.com/

一、OCR(文字识别)功能

首先在百度智能云官网注册登录百度云账号,点击管理控制台之后点击文字识别:

点击创建应用,按照要求填写即可,注意在接口选择中选择自己需要的接口,设置完成点击立即创建:

创建成功之后在应用列表可以查看到该应用的AppID、API Key、Secret Key:

这三个参数会在项目里面使用到,用于连接此应用:

java项目写法:

public class GeneralRecognition {//设置APPID/AK/SKpublic static final String APP_ID = "";public static final String API_KEY = "";public static final String SECRET_KEY = "";private static AipOcr client = null;public static void main(String[] args) throws IOException, URISyntaxException {File file = new File(chooseFile());Desktop desktop = Desktop.getDesktop();desktop.open(file);
//            URI uri = new URI("E:\\");
//            desktop.browse(uri);dis(file.getPath());}//选择文件进行上传public static String chooseFile() {FileSystemView fsv = FileSystemView.getFileSystemView();JFileChooser fileChooser = new JFileChooser();fileChooser.setCurrentDirectory(fsv.getHomeDirectory());fileChooser.setDialogTitle("请选择要上传的文件...");fileChooser.setApproveButtonText("确定");fileChooser.setFileSelectionMode(JFileChooser.FILES_ONLY);int result = fileChooser.showOpenDialog(null);if (JFileChooser.APPROVE_OPTION == result) {String path = fileChooser.getSelectedFile().getPath();return path;}return "没有找到";}public static void init(){// 初始化一个AipOcrif(client == null){client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);}// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);}//普通文字识别public static void dis(String path){init();// 传入可选参数调用接口HashMap<String, String> options = new HashMap<>();options.put("language_type", "CHN_ENG");options.put("detect_direction", "true");options.put("detect_language", "true");options.put("probability", "true");//参数为本地图片路径JSONObject res = client.basicGeneral(path, options);System.out.println(res.toString(2));
}

中间在调用其中的接口的时候遇到了一点问题:

[main] INFO com.baidu.aip.client.BaseClient - get access_token success. current state: STATE_AIP_AUTH_OK
{"error_msg": "No permission to access data","error_code": 6
}Process finished with exit code 0

原因是没有方法(API)的使用权限。

类似于这样的错误信息可以在应用的错误信息中查看到:

解决步骤:

1、进入到应用列表,如下图:

2、依次点击管理、编辑,除了此应用默认勾选的接口,然后把其他需要使用的接口勾选上,还可以点击领取免费接口使用权限:

注意:有些接口是需要一些认证的,比如公安验证接口、身份证与名字比对接口就需要进行企业认证,提交企业认证才,认证通过之后还要在 您在控制台–人脸识别–离线采集SDK管理处按照流程进行申请才能使用,通过后会自动为您开通接口使用权限,一般2小时自动审批通过。

3、点击保存修改,再次调用,问题解决。

免费领取或者申请开通其他权限或付费审核通过之后就可以使用相关功能的API了, 还可以查看相关API的使用情况:

二、ASR(语音识别)功能

步骤和上边的文字识别步骤差不多,都是先在控制台找到文字识别或者语音识别模块,然后在相应功能模块创建应用,创建时或者创建之后注意配置一下接口权限以保证后面能正常调用相应的API,每一个应用有3个重要参数:APP id, API key, SECRET key,将这3个参数配置到项目中即可,下面是asr语音识别项目代码:

public class MandarinRecognition {//设置APPID/AK/SKpublic static final String APP_ID = "";public static final String API_KEY = "";public static final String SECRET_KEY = "";private static AipSpeech client = null;public static void main(String[] args) throws IOException, URISyntaxException {File file = new File(chooseFile());
//            Desktop desktop = Desktop.getDesktop();
//            desktop.open(file);
//            URI uri = new URI("E:\\");
//            desktop.browse(uri);System.out.println("正在准备输出。。");String outPutPath = "template/asrOutput.txt";dis(file.getPath(),outPutPath);}//选择文件进行上传public static String chooseFile() {FileSystemView fsv = FileSystemView.getFileSystemView();JFileChooser fileChooser = new JFileChooser();fileChooser.setCurrentDirectory(fsv.getHomeDirectory());fileChooser.setDialogTitle("请选择要上传的文件...");fileChooser.setApproveButtonText("确定");fileChooser.setFileSelectionMode(JFileChooser.FILES_ONLY);int result = fileChooser.showOpenDialog(null);if (JFileChooser.APPROVE_OPTION == result) {String path = fileChooser.getSelectedFile().getPath();return path;}return "没有找到";}public static void init(){// 初始化一个AipSpeechif(client == null){client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);}}//普通文字识别public static void dis(String imgPath, String outPutPath) throws IOException {init();// 传入可选参数调用接口HashMap<String, Object> options = new HashMap<>();options.put("dev_pid",1537);//参数为本地图片路径System.out.println(imgPath);/*** 原始 PCM 的音频格式必须符合16k 采样率、16bit 位深、单声道。支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。* 最长支持60s的录音文件。对文件大小没有限制,只对时长有限制。*/System.out.println(client.asr(imgPath, "pcm", 16000, options));}}

输出结果:

正在准备输出。。
E:\16k.pcm
[main] INFO com.baidu.aip.client.BaseClient - get access_token success. current state: STATE_AIP_AUTH_OK
{"result":["北京科技馆。"],"err_msg":"success.","sn":"238256483091644572246","corpus_no":"7063384013687529084","err_no":0}Process finished with exit code 0

OCR(文字识别)功能与ASR(语音识别)的java应用开发(基于百度智能云)相关推荐

  1. mac 文字识别软件ocr_Mac平台上一款免费的OCR文字识别功能的屏幕截图软件Screen OCR...

    今天小编为大家带来Mac平台上一款免费的OCR文字识别功能的屏幕截图软件Screen OCR for Mac(屏幕截图OCR工具)​www.macdown.com .使用这款截图ocr识别工具可以帮助 ...

  2. Unity实现OCR文字识别功能

    文章来源: 学习通http://www.bdgxy.com/ 普学网http://www.boxinghulanban.cn/ 智学网http://www.jaxp.net/ 表格制作excel教程h ...

  3. 基于百度智能云api识别验证码

    基于百度智能云api识别验证码 通过调用百度智能云api接口进行验证码识别并输出. 使用baidu-aip模块进行模拟client登录,client.basicgeneral()函数识别图片文字并返回 ...

  4. Linux下基于百度智能云平台人脸识别

    Linux下基于百度智能云平台人脸识别 1.百度智能云接口及简介 https://cloud.baidu.com/product/face   接口技术文档: 2.人脸检测属性分析项目示例  硬件平台 ...

  5. 基于百度智能云的人脸识别登陆系统

    基于百度智能云的人脸识别登陆系统 设计说明 后端项目结构 前端页面 项目版本1下载 使用说明 项目版本1的Gitee链接 项目版本2--基于人脸对比的登陆系统 项目2下载链接 版本2的Gitee链接 ...

  6. python查找文字在图片中的位置_图片中的文字竟然能如此快速提取?OCR文字识别功能简直太强大了...

    想一想你之前如何将线下收集的材料信息采录到线上系统的? 比如作为财务人员,员工凭发票报销费用,但是收集到发票录入信息是需要将发票种类名称.发票代码.纳税人识别号等各种信息录入到系统.你是不是还在一个字 ...

  7. JAVA实现百度OCR文字识别功能

    转自:http://blog.csdn.net/javagirlone/article/details/47807963 闲来无事,发现百度有一个OCR文字识别接口,感觉挺有意思的,拿来研究一下. 百 ...

  8. python基于百度智能云实现批量身份证信息识别(附完整代码,可直接使用)

    百度智能云配置 一.登录 登录百度智能云,找到卡证文字识别,点击立即使用 地址: https://cloud.baidu.com/product/ocr_cards 二.创建应用 创建一个应用,过程不 ...

  9. 人脸识别——基于百度智能云实现

    百度智能云是百度旗下面向企业.开发者和政府机构的智能云计算服务商,致力于为各行业提供以ABC(人工智能.大数据.云计算)技术为一体的平台服务. 对于开发者而言,灵活利用其提供的大量模块化接口,可快速完 ...

最新文章

  1. 用看板工具leangoo做人事招聘
  2. Dubbo和Zookeeper
  3. sql server2005 通用分页方法
  4. c++ requests网络请求库
  5. Lua脚本语言应用场景
  6. C#异步编程のParallel(并行)
  7. 14 张Python数据科学速查表
  8. micropython按键控制流水灯_【micro:bit Micropython】The LED Display(1)控制像素点
  9. DIV+CSS列表式布局(同意图片的应用)
  10. ProjeQtOr(项目管理软件) v9.0.2
  11. java中位操作_Java中使用位操作的几个小技巧
  12. node.js超过php,在nodejs中如何解决超出最大的调用栈错误
  13. 32位系统和x86的关系?
  14. mysql主键和外键的连接_MySQL主键和外键使用及说明
  15. 小程序未来移动社交电商!
  16. 米家扫地机器人静音模式在哪_贵了300块的米家扫地机器人1S 还是那个性价比神器吗?...
  17. 大数据—数据收集系统介绍(Flume,Sqoop)
  18. 2021北航计算机考研人数,惊了!2021考研人数422万?!淘汰率或超过70%?8所高校报考人数汇总...
  19. echarts:饼图标签formatter的使用/饼图自定义标签
  20. [.NET基础]走进各种位运算

热门文章

  1. VUE利用webpack创建项目失败--离线安装webpack下载模板
  2. 电脑蓝屏代码0x00000050怎么解决?3种方法快速解决
  3. LSF-SCNN:一种基于CNN的短文本表达模型及相似度计算的全新优化模型
  4. 学习状态通道,Part-3:多跳交易/中心辐射通道
  5. OpenBionics外骨骼项目介绍|BCIduino社区整理
  6. “此站点的连接不安全问题”解决办法
  7. aop 获取方法入参出参_Spring AOP获取请求URL的入参及返回值(通用方法)
  8. 数据库设计方法、规范与技巧(推荐)
  9. 1060 爱丁顿数 (25 分)
  10. 2022最新面试题-更新中