目录

  • 百度AI-语音识别&图片搜索
    • 准备工作
    • 语音识别
      • 第一步:左侧菜单选择`语音技术`
      • 第二步:语音识别主界面点击`创建应用`
      • 第三步:创建应用填写应用信息
      • 第四步:创建成功后进入应用列表查看
      • 第五步:点击上图左侧菜单`技术文档`
      • 第六步:按照下图打开语音快速入门文档
      • 第七步:阅读文档进行开发并调试
    • 语音合成
      • 一、点击`语音技术`页面右上角`管理控制台`
      • 二、在管理控制台进入`语音技术`主页
      • 三、语音技术主页选择`概览`-->`语音合成`
      • 四、领取`语音合成`免费次数
      • 五、点击`技术文档`进入语音技术API页面
      • 六、按照下图打开`语音合成API`文档
      • 七、阅读文档进行开发并调试
      • 注意
    • 图片搜索
      • (1)控制台主页左侧菜单选择`图像搜索`
      • (2)图像搜索主界面点击`创建应用`
      • (3)创建应用填写应用信息
      • (4)创建成功后进入应用列表查看
      • (5) 点击“应用名称”进入应用详情页面
      • (6)申请建库
      • (7)建库成功后,导入图片
      • (8)点击左侧`技术文档`进入技术文档
      • (9)阅读文档进行开发并调试
      • 注意
      • 注意

百度AI-语音识别&图片搜索

准备工作

1)在浏览器输入https://ai.baidu.com/ 打开Baidu大脑|AI开发平台首页

2)点击右上角控制台,进入用户注册登录界面

3)如果没有百度账号,可以先注册然后再进行登录;如果已经有了百度账号可以直接登录;登录成功后,进入控制台管理界面

4)进行实名认证(因百度AI有些功能需要用户实名认证才可使用,所以在这提前进行实名认证)

5)点击实名认证按钮进入实名认证页面(因我的账号已经进行过初级实名认证,实名认证内容大家按照提示进行即可)

到此准备工作结束,可以使用百度AI开发平台提供的API进行开发了

语音识别

第一步:左侧菜单选择语音技术

第二步:语音识别主界面点击创建应用

第三步:创建应用填写应用信息

第四步:创建成功后进入应用列表查看

第五步:点击上图左侧菜单技术文档

第六步:按照下图打开语音快速入门文档

第七步:阅读文档进行开发并调试

1)创建一个测试工程

​ speech_imageseach

2)根据API提示,导入百度AI所需依赖包

<!--百度AI依赖包-->
<dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>4.12.0</version>
</dependency>

3)编写测试代码

/*** @Auth: suihao* @Desc: 百度AI-语音识别、语音合成测试类* @DateTime: 2022/10/14 11:14*/
public class SpeechTest{//设置APPID/AK/SKpublic static final String APP_ID = "20616557";public static final String API_KEY = "YlvktyOpTrc7eOxqMQGUEAjM";public static final String SECRET_KEY = "EnAoDcoiBSqxRQp69bTKB3xBwZbGpOVR";/*** 功能描述:  语音识别* @return : void*/@Testpublic void speechRecognition() throws JSONException {// 初始化一个AipSpeechAipSpeech client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);// 可选:设置代理服务器地址, http和socket二选一,或者均不设置//client.setHttpProxy("proxy_host", proxy_port);  // 设置http代理//client.setSocketProxy("proxy_host", proxy_port);  // 设置socket代理// 可选:设置log4j日志输出格式,若不设置,则使用默认配置// 也可以直接通过jvm启动参数设置此环境变量//System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");// 调用接口JSONObject res = client.asr("E:/public/16k-23850.amr", "amr", 16000, null);System.out.println(res.toString(2));}
}

4)下载官网提供测试音频文件(也可以使用语音合成,自己使用语音合成接口合成语音文件)

5)测试结果

语音合成

语音技术已经包含了语音合成,但是语音合成免费次数需要我们手动领取才可以,下面我们使用语音合成来合成语音文件完成语音识别测试。

一、点击语音技术页面右上角管理控制台

二、在管理控制台进入语音技术主页

三、语音技术主页选择概览–>语音合成

四、领取语音合成免费次数

五、点击技术文档进入语音技术API页面

六、按照下图打开语音合成API文档

七、阅读文档进行开发并调试

1)在语音识别创建的speech_imageseach直接开发即可,它们所需环境都是一致的

1)所需jar包一致,不需要重新导入
2)所需APP_ID、API_KEY、SECRET_KEY一致不需要重新填写

2)编写测试代码

//直接在SpeechTest测试类中添加如下测试方法即可
@Test
public void speechSynthesis() throws JSONException{// 初始化一个AipSpeechAipSpeech client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);// 可选:设置代理服务器地址, http和socket二选一,或者均不设置//client.setHttpProxy("proxy_host", proxy_port);  // 设置http代理//client.setSocketProxy("proxy_host", proxy_port);  // 设置socket代理// 可选:设置log4j日志输出格式,若不设置,则使用默认配置// 也可以直接通过jvm启动参数设置此环境变量//System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");// 调用接口TtsResponse res = client.synthesis("Hello World", "suihao", 1, null);byte[] data = res.getData();JSONObject res1 = res.getResult();if (data != null) {try {Util.writeBytesToFileSystem(data, "E:/ai-speech/itcast.mp3");} catch (IOException e) {e.printStackTrace();}}if (res1 != null) {System.out.println(res1.toString(2));}
}

3)测试结果

代码测试返回结果

生成的音频文件

注意

使用`语音识别`,`语音合成`如果出现错误,根据错误code参考以下链接解决:`语音识别`: https://cloud.baidu.com/doc/SPEECH/s/Yk4o0bkop`语音合成`: https://cloud.baidu.com/doc/SPEECH/s/jk4nlz520

图片搜索

(1)控制台主页左侧菜单选择图像搜索

(2)图像搜索主界面点击创建应用

(3)创建应用填写应用信息

(4)创建成功后进入应用列表查看

(5) 点击“应用名称”进入应用详情页面

(6)申请建库


(7)建库成功后,导入图片

首先,选择要导入的图库,点击管理图库按钮

然后,上传图片并设置摘要信息


(8)点击左侧技术文档进入技术文档

(9)阅读文档进行开发并调试

1)创建一个测试工程(因工程已经存在可以直接在speech_imageseach工程中测试即可

2)根据API提示,导入百度AI所需依赖包(包也已经存在可以不用再次导入

 <!--百度AI依赖包-->
<dependency><groupId>com.baidu.aip</groupId><artifactId>java-sdk</artifactId><version>4.12.0</version>
</dependency>

3)编写测试代码

/*** @Auth: suihao* @Desc: 百度AI-图片搜索测试类* @DateTime: 2022/10/14 11:24*/
public class ImageSearchTest{//设置APPID/AK/SKpublic static final String APP_ID = "20617129";public static final String API_KEY = "O7SBMGthGxQd3rQkPIgGswdk";public static final String SECRET_KEY = "ApDvY5WN1Twsj1DAZADAdFxSZF8l7qt6";/*** 功能描述:  百度AI-图片搜索* @return : void*/@Testpublic void isearch() throws JSONException {AipSpeech client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);// 可选:设置网络连接参数client.setConnectionTimeoutInMillis(2000);client.setSocketTimeoutInMillis(60000);// 可选:设置代理服务器地址, http和socket二选一,或者均不设置//client.setHttpProxy("proxy_host", proxy_port);  // 设置http代理//client.setSocketProxy("proxy_host", proxy_port);  // 设置socket代理// 可选:设置log4j日志输出格式,若不设置,则使用默认配置// 也可以直接通过jvm启动参数设置此环境变量//System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");// 调用接口//String path = "E:\\img\\huaweiP40.jpg";//String path = "E:\\img\\huaweiNova7.jpg";String path = "E:\\img\\lianxiangM4000s.jpg";JSONObject res = client.productSearch(path, new HashMap<String, String>());System.out.println(res.toString(2));}
}

4)测试结果

注意

注意:
1、检索接口不返回原图,仅反馈入库时填写的brief信息,请调用入库接口时尽量填写可关联至本地图库的图片id或者图片url等信息。
2、检索接口默认返回TOP 300的结果,如果图库里不满300张图片,会返回所有图片,请入库足量图片以便充分测试效果。
3、原则上任何2张图片都有相似度,只不过分值有高低,应用时可结合接口返回的相关性分数score(取值范围0-1,越接近1代表相似度越高)进行筛选,如选取score大于某个值的结果进行应用。

4)测试结果

注意

注意:
1、检索接口不返回原图,仅反馈入库时填写的brief信息,请调用入库接口时尽量填写可关联至本地图库的图片id或者图片url等信息。
2、检索接口默认返回TOP 300的结果,如果图库里不满300张图片,会返回所有图片,请入库足量图片以便充分测试效果。
3、原则上任何2张图片都有相似度,只不过分值有高低,应用时可结合接口返回的相关性分数score(取值范围0-1,越接近1代表相似度越高)进行筛选,如选取score大于某个值的结果进行应用。

百度AI-语音识别图片搜索(Java)相关推荐

  1. 微信小程序实现图林机器人聊天和百度AI语音识别的简单人工客服

    用微信小程序实现简单的人工客服 最近在做软件工程的课程设计,选择性的做了微信小程序的简单的人工客服.在这里对该课程设计的原理和实现进行一个讲解,也算做一个总结和笔记,方便自己以后查看.复习和帮助大家的 ...

  2. Qt实践|HTTP知识点-使用百度AI语音识别服务

    目录 基本概念 代码与实例 基本概念 这里来简单介绍下百度的REST API文档,首先是获取Access Token 获取到了后,再发送请求,进行语音识别. 这里我采用Raw方式上传 这个就是百度AI ...

  3. 小福利,通过python利用百度ai实现图片识别

    大家好,我是天空之城,今天给大家带来小福利,通过python利用百度ai实现图片识别.有兴趣加qq群,纯学习,1098016198. 至于api接口的APP_ID ,API_KEY ,SECRECT_ ...

  4. 微信小程序-百度AI语音识别——(一)

    微信小程序-百度AI语音识别--(一) 一.百度AI 某天闲来无事在CSDN上看到有大神用百度语音识别+图灵机器人做了一个可以语音聊天(调戏人工智障 )的小demo,觉得挺有趣的,也想着实现一下. 百 ...

  5. Python——调用百度AI实现图片上文字识别

    Python--调用百度AI实现图片上文字识别 简介 步骤 安装百度AI库 注册百度AI开放平台 调用glob库 调用AipOcr库识别文字 可能会遇到的问题 批量操作 简介 Python免费调用百度 ...

  6. 【应用】Python调用百度AI实现图片上表格识别

    [应用]Python调用百度AI实现图片上表格识别 简介 步骤 安装百度AI库 注册百度AI开放平台 调用AipOcr库识别表格文字 可能遇到的问题 批量操作 简介 Python免费调用百度AI实现图 ...

  7. python利用百度AI进行图片识别与分类

    python利用百度AI进行图片识别与分类 声明 此博客纯属记录我学习的过程,是本人的一次大作业,如果程序中有问题或者有更好的实现方法希望各位前辈多多指点 背景 大多数人的相册都是乱七八糟的,动物的照 ...

  8. java 获取文件大小_利用百度AI OCR图片识别,Java实现PDF中的图片转换成文字

    序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...

  9. 百度AI实现图片转文字-python

    参考: 1.http://ai.baidu.com/docs#/OCR-Python-SDK/top 2.http://blog.csdn.net/wc781708249/article/detail ...

  10. 百度AI识别图片文字

    判断图片格式,转换为Jpg格式,为图片文字识别做准备 # !/usr/bin/env python # -*- coding: utf-8 -*- # 转换图片格式为jpg格式import os fr ...

最新文章

  1. maven 创建module失败 ,异常Unable to read parent POM
  2. Python收发邮件
  3. 三角函数公式、诱导公式
  4. 05.MyBtais两种取值符号以及输入参数和输出参数
  5. java 基础类型 包装类型
  6. Android_Kotlin原生开发_声明变量与内置数据类型---Kotlin工作笔记002
  7. 30岁学python有前途吗-我30岁了,转行学编程可以吗? 排除法告诉你答案
  8. UAC在注册表中的对应位置
  9. 8、网友问答之串口数据接收与数据强制转换---------labview宝典
  10. web前端布局方式总结
  11. 22-Consent 确认逻辑实现
  12. 苹果浏览器之简单应用
  13. 实现手机扫码直接拨打电话
  14. hsql统计两天数据差异的算法及lag()/led()分析函数的使用
  15. [debug004]_GPIO对地短路问题
  16. 可动平行平板电容建模策略
  17. android mediaplayer 实现歌曲边播放边下载
  18. java调用python 踩的坑
  19. 教你用Python感知女朋友的情绪变化?
  20. LinkedIn最好工具-领英精灵有哪些批量加好友方法?

热门文章

  1. 什么是示波器的采样率
  2. STM32压力传感器信号采集-24位AD HX720 HX711 原理介绍
  3. matlab功率放大器,基于MATLAB的C类功率放大器设计
  4. 用BoundsChecker检测内存泄漏
  5. 视频教程-【深入理解计算机网络】入门计算机网络基础视频课程(下)-计算机网络
  6. postgis 栅格数据_postGIS教程
  7. 监控网站与接口宕机,并推送 App 消息提醒的程序
  8. 【Java实现】南京地铁导航系统的简单实现(三)—— 图形化界面的设计
  9. mayapython常用模块_Maya中Python普及教程
  10. python热身教程_[转载]技术教程-MayaPython教程二之Python