最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别)

查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别

名称 功能
录音文件识别

可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。

一句话识别 可以实现语音到文字的转换。支持垂直领域定制,对应领域转换效果更佳。

在看了这两种模式后,选择了一句话识别,方便在下位机方面进行开发(前些时间已经实现STM32对语音文件实现8K采样率16bit的PCM格式WAV文件生成)

跳转到一句话识别的API介绍(https://support.huaweicloud.com/api-sis/api-sis.pdf),发现使用时需要先获取该用户的token(呃 通过拨打华为云的客服电话解决了这个问题)

获取用户Token采用POST方式,地址格式为:

针对不同的服务端点选择Endpoint,后缀是相同的/v3/auth/tokens

此时使用华为云推荐的软件(Postman)来实现这个过程

使用这个地址, 进行提交

此时会反馈你的Token(只能使用24小时),如果打算长期使用请选择SDK (https://support.huaweicloud.com/sdkreference-sis/sis_05_0004.html),目前只有JAVA格式的,本文主要介绍API方式

得到Token就可以进行语音识别啦!!这里还是使用POST的方式,此时地址会发送改变,一句话语音识别的两个服务端点为:

区域名称 终端节点(Endpoint)
华北-北京一 sis-ext.cnnorth-1.myhuaweicloud.com
华北-北京四 sis-ext.cnnorth-4.myhuaweicloud.com

因为我的是华北-北京四,这里选择sis-ext.cnnorth-4.myhuaweicloud.com,继续查看该API手册,发现对于提交语音数据的包格式定义如下:

此时POST地址为: https://sis-ext.cn-north-4.myhuaweicloud.com/v1/{projectid}/asr/short-audio

获取Projectid的方式:将光标放在用户名下面选择我的凭证:

得到projectid后开始发包:

我采用的是WAV自识别模式,使用的WAV文件为AU生成的录音文件,利用BASE64编码转换后进行发送:

data数据为转码后的base64格式,因为太长就不放上来了。此时点击SEND

测试成功,本篇结束。 

华为云语音识别:一句话识别API调用相关推荐

  1. java怎么实现华为云文字识别,华为云语音识别:一句话识别API调用

    最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别) 查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别 名称 功能 录音文件识别 可以实现5小时以内的音频 ...

  2. 腾讯云---语音识别--一句话识别

    一.导包 <!--腾讯云 语音识别--><dependency><groupId>com.tencentcloudapi</groupId><ar ...

  3. 华为云OCR文字识别 免费在线体验!

    嘿,华为云OCR文字识别了解一下,免费在线体验! 物流行业快速提取运单信息.医疗/保险行业单据快速录入.政务办事人证检验,你知道这些都是如何实现的么? 答案就是:OCR文字识别! 作为AI时代效率倍增 ...

  4. 百度人脸识别API调用实现

    目录 一. 准备工作 A. 应用创建 1. 百度用户创建登录 2. 进入人脸识别服务 3. 应用创建 4.应用查看 B. 开发准备 1. 工具类下载 2. maven依赖注入 二. 调用实现 A. 看 ...

  5. 使用百度云的人脸识别API实现两张照片是否为同一人的判断

    今天是小编第一次使用百度云的人脸识别API,小编是个小白,一路坎坷,经过一天的学习与研究,终于实现了这个功能. 1.下面是在这个过程中使用的所有的工具: IntelliJ IDEA(Java的开发工具 ...

  6. php识别名片,基于php的聚合数据名片识别api调用实例

    基于php的聚合数据名片识别api调用实例 本代码是基于聚合数据名片识别api实现名片识别功能,使用前你需要通过http://www.doczj.com/doc/f71face3bed5b9f3f90 ...

  7. 运维实操——zabbix监控结合睿象云报警平台及API调用

    zabbix监控结合睿象云报警平台及API调用 1.zabbix监控结合睿象云报警平台 2.API调用 1.zabbix监控结合睿象云报警平台 由于我们不能时时刻刻盯着zabbix监控,所以呢,我们想 ...

  8. 百度文字识别API调用

    百度文字识别API调用 官网获取api和secret key 调用API接口 官网获取api和secret key 百度AI智能平台通用文字识别:https://ai.baidu.com/tech/o ...

  9. 华为云EI人脸识别接口初探

    0. 准备工作 开户及申请开通人脸识别服务,可以参考 https://education.huaweicloud.com:8443/courses/course-v1:HuaweiX+CBUCNXE0 ...

最新文章

  1. 倒计时1天,2018 AI开发者报名通道即将关闭(附参会提醒)
  2. Java编程思想(第4版)读书笔记——01
  3. 抽象SQL查询:SQL-MAP技术的使用
  4. windows 2012执行计划任务错误:操作员或系统管理员拒绝了请求(0x800710E0)
  5. oracle12c asmfd,Oracle 12C R2-新特性-自动配置ASMFD
  6. php 睡眠,php输出与sleep()
  7. 寄生式创业更容易成功
  8. beast单元库的总结
  9. 据说网易搜索引擎-超越GOOGLE
  10. Composer报错Could not find a matching version of package解决方式
  11. 安卓开发使用ttf文字_Android中正确使用字体图标(iconfont)的方法
  12. UVALive 5000 Underwater Snipers --二分
  13. 实验七——Web应用测试(bookstore项目上完成)
  14. AT24C02/04/08 地址理解
  15. DSP2812学习笔记-Flash固化操作
  16. 计算机正向着巨型化,目前计算机正向着巨型化、()、网络化、智能化方向发展。...
  17. 短信登录功能测试用例
  18. 尚硅谷java学习笔记第五天(数组上)
  19. CentOS7安装PHP开发环境1-源码安装Nginx
  20. oracle执行存储过程参数,Oracle定时任务执行存储过程带参数

热门文章

  1. Spring Boot 的配置文件有哪几种格式?它们有什么区别?
  2. 凯悦250家店数据外泄 多家高端酒店存安全漏洞
  3. 【Linux | 系统编程】Linux系统编程(文件、进程线程、进程间通信)
  4. 英语差python好学吗,英语不好可以学习编程嘛?
  5. onedrive 添加到本地硬盘_Windows平台下使用 Rclone 挂载 OneDrive 为本地硬盘
  6. 关于2020年测绘资质新旧变化一览表
  7. 搜狗输入法乱码 解决
  8. app测试移动应用测试 (功能测试)适合0基础学习
  9. 《VC++深入详解》第三章
  10. Python打包出现 failed to execute script xxx解决方法