最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别)

查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别

名称

功能

录音文件识别

可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。

一句话识别

可以实现语音到文字的转换。支持垂直领域定制,对应领域转换效果更佳。

在看了这两种模式后,选择了一句话识别,方便在下位机方面进行开发(前些时间已经实现STM32对语音文件实现8K采样率16bit的PCM格式WAV文件生成)

跳转到一句话识别的API介绍(https://support.huaweicloud.com/api-sis/api-sis.pdf),发现使用时需要先获取该用户的token(呃 通过拨打华为云的客服电话解决了这个问题)

获取用户Token采用POST方式,地址格式为:

针对不同的服务端点选择Endpoint,后缀是相同的/v3/auth/tokens

此时使用华为云推荐的软件(Postman)来实现这个过程

使用这个地址, 进行提交

此时会反馈你的Token(只能使用24小时),如果打算长期使用请选择SDK (https://support.huaweicloud.com/sdkreference-sis/sis_05_0004.html),目前只有JAVA格式的,本文主要介绍API方式

得到Token就可以进行语音识别啦!!这里还是使用POST的方式,此时地址会发送改变,一句话语音识别的两个服务端点为:

区域名称

终端节点(Endpoint)

华北-北京一

sis-ext.cnnorth-1.myhuaweicloud.com

华北-北京四

sis-ext.cnnorth-4.myhuaweicloud.com

因为我的是华北-北京四,这里选择sis-ext.cnnorth-4.myhuaweicloud.com,继续查看该API手册,发现对于提交语音数据的包格式定义如下:

此时POST地址为: https://sis-ext.cn-north-4.myhuaweicloud.com/v1/{projectid}/asr/short-audio

获取Projectid的方式:将光标放在用户名下面选择我的凭证:

得到projectid后开始发包:

我采用的是WAV自识别模式,使用的WAV文件为AU生成的录音文件,利用BASE64编码转换后进行发送:

data数据为转码后的base64格式,因为太长就不放上来了。此时点击SEND

测试成功,本篇结束。

java怎么实现华为云文字识别,华为云语音识别:一句话识别API调用相关推荐

  1. JAVA基于百度云文字(车牌、身份证、图片)识别提取

    基于百度云文字(车牌.身份证.图片)识别提取 由于自己想写一个停车场项目,所以去查询了百度API文档,可以实现所有图片中文字的提取,此贴为傻瓜式教程,希望所有像我一样的初学者都可以看懂,有所收获,话不 ...

  2. Java web与web gis学习笔记(二)——百度地图API调用

    系列链接: Java web与web gis学习笔记(一)--Tomcat环境搭建 Java web与web gis学习笔记(二)--百度地图API调用 JavaWeb和WebGIS学习笔记(三)-- ...

  3. 腾讯云---语音识别--一句话识别

    一.导包 <!--腾讯云 语音识别--><dependency><groupId>com.tencentcloudapi</groupId><ar ...

  4. js语音识别_js 语音识别_js 语音识别库 - 云+社区 - 腾讯云

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 录音文件识别请求,数据结构,android sdk,ios sdk,自学 ...

  5. js 语音识别_js语音识别_js 语音识别库 - 云+社区 - 腾讯云

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 录音文件识别请求,数据结构,android sdk,ios sdk,自学习模型,使 ...

  6. 离线语音识别库_离线语音识别_离线语音识别sdk - 云+社区 - 腾讯云

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 但录音存储成单声道 识别结果是否可以把两人的对话分离开采样率普通话录音文 ...

  7. 华为云-文字识别OCR-身份证识别

    什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式. OCR以开放API(Ap ...

  8. 华为云语音识别:一句话识别API调用

    最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别) 查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别 名称 功能 录音文件识别 可以实现5小时以内的音频 ...

  9. 【愚公系列】华为云系列之ModelArts+AppCube带你识别101种西式美食【我的低代码AI体验】

    文章目录 前言 1.ModelArts是什么 2.AppCube是什么 一.华为云系列之ModelArts+AppCube带你识别101种西式美食 1. AI Gallery 订阅模型及部署 2. 获 ...

最新文章

  1. 【转】ActiveMQ消息传送机制以及ACK机制详解
  2. 网站栏目页要如何进行优化呢?
  3. 系统编程(ISP)与应用编程(IAP)的区别!
  4. git拉取代码报错:Permission denied (publickey) 解决方案
  5. linux6.5禁用防火墙,Centos6.5,Centos7分别关闭selinux和防火墙
  6. Python游戏编程(一)“猜数字”游戏
  7. 卡巴斯基v6.0激活码
  8. Paragon ntfs2022轻松让mac读写NTFS格式磁盘移动硬盘U盘
  9. FastReport 打印二维码多一位
  10. Mac能连接手机热点却无法上网问题解决
  11. 机器人动作编辑器说明
  12. ros2上怎样才能玩rmf?
  13. python模拟登录qq邮箱
  14. 钉钉企业内部开发工具配置
  15. C++扬帆远航——4(百钱百鸡)
  16. 一次失败的j2v8集成
  17. .NET获取硬盘序列号的几个方法
  18. 内核启动分析(三)——zImage 解压缩阶段
  19. python生成格雷码
  20. 曲率的基本概念 (式子记住!)

热门文章

  1. python -m pip install --upgrade pip更新pip报错终极解决方法
  2. curl 错误:unable to verify the first certificate 解决办法
  3. MTK之Flash篇二---如何调整Flash中FAT的配置
  4. 混合波束成形| 论文:基于MMSE准则的混合波束成形算法
  5. 使用python爬取高德POI数据,并转换为WGS84经纬度坐标的点矢量
  6. 亚马逊、敦煌、速卖通、阿里国际站、lazada、shopee、ebay、wish、wayfair、mercari、沃尔玛、newegg 跨境电商运营实战攻略
  7. Android中的优化问题
  8. 数据可视化学习笔记一——概述
  9. 风影ASP.NET基础教学16 母版页
  10. 十五天学会Autodesk Inventor,看完这一系列就够了(二),软件界面