java怎么实现华为云文字识别,华为云语音识别:一句话识别API调用
最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别)
查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别
名称
功能
录音文件识别
可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。
一句话识别
可以实现语音到文字的转换。支持垂直领域定制,对应领域转换效果更佳。
在看了这两种模式后,选择了一句话识别,方便在下位机方面进行开发(前些时间已经实现STM32对语音文件实现8K采样率16bit的PCM格式WAV文件生成)
跳转到一句话识别的API介绍(https://support.huaweicloud.com/api-sis/api-sis.pdf),发现使用时需要先获取该用户的token(呃 通过拨打华为云的客服电话解决了这个问题)
获取用户Token采用POST方式,地址格式为:
针对不同的服务端点选择Endpoint,后缀是相同的/v3/auth/tokens
此时使用华为云推荐的软件(Postman)来实现这个过程
使用这个地址, 进行提交
此时会反馈你的Token(只能使用24小时),如果打算长期使用请选择SDK (https://support.huaweicloud.com/sdkreference-sis/sis_05_0004.html),目前只有JAVA格式的,本文主要介绍API方式
得到Token就可以进行语音识别啦!!这里还是使用POST的方式,此时地址会发送改变,一句话语音识别的两个服务端点为:
区域名称
终端节点(Endpoint)
华北-北京一
sis-ext.cnnorth-1.myhuaweicloud.com
华北-北京四
sis-ext.cnnorth-4.myhuaweicloud.com
因为我的是华北-北京四,这里选择sis-ext.cnnorth-4.myhuaweicloud.com,继续查看该API手册,发现对于提交语音数据的包格式定义如下:
此时POST地址为: https://sis-ext.cn-north-4.myhuaweicloud.com/v1/{projectid}/asr/short-audio
获取Projectid的方式:将光标放在用户名下面选择我的凭证:
得到projectid后开始发包:
我采用的是WAV自识别模式,使用的WAV文件为AU生成的录音文件,利用BASE64编码转换后进行发送:
data数据为转码后的base64格式,因为太长就不放上来了。此时点击SEND
测试成功,本篇结束。
java怎么实现华为云文字识别,华为云语音识别:一句话识别API调用相关推荐
- JAVA基于百度云文字(车牌、身份证、图片)识别提取
基于百度云文字(车牌.身份证.图片)识别提取 由于自己想写一个停车场项目,所以去查询了百度API文档,可以实现所有图片中文字的提取,此贴为傻瓜式教程,希望所有像我一样的初学者都可以看懂,有所收获,话不 ...
- Java web与web gis学习笔记(二)——百度地图API调用
系列链接: Java web与web gis学习笔记(一)--Tomcat环境搭建 Java web与web gis学习笔记(二)--百度地图API调用 JavaWeb和WebGIS学习笔记(三)-- ...
- 腾讯云---语音识别--一句话识别
一.导包 <!--腾讯云 语音识别--><dependency><groupId>com.tencentcloudapi</groupId><ar ...
- js语音识别_js 语音识别_js 语音识别库 - 云+社区 - 腾讯云
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 录音文件识别请求,数据结构,android sdk,ios sdk,自学 ...
- js 语音识别_js语音识别_js 语音识别库 - 云+社区 - 腾讯云
广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 录音文件识别请求,数据结构,android sdk,ios sdk,自学习模型,使 ...
- 离线语音识别库_离线语音识别_离线语音识别sdk - 云+社区 - 腾讯云
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 但录音存储成单声道 识别结果是否可以把两人的对话分离开采样率普通话录音文 ...
- 华为云-文字识别OCR-身份证识别
什么是文字识别 文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式. OCR以开放API(Ap ...
- 华为云语音识别:一句话识别API调用
最近想做一个智能硬件(实现单片机使用W600连接上位机或直接实现语音识别) 查看了华为云的语音交互服务SIS,有两种:录音文件识别以及一句话语音识别 名称 功能 录音文件识别 可以实现5小时以内的音频 ...
- 【愚公系列】华为云系列之ModelArts+AppCube带你识别101种西式美食【我的低代码AI体验】
文章目录 前言 1.ModelArts是什么 2.AppCube是什么 一.华为云系列之ModelArts+AppCube带你识别101种西式美食 1. AI Gallery 订阅模型及部署 2. 获 ...
最新文章
- 【转】ActiveMQ消息传送机制以及ACK机制详解
- 网站栏目页要如何进行优化呢?
- 系统编程(ISP)与应用编程(IAP)的区别!
- git拉取代码报错:Permission denied (publickey) 解决方案
- linux6.5禁用防火墙,Centos6.5,Centos7分别关闭selinux和防火墙
- Python游戏编程(一)“猜数字”游戏
- 卡巴斯基v6.0激活码
- Paragon ntfs2022轻松让mac读写NTFS格式磁盘移动硬盘U盘
- FastReport 打印二维码多一位
- Mac能连接手机热点却无法上网问题解决
- 机器人动作编辑器说明
- ros2上怎样才能玩rmf?
- python模拟登录qq邮箱
- 钉钉企业内部开发工具配置
- C++扬帆远航——4(百钱百鸡)
- 一次失败的j2v8集成
- .NET获取硬盘序列号的几个方法
- 内核启动分析(三)——zImage 解压缩阶段
- python生成格雷码
- 曲率的基本概念 (式子记住!)
热门文章
- python -m pip install --upgrade pip更新pip报错终极解决方法
- curl 错误:unable to verify the first certificate 解决办法
- MTK之Flash篇二---如何调整Flash中FAT的配置
- 混合波束成形| 论文:基于MMSE准则的混合波束成形算法
- 使用python爬取高德POI数据,并转换为WGS84经纬度坐标的点矢量
- 亚马逊、敦煌、速卖通、阿里国际站、lazada、shopee、ebay、wish、wayfair、mercari、沃尔玛、newegg 跨境电商运营实战攻略
- Android中的优化问题
- 数据可视化学习笔记一——概述
- 风影ASP.NET基础教学16 母版页
- 十五天学会Autodesk Inventor,看完这一系列就够了(二),软件界面