html5语音听写流式,iOS 讯飞语音听写(流式版)
最近项目中用到了讯飞的语音识别,然后稍微看了一下,里面有几个值得注意的点,记录一下,先说语音听写(流式版),实时语音转写后期会附上 ,文末有 demo
//语音听写(流式版)
语音听写流式版其实没设么好说的,因为直接有 SDK,导入项目就可以了,需要注意的点就是每个创建的 APP 和 SDK 是对应的,所以需要创建项目以后,点击控制台,在对应的项目里面下载 SDK,要不会有问题,下面上对可能出现的问题和代码
27670DD7-367B-4D3F-8514-1D5E8A124A36.png
还有一个问题(是目前我遇到的,不一定通用)报错如下
20AC10D1-11FD-4156-B4F9-9599ACFABBD3.png
解决办法:我圈住这两个必须在这个地方显示,要不就会报错(我是连着两次导入,才显示出来)
C89699DD-6C1C-4300-A601-D1CE7FE2D986.png
主要代码(写了部分注释,详情见 demo,简单总结了一下,可以直接调用):
//清空上一段听到的内容
[self.recognizer setParameter:@"" forKey:[IFlySpeechConstant PARAMS]];
//设置业务类型
[self.recognizer setParameter:@"iat" forKey:[IFlySpeechConstant IFLY_DOMAIN]];
//设置语言
[self.recognizer setParameter:@"zh_cn" forKey:[IFlySpeechConstant LANGUAGE_CHINESE]];
//设置普通话
[self.recognizer setParameter:@"mandarin" forKey:[IFlySpeechConstant ACCENT]];
//超出时间 单位ms 最长 14s
[self.recognizer setParameter:@"14000" forKey:[IFlySpeechConstant SPEECH_TIMEOUT]];
//前断点超时(即开始检测以后多少秒没检测到说话,直接结束当前的识别)
[self.recognizer setParameter:@"14000" forKey:[IFlySpeechConstant VAD_BOS]];
//后断点超时(即说话以后多少秒没检测到再次说话,直接结束当前的识别)
[self.recognizer setParameter:@"14000" forKey:[IFlySpeechConstant VAD_EOS]];
//音频采样率 8K/16K
[self.recognizer setParameter:@"16000" forKey:[IFlySpeechConstant SAMPLE_RATE]];
//标点
[self.recognizer setParameter:@"1" forKey:[IFlySpeechConstant ASR_PTT]];
//音频源
[self.recognizer setParameter:@"1" forKey:@"audio_source"];
//返回值类型
[self.recognizer setParameter:@"json" forKey:[IFlySpeechConstant RESULT_TYPE]];
[self.recognizer setDelegate:self];
-(void)startMSC:(MSCSuccess)success{
self.MSCStr = @"";
self.success = success;
BOOL res = [self.recognizer startListening];
if (res) {
NSLog(@"准备就绪开始听写");
}else{
NSLog(@"准备过程出现错误");
}
}
//停止录音识别此次回话
-(void)stopRecord{
[self.recognizer stopListening];
}
//取消录音,并舍弃此次回话
-(void)cancelRecord{
[self.recognizer cancel];
}
//结果回调
-(void)onResults:(NSArray *)results isLast:(BOOL)isLast{
NSMutableString *resultString = [[NSMutableString alloc] init];
NSDictionary *Dic = results[0];
for (NSString *key in Dic) {
[resultString appendFormat:@"%@",key];
}
NSString *result = [ISRDataHelper stringFromJson:resultString];
self.MSCStr = [NSString stringWithFormat:@"%@%@",self.MSCStr,result];
self.success(self.MSCStr?:@"");
[self cancelRecord];
}
html5语音听写流式,iOS 讯飞语音听写(流式版)相关推荐
- 搜狗语音输入提示服务器繁忙,讯飞语音输入如何提高识别率 提高方法
讯飞语音是一款语音输入软件,能够帮助用户进行通过语音说话,进行智能识别,帮助用户在繁忙的时候,直接语音输入,不过语言描述要清晰哦!小编在这里分享一下识别率提高方法,不要错过哦! 讯飞语音输入如何提高识 ...
- iOS 讯飞语音的使用
一.下载讯飞的SDK 二.集成流程 第一步:获取appid(进入控制台查看) 第二步:工程配置 1.将模板项目的lib文件拉入项目,并加入依赖库 注意: 添加iflyMSC.framework时,请检 ...
- iOS: 讯飞语音的使用
一.介绍: 讯飞语音做的相当不错,容错率达到90%多,如果需要做语音方面的功能,它绝对是一个不错的选择.讯飞语音的功能很多:语音听写.语音识别.语音合成等,但我们最常用的还是语音听写.讯飞语音中包含界 ...
- android 讯飞语音 提示组件未安装,讯飞语音听写API 未安装组件 错误码21001
在使用讯飞语音听写时,使用云端听写而不是使用本地出现这个未安装组件错误那可能就是so文件没有成功导入.文档中都是ADT环境的配置,在AndroidStudio中jar包等都和ADT差别不大,但是SO文 ...
- iOS 讯飞语音之语音听写 录音的实现
引入库 第一步 获取appid appid是第三方应用集成讯飞开放平台SDK的身份标识,SDK静态库和appid是绑定的,每款应用必须保持唯一,否则会出现10407错误码.appid在开放平台申请应用 ...
- 百度语音android 集成,Android集成讯飞语音、百度语音、阿里语音识别
Python list嵌套 三维数组 cores_multicast = [[] for i in xrange(64)] temp_list = [0, 1] temp_list2 = [0, 3] ...
- “讯飞语音+”语音识别开放功能使用方法介绍
1"讯飞语音+"功能介绍 "讯飞语音+"主要提供的语音服务包括语音合成.语音识别.语义理解和语音搜索. 语音合成 讯飞语音+提供的语音合成服务包括在线语音合成与 ...
- 前端之实现讯飞语音听写(流式版)
第一次接到语音需求,用了几年的微信,你有关注过微信语音实时转文字功能吗?反正我是经常用,在这人山人海的大城市,为了解放双手又能及时回复好友,我经常用语音转文字. 没想到,一时用一时爽,自己开发火葬场. ...
- iOS使用讯飞语音-语音识别(最新版)
引言 去年在一家公司实习,接触了一点人工智能.既然接触人工智能,那么语音识别.语音合成.人脸识别等等都是必不可少的. 本来已经是离开iOS开发这条路了,还剩下毕业设计要做,所以这段时间最后一次回来接触 ...
最新文章
- Yolov4性能分析(下)
- 【每日一算法】种花问题
- leetcode算法题--一周中的第几天
- 基于容器原理(docker、lxc、cells)的Android 双系统设计概要
- python 之 linecache 用法记录
- 学嵌入式有两个诀窍:勤奋刻苦+不要脸
- 数值计算方法(一)——插值
- 格式当前时间mongodb date type
- c++ idea 插件_推荐 33 个 IDEA 最牛配置,写代码太爽了
- Maven安装与配置
- Oracle Solaris系统,诺禾
- 多种开关电源MOS管驱动电路详细解析
- netsh端口映射与端口转发
- laradock build elasticsearch 报错 unknown setting [cluster.initial_master_nodes] 的解决办法
- the kth number第几大数问题
- vb.net将excel表格数据填加到Listbox控件中并去重复选项
- 数学运算中浓度问题解题技巧集锦
- zend历程 之 ZendFramework-1.0.3
- KDD2021 | 左右互搏:基于协同对比学习的自监督异质图神经网络
- linux查看3306是哪个进程占用,linux查看端口占用