5.16-在线词识别程序学习(ASR+IAT)
一些信息
6.bin文件夹是调试路径,里面文件的作用如下:
msc.dll是WIN32平台程序必需的动态库;
msc_x64.dll是x64平台程序必需的动态库;
msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1”改为“output=0”,“output=1”时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;
asr_keywords_utf8.txt是asrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++或UltraEdit等文本编辑软件;
gm_continuous_digit.abnf是asrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;
wav文件夹里面都是事先准备好的录音文件,分别用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result;
当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。
7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。
iat(语音听写)和asr(语音识别)均可以上传用户词列表,但目前不知道其区别。
ASR上传命令词程序学习
在TXT文件中添加关键词,重新上传获得GID,只需上传一次即可,记住ID,以便以后使用,若添加了新关键词,则需重新上传获得ID
若列表中没有这个词语,则显示结果与此类似:
The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca
对“喂你好我是一名大学生”添加不同种类关键词的影响
添加整句话,识别率高,效率低
长传新的词表后"科大讯飞"被识别为"歌华有线",此表中两个词语同时存在,将"歌华有线"删除,重新上传,将"科大讯飞"识别为"葛洲坝",4,5均无法识别,不知道激活时间有多长
经过一天等待,情况没有改善,应该仔细审读程序,消除Grammar的问题。
调整压缩比等上传参数,使得识别效果和消耗时间指标比较均衡
科大讯飞语音功能小结
科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!
这里我就不多余重复开发文档中的了,说一些自己的理解:
1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理
2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。
3.命令词和词表的区别在于:
命令词:语音识别的时候会只在命令词的范围内搜索
词表:语音识别优先从词表中搜索
4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional
5.如果想要自定义UI则须参考无UI的demo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片
6.grammerID可以跨平台使用
Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>
转载于:https://www.cnblogs.com/lizhensheng/p/11241940.html
5.16-在线词识别程序学习(ASR+IAT)相关推荐
- 翻译app上的图片文字信息提取好神奇?如何实现一个文字图片识别程序
web文字图片识别程序开发 摘要 一.tesseract-ocr介绍 二.安装tesseract 三.使用命令行 四.程序实现(Python) 五.程序实现(Java) 六.实验测试 七.总结 摘要 ...
- 深度学习声纹识别_kaldi/语音识别ASR/声纹识别SRE/资源汇总
化 按时间顺序降序排列,最新内容在最上面 最下方有一些我通过各方渠道偶然得知的技术交流qq群,感兴趣可以加入 刘斌总结的学习资源,中科院自动化所博士生,研究方向为鲁棒性声学建模. [语音识别]从入门到 ...
- 【毕业设计_课程设计】基于神经网络学习的在线纸币识别【源码+论文】
文章目录 0 项目说明 1 项目说明 2 系统设计 2.1 设计要求 2.2 设计方案 3 效果展示 4 论文目录 5 项目工程 0 项目说明 基于神经网络学习的在线纸币识别 提示:适合用于课程设计或 ...
- python手写字体程序_深度学习---手写字体识别程序分析(python)
我想大部分程序员的第一个程序应该都是"hello world",在深度学习领域,这个"hello world"程序就是手写字体识别程序. 这次我们详细的分析下手 ...
- 离线语音识别软件_6.语音板使用科大讯飞离线命令词识别
0x00 离线命令词识别简介 语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...
- 科大讯飞离线语音命令词识别的使用说明
最近因为项目的需求,需要在无网络的情况下实现语音识别的功能,因为之前在线识别一直用的科大的,所以经理就和我说,你花半天时间简单熟悉一下,然后出一个Demo,下午有人过来看:因为之前科大在线SR ...
- 研究生语音识别课程作业记录(二) 非特定人孤立词识别
研究生语音识别课程作业记录(二) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...
- 研究生语音识别课程作业记录(一) 非特定人孤立词识别
研究生语音识别课程作业记录(一) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...
- 研究生语音识别课程作业记录(三) 非特定人孤立词识别
研究生语音识别课程作业记录(三) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 实验总结 七. 小结 前言 研究生期间的语 ...
最新文章
- 安装python及web.py
- Python修饰符--函数修饰符 “@”
- std::cin 溢出_溢出:坦诚地工作与焦虑如何影响我的团队
- SAP License:利用MM的预留功能进行生产控制
- python一个对象只能被一个变量引用吗_Python中的变量、对象、引用
- 蓝桥杯 ADV-132 算法提高 笨小猴
- java 异常面试问题_Java异常面试问答
- 【转】Java中重载和重写的区别
- html选择时间区间控件,Html5添加用户选择一个日期时间范围的日期选择器插件教程...
- Mac中Safari浏览器转换IE各版本
- php有个schost.exe_全面认识Svchost.exe进程
- 定积分的基本性质1 线性性质
- 微信小程序开发学习—Day1
- 【小游戏】Flappy bird
- python基于pingouin包进行统计分析:使用tost函数执行单样本的双单侧检验(TOST)、以dataframe的形式输出分析结果(包含p值、自由度、bound等)
- JMF API 中文指导
- erLang中的标点符号
- ##一份关于食堂工作人员的报告
- 遥望星空补丁工具 V1.7
- 「软件」仿站小工具v9.0