一些信息

6.bin文件夹是调试路径,里面文件的作用如下:

msc.dll是WIN32平台程序必需的动态库;

msc_x64.dll是x64平台程序必需的动态库;

msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1”改为“output=0”,“output=1”时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;

asr_keywords_utf8.txt是asrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++或UltraEdit等文本编辑软件;

gm_continuous_digit.abnf是asrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;

wav文件夹里面都是事先准备好的录音文件,分别用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result;

当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。

7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。

iat(语音听写)和asr(语音识别)均可以上传用户词列表,但目前不知道其区别。

ASR上传命令词程序学习

在TXT文件中添加关键词,重新上传获得GID,只需上传一次即可,记住ID,以便以后使用,若添加了新关键词,则需重新上传获得ID

若列表中没有这个词语,则显示结果与此类似:

The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca

对“喂你好我是一名大学生”添加不同种类关键词的影响

添加整句话,识别率高,效率低

长传新的词表后"科大讯飞"被识别为"歌华有线",此表中两个词语同时存在,将"歌华有线"删除,重新上传,将"科大讯飞"识别为"葛洲坝",4,5均无法识别,不知道激活时间有多长

经过一天等待,情况没有改善,应该仔细审读程序,消除Grammar的问题。

调整压缩比等上传参数,使得识别效果和消耗时间指标比较均衡

科大讯飞语音功能小结

科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!

这里我就不多余重复开发文档中的了,说一些自己的理解:

1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理

2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。

3.命令词和词表的区别在于:

命令词:语音识别的时候会只在命令词的范围内搜索

词表:语音识别优先从词表中搜索

4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional

5.如果想要自定义UI则须参考无UI的demo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片

6.grammerID可以跨平台使用

Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>

转载于:https://www.cnblogs.com/lizhensheng/p/11241940.html

5.16-在线词识别程序学习(ASR+IAT)相关推荐

  1. 翻译app上的图片文字信息提取好神奇?如何实现一个文字图片识别程序

    web文字图片识别程序开发 摘要 一.tesseract-ocr介绍 二.安装tesseract 三.使用命令行 四.程序实现(Python) 五.程序实现(Java) 六.实验测试 七.总结 摘要 ...

  2. 深度学习声纹识别_kaldi/语音识别ASR/声纹识别SRE/资源汇总

    化 按时间顺序降序排列,最新内容在最上面 最下方有一些我通过各方渠道偶然得知的技术交流qq群,感兴趣可以加入 刘斌总结的学习资源,中科院自动化所博士生,研究方向为鲁棒性声学建模. [语音识别]从入门到 ...

  3. 【毕业设计_课程设计】基于神经网络学习的在线纸币识别【源码+论文】

    文章目录 0 项目说明 1 项目说明 2 系统设计 2.1 设计要求 2.2 设计方案 3 效果展示 4 论文目录 5 项目工程 0 项目说明 基于神经网络学习的在线纸币识别 提示:适合用于课程设计或 ...

  4. python手写字体程序_深度学习---手写字体识别程序分析(python)

    我想大部分程序员的第一个程序应该都是"hello world",在深度学习领域,这个"hello world"程序就是手写字体识别程序. 这次我们详细的分析下手 ...

  5. 离线语音识别软件_6.语音板使用科大讯飞离线命令词识别

    0x00 离线命令词识别简介 语音识别技术(Auto Speech Recognize,简称ASR),就是把人的自然语言音频数据转换成文本数据的技术.理论上在线ASR是可以把所有的语音转换成对应的文本 ...

  6. 科大讯飞离线语音命令词识别的使用说明

        最近因为项目的需求,需要在无网络的情况下实现语音识别的功能,因为之前在线识别一直用的科大的,所以经理就和我说,你花半天时间简单熟悉一下,然后出一个Demo,下午有人过来看:因为之前科大在线SR ...

  7. 研究生语音识别课程作业记录(二) 非特定人孤立词识别

    研究生语音识别课程作业记录(二) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...

  8. 研究生语音识别课程作业记录(一) 非特定人孤立词识别

    研究生语音识别课程作业记录(一) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 小结 前言 研究生期间的语音识别课程作业记 ...

  9. 研究生语音识别课程作业记录(三) 非特定人孤立词识别

    研究生语音识别课程作业记录(三) 非特定人孤立词识别 前言 一. 任务要求 二. 识别方法 三. 语音数据库 四. 特征参数提取 五. 识别过程及分析 六. 实验总结 七. 小结 前言 研究生期间的语 ...

最新文章

  1. 安装python及web.py
  2. Python修饰符--函数修饰符 “@”
  3. std::cin 溢出_溢出:坦诚地工作与焦虑如何影响我的团队
  4. SAP License:利用MM的预留功能进行生产控制
  5. python一个对象只能被一个变量引用吗_Python中的变量、对象、引用
  6. 蓝桥杯 ADV-132 算法提高 笨小猴
  7. java 异常面试问题_Java异常面试问答
  8. 【转】Java中重载和重写的区别
  9. html选择时间区间控件,Html5添加用户选择一个日期时间范围的日期选择器插件教程...
  10. Mac中Safari浏览器转换IE各版本
  11. php有个schost.exe_全面认识Svchost.exe进程
  12. 定积分的基本性质1 线性性质
  13. 微信小程序开发学习—Day1
  14. 【小游戏】Flappy bird
  15. python基于pingouin包进行统计分析:使用tost函数执行单样本的双单侧检验(TOST)、以dataframe的形式输出分析结果(包含p值、自由度、bound等)
  16. JMF API 中文指导
  17. erLang中的标点符号
  18. ##一份关于食堂工作人员的报告
  19. 遥望星空补丁工具 V1.7
  20. 「软件」仿站小工具v9.0

热门文章

  1. leetcode-242-有效的字母异位词
  2. springboot中的mybatis是如果使用pagehelper的
  3. Mac OS X Leopard 10.5.5 安裝手记 (Dell D830)
  4. [Catalan数三连]网格有趣的数列树屋阶梯
  5. 三、单一职责原则、开放-封闭原则、依赖倒转原则
  6. Nginx rewrite使用
  7. GIT 团队协作快速入门使用
  8. eclipse 中自定义EL表达式时创建tld文件
  9. hdu 5616 Jam's balance 正反背包+转换
  10. 【原转】使用获取subview获取子view