语音识别实验报告.docx
您所在位置:网站首页 > 海量文档
 > 幼儿/小学教育 > 小学课件
语音识别实验报告.docx14页
本文档一共被下载:次,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
语音识别实验报告
篇一:语音识别报告 “启动”的时域波形 1、 语音预加重: 由于语音信号在高频部分衰减,在进行频谱分析时,频率越高,所占的成分越小,进行语音预加重,可以提升语音高频部分,使频谱变得平坦,以方便进行频谱的分析和处理。通常的措施是采用数字滤波器进行预加重,传递函数是:H(z)?1??z?1,其中?一般去0.92-0.98之间,所以在计算的时候取0.9375。 预加重后的波形 2、 分帧 加窗 语音信号具有较强的时变特性,其特性是随时间变化的,但是语音的形成过程与发音器官的运动有关,这种物理运动比起声音振动的速度十分缓慢,在较短的时间内,语音信号的特征可以被认为是保持不变的,通常对语音处理是通过截取语音中的一段进行处理的,并且短段之间彼此经常有一些叠加,这一段语音成为一帧语音,语音段的长度称为帧长,对每一帧处理的结果可用一组数来表示。一般取帧长为10—30ms。采样频率是8000Hz,所以取的帧长是256,帧移是178。分帧之后加汉明窗。 3、 端点检测 端点检测从背景噪声中找出语音的开始和终止点。 短时能量就是每帧语音信号振幅的平方和。 En??[s(m)]; m?0N?1 短时能量曲线 短时过零率是每帧内信号通过零点的次数,是信号采样点符号的变化次数。 1N?1 Zn??sgn[x(m)]?sgn[x(m?1)]; 2m?0 “启动”的过零率曲线 在实验室的安静的环境下,依靠短时能量和短时过零率就可进行语音信号的起止点判断。当背景噪声较小时,没有语音信号的噪声能量很小,而语音信号的短时能量增大到了一定数值,可以区分语音信号的开始点和终止点。当背景噪声较大时,可以用短时平均过零率和短时能量结合来判断。 基于能量一过零率的端点检测一般使用两级判决法,在开始进行端点检测之前,首先为短时能量和过零率分别确定两个门限。整个语音信号的端点检测可以分为四段:静音、过渡音、语音段、结束时的静音段, (1)如果能量或过零率超越了低门限,就应该开始标记起点,进入过渡段。在过渡段中,由于参数的数值比较小,不能确信是否处于真正的语音段,因此只要两个参数的数值都回落到低门限以下,就将当前状态恢复到静音状态。而如果在过渡段中两个参数中的任一个超过了高门限,就可以确信进入语音段了,并标记起始点。 (2)如果当前状态之前处于语音段,而此时两个参数的数值降低到底门限以下,并且持续时间大于设定的最长时间门限,那么就认为语音结束了,返回到参数值降低到底门限以下的时刻,标记结束点。 端点检测波形 4、 特征提取 检测到语音的起点后就可以开始对检测出来的语音信号段中抽取语音识别所需的信号特征,语音特征参数是分帧提取的,每帧特征参数一般构成一个矢量,因此语音特征量是一个矢量序列。语音信号中提取出来的矢量序列经过数据压缩后便成为语音的模板。 目前,有效的特征参数有线形预测编码(LPC)系数,线形预测编码倒谱(LPCC)系数和Mel频率倒谱系数(MFCC),其中比较常用的是MFCC。 MFCC参数: 人耳对不同频率的声波有不同的听觉灵敏度,因此从低频到高频这一段频带内按临界带宽的大小由密到稀安排一组带通滤波器。对输入信号进行滤波,将每个带通滤波器输出的信号的量作为信号的基本特征,对此特征进行进一步处理后就可以作为语音识别系统的输入特征。 MFCC参数也是按帧计算的,计算通常采用如下的流程: (1)首先初始化Mel三角滤波器组,取滤波器的个数是24个,其中心频率依次为28Hz、89Hz、154Hz、224Hz、300Hz、383Hz、472Hz、569Hz、674Hz、787Hz、910Hz、1043Hz、1187Hz、1343Hz、1512Hz、1694Hz、1892Hz、2106Hz、2338Hz、2589Hz、3154Hz、3472Hz、3817Hz。 (2)首先对每一帧序列进行离散FFT变换,取模的平方得到离散功率谱。 (3)计算功率谱通过24个滤波器后所得的功率值,得到24个参数Pm,对Pm去取对数得到Lm。 (4)对Lm进行离散余弦变换, Cn??L m?124mcos(?(m?0.5)n/24) 得到MFCC参数,通常取前13个系数作为该语音的特征参数。 对每一帧进行MFCC的计算,就得到了一个行数是语音的帧数,列数是13的表征语音特征的矩阵。 5、 矢量量化 在特征提取之后,对矢量序列要进行矢量量化,就是用若干离散的数字值(或称为标号)来表示各帧的13维参数矢量。 矢量量化过程:将语音信号的 (1) 首先对矢量序列进行聚类,根据语音信号的特征矢量聚类得到另一组
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名:
验证码:
匿名?
发表评论
语音识别实验报告.docx相关推荐
- 信源压缩编码 编程c语言,霍夫曼信源编码实验报告.docx
霍夫曼信源编码实验报告.docx PAGE PAGE 7 实验1:霍夫曼信源编码综合设计[实验目的]通过本专题设计,掌握霍夫曼编码的原理和实现方法,并熟悉利用C语言进行程序设计,对典型的文本数据和图像 ...
- 西电java实验报告 界面_西电计算机Java上机实验报告.docx
西电计算机Java上机实验报告.docx 下载提示(请认真阅读)1.请仔细阅读文档,确保文档完整性,对于不预览.不比对内容而直接下载带来的问题本站不予受理. 2.下载的文档,不会出现我们的网址水印. ...
- android音乐播放器实验报告总结,音乐播放器设计实验报告.docx
音乐播放器设计实验报告.docx 实验报告课程名称数字系统设计实验指导老师成绩_____________实验名称音乐播放器设计实验实验类型设计型一.实验目的和要求(必填)二.实验内容和原理(必填)三. ...
- linux系统程序问题报告,Linux程序设计实验报告.docx
Linux程序设计实验报告.docx Linux程序设计实验指导书实验类别课内实验 实验课程名称Linux程序设计实验室名称软件工程专业实验室 实验课程编号 000 总 学 时32 学 分 2 适用专 ...
- 单片机c语言ad与da转换实验报告,单片机AD与DA转换实验报告.docx
单片机AD与DA转换实验报告.docx 下载提示(请认真阅读)1.请仔细阅读文档,确保文档完整性,对于不预览.不比对内容而直接下载带来的问题本站不予受理. 2.下载的文档,不会出现我们的网址水印. 3 ...
- 大学计算机网络配置实验报告,北京理工大学-计算机网络实践-IP路由配置与路由协议分析实验报告.docx...
北京理工大学-计算机网络实践-IP路由配置与路由协议分析实验报告.docx (9页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 9.9 积分 LAB2 ...
- 声速的测量的实验原理和应用_示波器的原理和使用声速测量实验报告.docx
示波器的原理和使用声速测量实验报告.docx 示波器的原理和使用.声速测量一实验目的1了解示波器的基本结构及其工作原理,学习并掌握示波器的基本使用方法2学习电信号有关参数的基本概念及其测量3了解声波在 ...
- matlab复杂噪声产生实验报告,基于小波信号的噪声消除matlab实验报告.docx
基于小波信号的噪声消除matlab实验报告.docx 南京师范大学物理科学与技术学院医用电子学论文论文名称:基于小波变换的心电信号噪声消除院系:物科院专业:电路与系统姓名:聂梦雅学号:12100204 ...
- 转炉炼钢计算机仿真实验报告,计算机仿真、实验报告.docx
计算机仿真.实验报告.docx 计算机仿真技术MATLAB实验报告实验一:实验内容:已知单位负反馈系统前向通道传递函数和其闭环传递函数分别为: 算法说明因为wn=1,所以分子num为1,这里我们用bc ...
最新文章
- 1047.删除字符串中的所有相邻重复项
- python api是什么_python – 如何处理API响应
- SVG技术入门:线条动画实现原理
- mel滤波器组频率响应曲线_了解二阶滤波器的奈奎斯特图
- JS -------------------设置弹出框位置屏幕的中间
- 【解决方案】kafka: client has run out of available brokers to talk to (Is your cluster reachable?)
- 数据库与表的操作之重命名、删除表
- R_ggplot2基础(四)
- 国内著名大师培训视频全集
- 打开并读取npy文件,查看文件内容
- 电子元件-发光二极管
- 用拉普拉斯变换求零状态响应_【解析几何】椭圆的仿射变换(伸缩变换)
- 1946电子计算机诞生什么影响,自1946年世界上第一台电子计算机诞生至今.doc
- Aspect Level Sentiment Classification with Deep Memory Network
- ThinkPad笔记本如何重装系统
- 001 计算思维-卡内基梅隆大学计算机系主任周以真(英汉对照版)
- java打印输出万年历_用Java编程输出万年历的功能实现
- 深度学习还没入门?看看深度学习三巨头的Deep Learning综述(4)
- 香鸡排三部曲:完结篇
- 298本R语言书籍免费送!!!
热门文章
- Metabase在linux二次开发编译环境搭建(之一---下载文件)
- (转)awk实例练习(二)
- 信息反馈-邮件(数据库是XML) (收集)
- 一些javascript的经验 (3)
- Bailian4140 方程求解【二分法】
- Bailian4068 判断是否可以构成等差数列【字符串流+排序】
- Bailian2715 谁拿了最多奖学金【分段计算处理】(Vijos P1001)
- 生僻词汇(地名,动植物名)
- /usr/bin/ld: cannot find -l*
- UNIX 环境高级编程(五)—— unistd.h