平稳的随机过程是研究语音信号的主要手段,但是语音信号本身并不是平衡的。

一,语音信号不平稳

语音信号在产生过程中与环境和发声器官的联系很紧密,与各种运动都是相关的,信号本身是不平移的信号。主要是由于发声器官的运动不可预测带来的短时变。

但发声 器官的状态变化速度较声音振动的速度要缓慢的多,因此语音信号可以认为是短时平稳的。研究发现,在10~30ms的范围内,语音频谱特征和一些物理特征参 数基本保持不变。因此可以将平稳过程的处理方法和理论引入到语音信号的短时处理中,将语音信号划分为很多短时的语音段,每个短时的语音段称为一个分析帧。 这样,对一帧语音信号进行处理就相当于对特征固定的持续信号进行处理。

如果帧和帧之间都是连续的,那会不会出现帧和帧之间的信息可能会得不到处理的机会,为了避免这种情况,在分帧时需要确定一个帧移,也就是帧是叠加的,使帧和帧之间能够平滑的过渡,帧移一般都是取0~1/2之间的某一个值。我一般取2/5。

二,问题

在对语音信号进行分帧之后,然后每一帧都当成平稳信号来处理,后面我们会用傅里叶展开每一项,以获取Mel频谱特征,这时问题就出来了。如下效应会出现

将具有不连续点的周期函数(如矩形脉冲)进行傅立叶级数展开后,选取有限项进行合成。当选取的项数越多,在所合成的波形中出现的峰起越靠近原信号的不连续点。当选取的项数很大时,该峰起值趋于一个常数,大约等于总跳变值的9%。这种现象称为吉布斯效应。

这样就不好了,因为我们的帧在起始和结束肯定是会出现不连续情况的,那样这个信号在分帧之后,就会越来越背离原始信号,此时我们需要对信号进行加窗处理,目的很明显了,就是为了减少帧起始和结束的地方信号的不连续性问题。

三,加窗函数作用

在明白上面的问题之后,就知道为什么需要加窗了。另外,加窗之后是为了进行傅里叶展开,所以加窗的目的大致如下:

使全局更加连续,避免出现吉布斯效应。

加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。

四,hamming窗定义

hamming窗在matlab里有函数表示为hamming,如4hamming窗:

>> window=hamming(4)

window =

0.0800

0.7700

0.7700

0.0800

hamming的定义如下:

,在0~N以外,全是0。

当然也可以加其他的窗,如方窗,或者hann窗,但hamming窗应用比较多。

(lv_xinmy)

matlab语音分帧加窗,语音信号的加窗处理相关推荐

  1. 语音信号处理基础(五)——语音分帧与加窗

    文章目录 原理 1.加窗 2.分帧 一般而言语音处理的目的有两种: 一种是对语音信号进行分析,提取特征参数,用于后续处理: 提取的特征参数主要有语音的短时能量和平均幅度.短时平均过零率.短时自相关函数 ...

  2. 语音信号分析(语音分帧)

    语音分帧 不管是进行什么参数分析以及采用什么分析方法,都需要一些预先的处理,如语音信号的数字化.语音信号的端点检测.预加重.加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术.贯穿于语音分析全过程 ...

  3. 语音分帧的帧移怎样理解

    刚开始做音频信号处理,在看短时能量算法时遇到一个帧移的概念.当时不太明白,为啥分帧之后还要重叠取语音信号.在知乎上看到一篇文章,讲的不错:语音分帧的理解 对音频信号分帧,在较短的时间内,认为信号平稳信 ...

  4. 关于语音分帧时有重叠部分的原因分析

    在用Matlab进行语音分析时,通常会用读入的数据进行分帧处理.在分帧中,往往设置在相邻两帧之间有一部分重叠. 其原因是:语音信号是时变的,在短时范围内特征变化较小,所以做为稳态来处理:但超出这短时范 ...

  5. 【语音识别】基于matlab语音分帧+端点检测+pitch提取+DTW算法歌曲识别【含Matlab源码 1057期】

    ⛄一.DTW简介 Dynamic Time Warping(DTW)诞生有一定的历史了(日本学者Itakura提出),它出现的目的也比较单纯,是一种衡量两个长度不同的时间序列的相似度的方法.应用也比较 ...

  6. python对语音信号读取、分帧、加窗

    python对语音信号读取.分帧.加窗 一.读入音频信号 语音信号有三个重要的参数:声道数.取样频率和量化位数. 声道数:单声道或者双声道 采样频率:一秒钟对声音采样的次数,例如10000HZ代表一秒 ...

  7. 基于MATLAB的语音信号的时域特性分析(一)——分帧、窗函数

      语音信号是一个非稳态的.时变的信号.但在"短时间"范围内可以认为语音信号是稳态的.时不变的.这个短时间一般值10~30ms.由于有这个特性,故常把语音信号称为"准稳态 ...

  8. 语音信号处理中怎么理解分帧?

    那么一帧有多长呢?帧长要满足两个条件: 从宏观上看,它必须足够短来保证帧内信号是平稳的. 前面说过,口型的变化是导致信号不平稳的原因,所以在一帧的期间内口型不能有明显变化,即一帧的长度应当小于一个音素 ...

  9. 音频处理四:(音频的分帧)

    程序设计四:音频的分帧 一:需求分析 为了分析读人数据,通常进行分帧处理.在分帧中,往往设置在相邻两帧之间有一部分重叠.其原因是:语音信号是时变的,在短时范围内特征变化较小,所以作为稳态来处理;但超出 ...

最新文章

  1. c语言链表容易犯的错误,急求大牛啊这个容易的链表到底在哪出错了
  2. 关于springboot工具类中@Autowired注入bean,用static直接修饰,静态方法使用bean时报空指针异常错误...
  3. 简单几步,教你部署一个可扩展微服务系统!
  4. jQuery 2.0.3 源码分析 事件体系结构
  5. C/C++中 static 的作用
  6. PHP的empty isset is_null
  7. HDU4741(异面直线间的距离--空间解析几何)
  8. java能调用python吗_如何使用运行时在Java中调用python程序 - java
  9. MFC制作简易音乐播放器
  10. C++中STL-vector的用法
  11. 哈佛MIT联手出品 | 造价低于1美元的机械臂,可承自身重量千倍
  12. python自动化办公都能做什么-用 Python 自动化办公,我与大神之间的差距一下就...
  13. 转-JS中document对象详解
  14. (附源码)计算机毕业设计SSM基于图书管理系统
  15. 区块链赋能数字交通建设 PPT
  16. LCD 触摸屏调试记录
  17. 动态规划 - 买卖股票
  18. 基于Windows平台的Radius服务器搭建指南
  19. 【研报】医美行业产业投资宝典:颜值新经济,美丽无止境——附下载链接
  20. php计算百分比加成_如何从PHP中的2个值计算百分比变化(增加和减少)

热门文章

  1. 【Photoscan/Metashape 使用说明书笔记】
  2. Java习题练习:带分数
  3. 如何运行linux镜像文件,linux可以加载iso镜像文件到启动项吗
  4. 学校计算机课远程关闭他人电脑,学校电脑课上怎么关闭老师的远程控制?
  5. python 中文unicode编码
  6. dubbo全局异常处理_Dubbo 学习1——Service自定义异常捕获不到问题
  7. Redis下分布式锁的实现
  8. MySQL数据库基础:安装+登入+SQL操作语句+数据库授权、备份、恢复+其他操作
  9. 在审批工作流中处理NetSuite拒绝原因的好方法
  10. ABB阀门定位器维修分体式定位器主机维修V18345