一、预加重

预加重是语音信号处理的前提,主要目的是提升语音信号中的高频分量。
        人的发生系统是从肺开始,肺作为能量源,气流通过声带,引发周期性震动(元音),能量经过咽、口腔、唇、舌, 形成最后的声音。元音能量主要集中在1KHz以下,并且以6dB/十倍频的速度下降。辅音一般不引起声带振动,频率更高。其中口唇辐射对低频影响比较小,但是对高频段影响比较大, 预加重就是为了消除这种影响,提升高频分量。
        在语音信号中,提升高频分量的目的主要是因为高频分量(即辅音)包含了更多的信息,而元音的频率普遍较低。功率谱随频率的增加而减小,其大部分能量集中在低频范围内。这就造成消息信号高频端的信噪比可能降到不能容忍的程度。
        总之,预加重保持信号的低频部分不变,提升信号的高频部分;而去加重衰减信号的低频部分,保持高频部分。预加重/去加重的目的都是提升信号中高频部分的能量,以补偿信道对高频部分衰减过大。预加重一般采用的是一阶高通滤波器:

其中,的取值一般接近于1。

二、分帧

语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段的。为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程的数据结构,这就是分帧。语音信号在宏观上是不平稳的,在微观上是平稳的,具有短时平稳性(10---30ms内可以认为语音信号近似不变),这个就可以把语音信号分为一些短段来进行处理,每一个短段称为一帧(CHUNK)。

详见:语音信号处理基础(五)——语音分帧与加窗_张亚楠·的博客-CSDN博客_语音分帧与加窗实验报告

三、帧移

由于我们常用的信号处理方法都要求信号是连续的,也就说必须是信号开始到结束,中间不能有断开。然而我们进行采样或者分帧后数据都断开了,所以要在帧与帧之间保留重叠部分数据,以满足连续的要求,这部分重叠数据就是帧移。

四、加窗

介绍帧移的时候我们说了,我们处理信号的方法都要求信号是连续条件,但是分帧处理的时候中间断开了,为了满足条件我们就将分好的帧数据乘一段同长度的数据,这段数据就是窗函数整个周期内的数据,从最小变化到最大,然后最小。

加窗即与一个窗函数相乘,加窗之后是为了进行傅里叶展开.
        1.使全局更加连续,避免出现吉布斯效应
        2.加窗时候,原本没有周期性的语音信号呈现出周期函数的部分特征。
加窗的代价是一帧信号的两端部分被削弱了,所以在分帧的时候,帧与帧之间需要有重叠。

详见:语音信号处理基础(五)——语音分帧与加窗_张亚楠·的博客-CSDN博客_语音分帧与加窗实验报告

五、傅里叶变换
        对一帧信号做傅里叶变换得到的结果叫做频谱

对语音信号处理主要的数学工具是傅里叶变换,而傅里叶变换是研究整个时间域和频率域的关系。不过,当运用计算机实现工程测试信号处理时,不可能对无限长的信号进行测量和运算,而是取其有限的时间片段进行分析。

语音处理基础:预加重、分帧、帧移、加窗、傅里叶变换相关推荐

  1. 信号处理(二)音频信号的分帧, 加窗

    1 .语音信号的三个参数 语音信号有三个重要的参数:声道数.取样频率和量化位数. 声道数:单声道或者双声道 采样频率:一秒钟对声音采样的次数,例如10000HZ代表一秒钟将信号分解为10000份,当采 ...

  2. 语音处理的分帧,帧移,加窗,滤波,降噪,合成

    一.分帧 语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段 的.为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程 的数 ...

  3. 语音信号处理基础(五)——语音分帧与加窗

    文章目录 原理 1.加窗 2.分帧 一般而言语音处理的目的有两种: 一种是对语音信号进行分析,提取特征参数,用于后续处理: 提取的特征参数主要有语音的短时能量和平均幅度.短时平均过零率.短时自相关函数 ...

  4. python对语音信号读取、分帧、加窗

    python对语音信号读取.分帧.加窗 一.读入音频信号 语音信号有三个重要的参数:声道数.取样频率和量化位数. 声道数:单声道或者双声道 采样频率:一秒钟对声音采样的次数,例如10000HZ代表一秒 ...

  5. matlab语音分帧加窗,语音信号的加窗处理

    平稳的随机过程是研究语音信号的主要手段,但是语音信号本身并不是平衡的. 一,语音信号不平稳 语音信号在产生过程中与环境和发声器官的联系很紧密,与各种运动都是相关的,信号本身是不平移的信号.主要是由于发 ...

  6. 语音信号的分帧、加窗处理

    分帧 语音信号是一个准稳态的信号,若把它分成较短的帧,每帧中可将其看做稳态信号,可用处理稳态信号的方法来处理.为了使一帧与另一帧之间的参数能够平稳过渡,应在相邻两帧之间互相有部分重叠.一般情况下,帧长 ...

  7. 语音信号的分帧加窗的matlab实现

    [x,fs,nbits]=wavread('5_1.wav'); x1=enframe(x,200,100);%分帧 x2=enframe(x,hamming(200),100);%加窗 figure ...

  8. 语音信号的预加重和加窗处理

    一.语音信号的预加重 语音信号的预加重,目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率.一般通过传递函数为一阶FIR高通数字滤波器来实现预加重,其中a为预加重系数,0.9 ...

  9. 高速串行总线设计基础(八)揭秘SERDES高速面纱之CML电平标准与预加重技术

    文章目录 前言 物理信号 预加重 差分传输线 参考资料 前言 对于数字工程师来说,我们可能关注的仅仅是本文中的差分信号电平标准以及预加重技术,CML电平标准是Transceiver技术的首选,在Xil ...

  10. 以太网口差分电平_高速串行总线设计基础(八)揭秘SERDES高速面纱之CML电平标准与预加重技术...

    前言 物理信号 预加重 差分传输线 参考资料 前言 对于数字工程师来说,我们可能关注的仅仅是本文中的差分信号电平标准以及预加重技术,CML电平标准是Transceiver技术的首选,在Xilinx的G ...

最新文章

  1. docker load 出错 open /var/lib/docker/tmp/docker-import-837327978/bin/json: no such file or directory
  2. python父类的类成员怎么定义_python如何找到哪些父类定义子对象的方法
  3. Elasticsearch安装(Linux)
  4. http协言和web本质
  5. listview异步加载图片
  6. OpenCV人脸检测
  7. 门户网站运营方案_网络营销方案涉及的工作内容有哪些
  8. 查看文件大小du -sh ./ ll -h
  9. 用于实现 Web 服务的 SOA 编程模型,第 10 部分: SOA 用户角色
  10. PyTorch中在反向传播前为什么要手动将梯度清零?
  11. css鼠标移上去向上移动,css3鼠标移动图片上移效果
  12. 数学建模 ---斯皮尔曼相关系数
  13. 数据挖掘:实用案例分析
  14. 计算机word表格求和怎么操作,Word中的表格如何自动求和
  15. 局域网ip扫描工具_IP Scanner Pro for mac(局域网IP扫描软件)
  16. 用 Python selenium爬取股票新闻并存入mysql数据库中带翻页功能demo可下载
  17. wps 2003 给WPS设置保护眼睛的淡绿色呢?
  18. STM32:RTC实时时钟原理
  19. 备选统驭科目的使用与配置
  20. 网页设计-公用导航栏

热门文章

  1. Linux CentOS 内核编译全流程:从安装vmware开始
  2. PyCharm常用配置和常用插件
  3. 小米开源便签Notes-源码研究(0)-整体功能介绍(图文并茂)
  4. Java实现输出PDF
  5. 【Java开发bug-011】excel设置自定义日期格式
  6. 打印日历Java代码实现
  7. 创智播客微服务_传智播客黑马程序员首次对外发布JavaEE中级程序员学习路线图...
  8. 迅捷图片格式转换器v1.00.1中文免费版
  9. Mac系统搭建C语言开发环境
  10. 手机端显示电脑端隐藏html源码,div+css实现电脑端显示手机端隐藏代码