Matlab对语音信号做fft及对语音信号进行分帧加窗

本文主要读取语音信号，画出语音波形，并对语音信号进行fft变换，画出频谱图。再对原语音信号进行分帧，并使用了三种窗函数（矩形窗，海宁窗，海明窗）对其中的一帧进行加窗，查看结果。

注：本文所用的matlab版本为matlab 2017a
首先读取音频文件：

[x1,fs]=audioread('lantian.wav');  %读取音频文件lantian.wav,fs返回采样频率,x1为读取的语音信号

返回语音信号的采样频率，总的采样点数，语音时长等信息：

info=audioinfo('lantian.wav')

可以看到，该语音采样频率为8000，语音总的采样点数为19000，语音时长为2.375秒。
矩形窗函数：

boxcar(n)  %调用格式：w=boxcar(n)，根据长度 n 产生一个矩形窗 w

海宁窗函数：

hanning(n)  %调用格式：w=hanning(n)，根据长度 n 产生一个汉宁窗 w

海明窗函数：

hamming(n)  %调用格式：w=hamming(n)，根据长度 n 产生一个海明窗 w

画语音信号波形图：

figure()
subplot(211);
plot(x1);
title('原始语音信号');

波形图如下：

对语音信号进行fft变换：

FFT物理意义如下：
一个模拟信号,经ADC采样后，就变成了数字信号，采样频率要大于信号频率的两倍，采样得到的数字信号，就可以做FFT变换了。N个采样点，经过FFT之后，就可得到N个点的FFT结果。为了方便进行FFT运算，通常N取2的整数次方。
假设采样频率为Fs,信号频率为F,采样点数为N。那么FFT之后记过就是一个为N点的复数。每个点就对应有一个频率点。这个点的模值，就是该频率值下的幅度特性。
假设原始信号的峰值为A,它跟原始信号的幅度的关系为, FFT的结果的每个点(除第-一个点直流分量之外)的模值就是A的N/2倍。而第一个点就是直流分量，它的模值就是直流分量的N倍。而每个点的相位，就是该频率下的信号的相位。
FFT运算后第一个点表示直流分量(即0Hz),而最后一个点N的再下一个点（实际上这个点是不存在的，这里是假设的第N+1个点，也可以看做是将第一个点分做两半，另一半移到最后）则表示采样频率Fs，这中间被N-1个点平均分成N等份，每个点的频率依次增加。例如某点n所表示的频率为:Fn=(n-1)*Fs/N。
由上边的公式可以看出，Fn所能分辨到频率为Fs/N,如果采样频率Fs为1024 Hz, 采样点数为1024点,则可以分辨到1 Hz。1024 Hz 的采样率采样1024点，刚好是1秒，也就是说，采样1秒时间的信号并做FFT,则结果可以分析到1 Hz, 如果采样2秒时间的信号并做FFT,则结果可以分析到0.5 Hz。如果要提高频率分辨力，则必须增加采样点数，也即采样时间。

y1=fft(x1,256);   %对语音信号进行256点fft变换

本文调用了voicebox包中的enframe函数进行分帧处理，但matlab中不自带voicebox包。对于如何安装voicebox包，请参考下面博客：
在MATLAB中添加语音处理工具箱（voicebox）

对语音信号进行分帧：

x2=enframe(x1,200,100);%调用分帧函数enframe,x1为语音信号，200为帧长，100为语音帧移时重叠部分的长度

对语音信号进行分帧，再加不同的窗函数：

x3=enframe(x1,boxcar(200),100);  %每两百个点分为一帧，再加矩形窗
x4=enframe(x1,hanning(200),100);  %每两百个点分为一帧，再加加海宁窗
x5=enframe(x1,hamming(200),100);%每两百个点分为一帧，再加海明窗

完整的代码如下：

clc;
clear;
close all;
[x1,fs]=audioread('lantian.wav');  %读取音频文件lantian.wav
info=audioinfo('lantian.wav')
figure()
plot(boxcar(200))  %画矩形窗波形
title('矩形窗');
figure()
plot(hanning(200))  %画海宁窗波形
title('海宁窗');
figure()
plot(hamming(200))  %画海明窗波形
title('海明窗');
y1=fft(x1,256);   %对语音信号进行256点fft变换
figure()
subplot(211);
plot(x1);
title('原始语音信号');
subplot(212);
plot(abs(y1(1:256)));
title('原始语音信号FFT频谱');
x2=enframe(x1,200,100);%分帧
figure();%画图
subplot(221);
plot(x2(50,:))   %画第50帧波形
title('语音信号第50帧波形');
x3=enframe(x1,boxcar(200),100);%每两百个点分为一帧，再加矩形窗
subplot(222);
plot(x3(50,:))  %画第50帧波形
title('语音信号加矩形窗后第50帧波形');
x4=enframe(x1,hanning(200),100);%每两百个点分为一帧，再加加海宁窗
subplot(223);
plot(x4(50,:))   %画第50帧波形
title('语音信号加海宁窗后第50帧波形');
x5=enframe(x1,hamming(200),100);%每两百个点分为一帧，再加海明窗
subplot(224);
plot(x5(50,:))   %画第50帧波形
title('语音信号加海明窗后第50帧波形');

结果：
矩形窗：

海宁窗：

海明窗：

原始语音信号和语音信号的fft变换频谱图：

这是第50帧信号波形，语音信号直接分帧和对语音信号加不同窗函数的对比：

可以发现，对语音信号加矩形窗之后和不加窗的波形几乎一样。但加窗海宁窗和海明窗后结果和不加窗结果不一样，明显两边的波形幅度降低了，中间不变，这是因为海宁窗和海明窗因为边缘有一个下降带，对高于这个值的波形就截断掉了。海宁窗和海明窗效果几乎一样。

Matlab对语音信号做fft及对语音信号进行分帧加窗相关推荐

matlab语音分帧加窗,语音信号的加窗处理
平稳的随机过程是研究语音信号的主要手段,但是语音信号本身并不是平衡的. 一,语音信号不平稳语音信号在产生过程中与环境和发声器官的联系很紧密,与各种运动都是相关的,信号本身是不平移的信号.主要是由于发 ...
语音信号的分帧加窗的matlab实现
[x,fs,nbits]=wavread('5_1.wav'); x1=enframe(x,200,100);%分帧 x2=enframe(x,hamming(200),100);%加窗 figure ...
基于MATLAB的语音信号的时域特性分析（一）——分帧、窗函数
语音信号是一个非稳态的.时变的信号.但在"短时间"范围内可以认为语音信号是稳态的.时不变的.这个短时间一般值10~30ms.由于有这个特性,故常把语音信号称为"准稳态 ...
语音信号分析（语音分帧）
语音分帧不管是进行什么参数分析以及采用什么分析方法,都需要一些预先的处理,如语音信号的数字化.语音信号的端点检测.预加重.加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术.贯穿于语音分析全过程 ...
了解FFT和信号加窗
0 概览学习信号时域和频域.快速傅立叶变换(FFT).加窗,以及如何通过这些操作来加深对信号的认识. 1. 理解时域.频域.FFT 傅立叶变换有助于理解常见的信号,以及如何辨别信号中的错误. 尽管傅 ...
python信号处理加汉明窗_SciPyTutorial-非整周期信号加窗
17. Scipy Tutorial- 非整周期信号加窗 17.1 什么是加窗? 使用FFT分析信号的频率成分时,分析的是有限的数据集合. FFT认为波形是一组有限数据的集合,一个连续的波形是由若干段 ...
差分信号_形象解读差分信号，它比单端信号强在哪？
一个差分信号是用一个数值来表示两个物理量之间的差异.从严格意义上来讲,所有电压信号都是差分的,因为一个电压只能是相对于另一个电压而言的. 电子学习资料大礼包mp.weixin.qq.com 一个差分 ...
Matlab截取语音信号做DFT变换
1,首先就是要选择一段wav格式的音频文件,网络上找到的wav文件时间太长,因此需要对其进行时域上的分割,截取一小段来进行实验. 2,截取信号代码 clc clear [x,fs]=audioread ...
matlab adc仿真,[转载]关于ADC仿真做FFT的设置和结果分析
这些都是比较基础和实用的东西,故做分享~ 以前在实验室跑ADC动态性能仿真,会跑不少点,浪费了不少时间.主要是由于当时没有用相干采样的频率,而是直接选一个和采样频率比较互质的输入频率,然后再进行加窗处 ...
【数字信号处理】Matlab做fft时点数N怎么选取
一.FFT点数N(也就是离散时间信号的记录长度):要根据所要求的的频率分辨率F来决定. 频率分辨率F:能够用FFT算法分析得到的最靠近的两个信号频率之间的间隔. N和F的关系:N>=Fs/F, ...

Matlab对语音信号做fft及对语音信号进行分帧加窗

Matlab对语音信号做fft及对语音信号进行分帧加窗相关推荐

最新文章

热门文章