本文主要读取语音信号,画出语音波形,并对语音信号进行fft变换,画出频谱图。再对原语音信号进行分帧,并使用了三种窗函数(矩形窗,海宁窗,海明窗)对其中的一帧进行加窗,查看结果。

  • 注:本文所用的matlab版本为matlab 2017a
    首先读取音频文件:
[x1,fs]=audioread('lantian.wav');  %读取音频文件lantian.wav,fs返回采样频率,x1为读取的语音信号

返回语音信号的采样频率,总的采样点数,语音时长等信息:

info=audioinfo('lantian.wav')


可以看到,该语音采样频率为8000,语音总的采样点数为19000,语音时长为2.375秒。
矩形窗函数:

boxcar(n)  %调用格式:w=boxcar(n),根据长度 n 产生一个矩形窗 w

海宁窗函数:

hanning(n)  %调用格式:w=hanning(n),根据长度 n 产生一个汉宁窗 w

海明窗函数:

hamming(n)  %调用格式:w=hamming(n),根据长度 n 产生一个海明窗 w

画语音信号波形图:

figure()
subplot(211);
plot(x1);
title('原始语音信号');

波形图如下:

对语音信号进行fft变换:


FFT物理意义如下:
一个模拟信号,经ADC采样后,就变成了数字信号,采样频率要大于信号频率的两倍,采样得到的数字信号,就可以做FFT变换了。N个采样点,经过FFT之后,就可得到N个点的FFT结果。为了方便进行FFT运算,通常N取2的整数次方。
假设采样频率为Fs,信号频率为F,采样点数为N。那么FFT之后记过就是一个为N点的复数。每个点就对应有一个频率点。这个点的模值,就是该频率值下的幅度特性。
假设原始信号的峰值为A,它跟原始信号的幅度的关系为, FFT的结果的每个点(除第-一个点直流分量之外)的模值就是A的N/2倍。而第一个点就是直流分量,它的模值就是直流分量的N倍。而每个点的相位,就是该频率下的信号的相位。
FFT运算后第一个点表示直流分量(即0Hz),而最后一个点N的再下一个点(实际上这个点是不存在的,这里是假设的第N+1个点,也可以看做是将第一个点分做两半,另一半移到最后)则表示采样频率Fs,这中间被N-1个点平均分成N等份,每个点的频率依次增加。例如某点n所表示的频率为:Fn=(n-1)*Fs/N。
由上边的公式可以看出,Fn所能分辨到频率为Fs/N,如果采样频率Fs为1024 Hz, 采样点数为1024点,则可以分辨到1 Hz。1024 Hz 的采样率采样1024点,刚好是1秒,也就是说,采样1秒时间的信号并做FFT,则结果可以分析到1 Hz, 如果采样2秒时间的信号并做FFT,则结果可以分析到0.5 Hz。 如果要提高频率分辨力,则必须增加采样点数,也即采样时间。


y1=fft(x1,256);   %对语音信号进行256点fft变换

本文调用了voicebox包中的enframe函数进行分帧处理,但matlab中不自带voicebox包。对于如何安装voicebox包,请参考下面博客:
在MATLAB中添加语音处理工具箱(voicebox)

对语音信号进行分帧:

x2=enframe(x1,200,100);%调用分帧函数enframe,x1为语音信号,200为帧长,100为语音帧移时重叠部分的长度

对语音信号进行分帧,再加不同的窗函数:

x3=enframe(x1,boxcar(200),100);  %每两百个点分为一帧,再加矩形窗
x4=enframe(x1,hanning(200),100);  %每两百个点分为一帧,再加加海宁窗
x5=enframe(x1,hamming(200),100);%每两百个点分为一帧,再加海明窗

完整的代码如下:

clc;
clear;
close all;
[x1,fs]=audioread('lantian.wav');  %读取音频文件lantian.wav
info=audioinfo('lantian.wav')
figure()
plot(boxcar(200))  %画矩形窗波形
title('矩形窗');
figure()
plot(hanning(200))  %画海宁窗波形
title('海宁窗');
figure()
plot(hamming(200))  %画海明窗波形
title('海明窗');
y1=fft(x1,256);   %对语音信号进行256点fft变换
figure()
subplot(211);
plot(x1);
title('原始语音信号');
subplot(212);
plot(abs(y1(1:256)));
title('原始语音信号FFT频谱');
x2=enframe(x1,200,100);%分帧
figure();%画图
subplot(221);
plot(x2(50,:))   %画第50帧波形
title('语音信号第50帧波形');
x3=enframe(x1,boxcar(200),100);%每两百个点分为一帧,再加矩形窗
subplot(222);
plot(x3(50,:))  %画第50帧波形
title('语音信号加矩形窗后第50帧波形');
x4=enframe(x1,hanning(200),100);%每两百个点分为一帧,再加加海宁窗
subplot(223);
plot(x4(50,:))   %画第50帧波形
title('语音信号加海宁窗后第50帧波形');
x5=enframe(x1,hamming(200),100);%每两百个点分为一帧,再加海明窗
subplot(224);
plot(x5(50,:))   %画第50帧波形
title('语音信号加海明窗后第50帧波形');

结果:
矩形窗:

海宁窗:

海明窗:

原始语音信号和语音信号的fft变换频谱图:

这是第50帧信号波形,语音信号直接分帧和对语音信号加不同窗函数的对比:

可以发现,对语音信号加矩形窗之后和不加窗的波形几乎一样。但加窗海宁窗和海明窗后结果和不加窗结果不一样,明显两边的波形幅度降低了,中间不变,这是因为海宁窗和海明窗因为边缘有一个下降带,对高于这个值的波形就截断掉了。海宁窗和海明窗效果几乎一样。

Matlab对语音信号做fft及对语音信号进行分帧加窗相关推荐

  1. matlab语音分帧加窗,语音信号的加窗处理

    平稳的随机过程是研究语音信号的主要手段,但是语音信号本身并不是平衡的. 一,语音信号不平稳 语音信号在产生过程中与环境和发声器官的联系很紧密,与各种运动都是相关的,信号本身是不平移的信号.主要是由于发 ...

  2. 语音信号的分帧加窗的matlab实现

    [x,fs,nbits]=wavread('5_1.wav'); x1=enframe(x,200,100);%分帧 x2=enframe(x,hamming(200),100);%加窗 figure ...

  3. 基于MATLAB的语音信号的时域特性分析(一)——分帧、窗函数

      语音信号是一个非稳态的.时变的信号.但在"短时间"范围内可以认为语音信号是稳态的.时不变的.这个短时间一般值10~30ms.由于有这个特性,故常把语音信号称为"准稳态 ...

  4. 语音信号分析(语音分帧)

    语音分帧 不管是进行什么参数分析以及采用什么分析方法,都需要一些预先的处理,如语音信号的数字化.语音信号的端点检测.预加重.加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术.贯穿于语音分析全过程 ...

  5. 了解FFT和信号加窗

    0 概览 学习信号时域和频域.快速傅立叶变换(FFT).加窗,以及如何通过这些操作来加深对信号的认识. 1. 理解时域.频域.FFT 傅立叶变换有助于理解常见的信号,以及如何辨别信号中的错误. 尽管傅 ...

  6. python信号处理加汉明窗_SciPyTutorial-非整周期信号加窗

    17. Scipy Tutorial- 非整周期信号加窗 17.1 什么是加窗? 使用FFT分析信号的频率成分时,分析的是有限的数据集合. FFT认为波形是一组有限数据的集合,一个连续的波形是由若干段 ...

  7. 差分信号_形象解读差分信号,它比单端信号强在哪?

    一个差分信号是用一个数值来表示两个物理量之间的差异.从严格意义上来讲,所有电压信号都是差分的,因为一个电压只能是相对于另一个电压而言的. 电子学习资料大礼包​mp.weixin.qq.com 一个差分 ...

  8. Matlab截取语音信号做DFT变换

    1,首先就是要选择一段wav格式的音频文件,网络上找到的wav文件时间太长,因此需要对其进行时域上的分割,截取一小段来进行实验. 2,截取信号代码 clc clear [x,fs]=audioread ...

  9. matlab adc仿真,[转载]关于ADC仿真做FFT的设置和结果分析

    这些都是比较基础和实用的东西,故做分享~ 以前在实验室跑ADC动态性能仿真,会跑不少点,浪费了不少时间.主要是由于当时没有用相干采样的频率,而是直接选一个和采样频率比较互质的输入频率,然后再进行加窗处 ...

  10. 【数字信号处理】Matlab做fft时点数N怎么选取

    一.FFT点数N(也就是离散时间信号的记录长度):要根据所要求的的频率分辨率F来决定. 频率分辨率F:能够用FFT算法分析得到的最靠近的两个信号频率之间的间隔. N和F的关系:N>=Fs/F, ...

最新文章

  1. 超越谷歌BERT!依图推出预训练语言理解模型ConvBERT,入选NeurIPS 2020
  2. study note9
  3. 【转载】分布式事务 介绍
  4. iOS 文件和数据管理 (可能会删除本地文件储存)
  5. mysql 里面不等于符号_mysql 不等于 符号写法
  6. mysql 副本 同步_副本机制与副本同步
  7. RDS关系型数据库 入门 01 创建关系型数据库实例【华为云分享】
  8. 图的绝对中心(bzoj 2180: 最小直径生成树)
  9. java 连接ftp 测试_ftp,ftp怎么进行连接,附上在Java环境下的配置教程
  10. oracle日期00开头,【原】Oracle中产生 “0000-00-00”格式的日期
  11. 找工作知识储备(3)---从头说12种排序算法:原理、图解、动画视频演示、代码以及笔试面试题目中的应用
  12. java累积度分布,累积分布函数
  13. Vbs脚本编程简明教程
  14. oracle英文怎么转中文,ORACLE英文字符集转中文
  15. 【操作系统】王道考研 笔记总结目录(完结)
  16. 四位共阳极数码管显示函数_DS1302,四位共阳极数码管显示时钟,可调时间
  17. 如何在C#中将 加载、编辑WPS表格?国产控件就能搞定
  18. 不会写简历?阿里Java技术架构师教你如何写好你的技术简历
  19. python中numpy矩阵的零填充
  20. 城市集中供热系统 热力管网监控系统

热门文章

  1. 2019CBA选秀大会最终结果
  2. 虚拟机vmware中下载安装centos7
  3. RabbitMQ,手动ACK情况下,消费消息的时候出现异常,如何手动ACK或NACK
  4. windows自动更新下载的目录
  5. ROS开发--Qt接收摇杆话题
  6. 每月自评之一:2013年1月
  7. 进程间通信有哪几种方式?
  8. Ubuntu开启SSH服务以及使用Putty远程控制的解决办法
  9. 对于System.out.println简单了解
  10. 最小拍控制算法c语言,第六章最小拍控制