1. 时域图

1.1 声音信号是一维的时域信号,无法观察出频率随时间的变化规律。


动态信号x(t): 是描述信号在不同时刻取值的函数, 其中t是自变量;

即横轴代表时间, 纵轴是信号的变化(振幅)。

2. 信号的频域分析

信号通过傅里叶变换把它变到频域上,可以看出信号的频率成分;

横轴代表各个频率成分, 纵轴: 信号的幅度值。
是一个时间平均(time average)概念。

2.1 频谱图

简单地说,任何信号(当然要满足一定的数学条件),都可以通过傅立叶变换而分解成一个直流分量(也就是一个常数)和若干个(一般是无穷多个)正弦信号的和。

每个正弦分量都有自己的频率和幅值;
这样,以频率值作横轴,以幅值作纵轴,
把上述若干个正弦信号的幅值画在其所对应的频率上,就做出了信号的幅频分布图,也就是所谓频谱图 。

2.3 频谱图类型

在实际使用中,频谱图有三种,即

  1. 线性振幅谱、
  2. 对数振幅谱、
  3. 自功率谱.

其中, 对数振幅谱中各谱线的振幅都作了对数计算,所以其纵坐标的单位是dB(分贝), 这个变换的目的是使那些振幅较低的成分相对高振幅成分得以拉高,以便观察掩盖在低幅噪声中的周期信号。

2.4 相频分布:

横坐标: 频率 ;
纵坐标: 相位;

3. 功率谱

3.1 功率谱定义

功率谱可以从两方面来定义,

  1. 一个是自相关函数的傅立叶变换,第一种定义就是常说的维纳辛钦定理。

  2. 另一个是时域信号傅氏变换模平方然后除以时间长度。

第二种其实从能量谱密度来的。
根据parseval定理,信号傅氏变换模平方被定义为能量谱,能量谱密度在时间上平均就得到了功率谱。

3.2 功率谱性质

  1. 功率谱的概念是针对功率有限信号的(能量有限信号可用能量谱分析),所表现的是单位频带内信号功率随频率的变换情况。保留频谱的幅度信息,但是丢掉了相位信息,所以频谱不同的信号其功率谱是可能相同的。

  2. 功率谱是随机过程的统计平均概念,平稳随机过程的功率谱是一个确定函数;而频谱是随机过程样本的Fourier变换,对于一个随机过程而言,频谱也是一个“随机过程”。(随机的频域序列)

  3. 功率概念和幅度概念的差别。此外,只能对宽平稳的各态历经的二阶矩过程谈功率谱,其存在性取决于二阶局是否存在并且二阶矩的Fourier变换收敛;而频谱的存在性仅仅取决于该随机过程的该样本的Fourier变换是否收敛。

  4. 在频域分析信号分两种:
    (1).对确定性信号进行傅里叶变换,分析频谱信息。
    (2).随机信号的傅里叶信号不存在,转向研究它的功率谱。随机信号的功率谱和自相关函数是傅里叶变换对(即维纳辛钦定理)。功率谱估计有很多种方法;

4. 时域与频域的关系 (FFT)

4.1 相位与振幅

如下面静态图所示:

正弦波就是一个圆周运动在一条直线上的投影。
任意时刻的相位 为 ϕ\phiϕ ;
任意时间的 幅度值: 振幅A × sin ϕ\phiϕ

sin = 对边/ 斜边;
对边 = sin × 斜边

4.2 频域的基本单元

如下图所示:
频域的基本单元也可以理解为一个始终在旋转的圆。

4.3 FFT过程

举例, 矩形波的 FFT过程:

任意波形FFT:

4.4 相位差:

相位差 = (时间差 / 周期 ) × 2 π\piπ
图中, 小红点是距离频率轴最近的波峰, 我们将红色的点投影到下平面,投影点我们用粉色点来表示。当然,这些粉色的点只标注了波峰距离频率轴的距离,并不是相位。时间差并不是相位差。如果将全部周期看作2Π或者360度的话,相位差则是时间差在一个周期中所占的比例。我们将时间差除周期再乘 2Π,就得到了相位差。

4.5 矩形波在时域、频域和相位的表现形式:

5. 时频域分析

5.1 时频域分析:

频谱虽然可以看出信号的频率分布, 但是丢失了时域信息,无法看出频率分布随时间的变化。

为了解决这个问题,很多时频域分析手段应运而生。

短时傅里叶,小波,Wigner分布等都是常用的时频域分析方法。

5.2 STFT的原理:

  1. 把一段长信号分帧、加窗,
  2. 对每一帧做傅里叶变换(FFT).

短时傅里叶变换,是对短时的信号做傅里叶变换。
短时的信号怎么得到? —> 是长时的信号分帧得来的。

5.3 实现:

python可以使用scipy库中的signal模块。

如果做STFT分解的音频信号(wav文件)的路径存在path变量中,可通过下面的代码得到STFT数据。

import wavio
import numpy as np
from scipy import signalwav_struct=wavio.read(path)
wav=wav_struct.data.astype(float)/np.power(2,wav_struct.sampwidth*8-1)
[f,t,X]=signal.spectral.spectrogram(wav,np.hamming(1024),nperseg=1024,noverlap=0,detrend=False,return_onesided=True,mode='magnitude')

关于signal模块中spectrogram的使用方法和各个参数的具体意义,参见

https://docs.scipy.org/doc/scipy/reference/generated/scipy.signal.spectrogram.html#scipy.signal.spectrogram

音频(一)时域图、 频谱图 Spectrum相关推荐

  1. python绘制频谱图,在音频分析中绘制频谱图

    I am working on speech recognition using neural network. To do so I need to get the spectrograms of ...

  2. pyhton 画出音频文件的波形图和频谱图

    pyhton 画出音频文件的波形图和频谱图 # -*- coding:utf-8 -*- import wave import struct import numpy as np import mat ...

  3. FFT求频谱图和功率谱密度图

    FFT求频谱图和功率谱密度图 频谱图 声音频率与能量的关系用频谱表示.在实际使用中,频谱图有三种,即线性振幅谱.对数振幅谱.自功率谱. 线性振幅谱的纵坐标有明确的物理量纲,是最常用的. 对数振幅谱中各 ...

  4. 图像的二维傅里叶变换频谱图特点研究

    一.先放一些相关的结论: 1.傅里叶变换的幅值称为傅里叶谱或频谱. 2.F(u)的零值位置与"盒状"函数的宽度W成反比. 3.卷积定理:空间域两个函数的卷积的傅里叶变换等于两个函数 ...

  5. 【零基础】看懂理解傅里叶变换后的频谱图-附例题

    首先安利一个网站,在线做傅里叶变换,不用等MATLAB漫长的启动了 https://sci2fig.herokuapp.com/fourier 文章中部分图片来自 https://blog.csdn. ...

  6. waveform波形图(时域图)、spectrum(频谱图)、spectrogram(语谱图)、MFCC

    人的气流(excitation)通过声道到嘴唇产生声音.唇齿舌的形状决定了发出怎样的声音,这个形状通过频谱图中的包络中显示出来.而MFCCs就是一种准确描述这个包络的一种特征. 一.waveform波 ...

  7. 获取音频的时域频谱-振幅图-音频可视化-音量图-音谱图

    找了很久的资料,基本都是音频的实时频谱图,即通过MediaPlayer-Visualizer-onWaveFormDataCapture.onFftDataCapture获取数据,然后解析.绘制出来的 ...

  8. 数字信号处理实验三用fft对信号作频谱分析_机器学习中的音频特征:理解Mel频谱图...

    如果你像我一样,试着理解mel的光谱图并不是一件容易的事.你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了.我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图. 信号 信号是一定量 ...

  9. 音频处理相关内容学习——自动编码器——变分自动编码器——频谱图

    文章目录 概述 一.Approaches And Challenges 生成的声音是什么类型 训练模型使用的是什么特征 原始音频Raw Audio 频谱图Spectrograms 声音生成模型常用的结 ...

  10. 语音信号处理-概念(一):时域信号(横轴:时间;纵轴:幅值)、频谱图(横轴:频率;纵轴:幅值)--傅里叶变换-->时频谱图(语谱图/声谱图)【横轴:时间;纵轴:频率;颜色深浅:幅值】

    我们经常接触到与频谱相关的概念.本节对这些概念之间的区别进行简单的介绍. 一般来讲,将一段时域信号通过离散傅里叶变换后,将频率作为横轴.幅度作为纵轴,得到的图像称作 频谱.若将相位作为纵轴,则称为 相 ...

最新文章

  1. 526个常用英语词组
  2. 计算机处理器采用多核,电脑的CPU的多核很有用吗?
  3. 自定义字符串查找函数c语言,(C语言自定义函数,/*编写函数实现在字符串pStr中查找子串pSub int subString( char* pStr, char* pSub);...
  4. 四年级上册数学计算机笔记,四年级数学下册笔记整理
  5. Redis缓存雪崩、缓存穿透、热点Key
  6. 多模态语义分析_情感分析、多模态NLP、多语言翻译...这场NLP知识盛宴不可错过!...
  7. 《AFTrans》来自ViT的免费午餐!北大阿里提出用于细粒度视觉识别的自适应注意多尺度融合Transformer...
  8. Mysql查询按照某字段指定顺序排序
  9. 群晖通过Cloud Sync套件进行文件同步
  10. 毕设题目:Matlab优化分类
  11. 三维偏序:CDQ分治
  12. 国内外各大免费收录网站搜索引擎及导航网址提交入口
  13. C#打开文件夹加载图片
  14. XPO的UpCasting
  15. 用递归方法实现二分查找,为了避免异常情况,首先判断上下限范围
  16. 【Javaweb】TCP原理(三次握手四次挥手)
  17. WerFault.exe 占用CPU 100%的问题处理
  18. mysql下载完安装包怎么办_MySQL下载压缩包安装详细过程
  19. 【微信小程序】图库——(后台接口篇)
  20. ubuntu20.04设置中文输入法

热门文章

  1. iOS 10 消息推送
  2. [LOJ6437][计算几何]PKUSC2018:PKUSC
  3. python 图像手绘效果展示
  4. 绘制双Y轴坐标系及其设置
  5. 国外问卷调查赚钱网站
  6. 杂题 P1640 [SCOI2010]连续攻击游戏
  7. 使用Python模块webbrowser实现自动打开网页/刷新网页
  8. IOS-App Store 提审应用步骤
  9. win10专业版没有触摸板选项_win10系统怎么禁用触控板 win10禁用触控板方法介绍...
  10. 2022 年度杭州未来科技城数字经济人才编程大赛