在有关MFCC的许多文章中,很多都是引用国外一篇PPT的。

这篇地址在这里

其中有关于Spectral Envelope(包络)的理解我一直有一些疑问。

疑问

为什么有如下假定?

Spectrum = Spectral Envelope * Spectral Details

正因为这个公式,才有后续的处理。但是对于这个我是挺好奇的。

对此我做了一些简单的实验。

实验

Step1. 找一个单一声源的音频

Step2. 对此音频做DFT得到频域数据

Step3. 对频域数据再次做DFT
如果存在Spectral Envelope和Spectral Details,那么必然会在这个结果中有体现。

伪代码如下:

for (int i = 0; i < N; ++i) {Ndouble realVal = m1[i][0]/N;double imagVal = m1[i][1]/N;double powVal  = 2* (realVal*realVal +imagVal*imagVal);double absVal  = sqrt(powVal/2)*2;// 仅打印能量大于1.25if (absVal>1.25) {fprintf(stdout, "%10i (%10.4lf %10.4lf) %10.4lf %10.4lf\n", i,realVal, imagVal, absVal, powVal);}}

因为样例音频的能量较小,所以pow和abs值都偏小,这里根据1.25为阈值过滤。

打印Step3数据如下 (举了某一帧为例)

 Frequency  (Real       Imag)        Abs       Power1605 (    0.5469     0.5966)     1.6187     1.31011607 (   -0.3830    -0.6633)     1.5319     1.17341608 (   -0.8168    -0.8465)     2.3527     2.76761609 (   -0.6892    -0.2346)     1.4560     1.06001610 (    0.3351     0.8297)     1.7896     1.60131611 (    1.0922     0.9707)     2.9224     4.27011614 (   -0.6581    -0.6849)     1.8997     1.80451616 (    0.2837     0.6177)     1.3595     0.92421617 (    0.6710     0.4794)     1.6494     1.36021620 (   -0.4764    -0.4920)     1.3697     0.93811622 (    0.7372     0.9301)     2.3736     2.81701623 (    0.8836     0.5938)     2.1291     2.26661625 (   -0.8374    -1.0777)     2.7296     3.72541626 (   -1.1240    -0.8214)     2.7843     3.87621628 (    0.8786     1.1128)     2.8357     4.02051629 (    0.9656     0.6244)     2.2998     2.64461631 (   -0.5870    -0.7584)     1.9180     1.83941632 (   -0.7730    -0.5451)     1.8917     1.78931634 (    0.6053     0.6120)     1.7215     1.48181637 (   -0.6775    -0.7938)     2.0872     2.17821638 (   -0.6324    -0.1233)     1.2886     0.83031639 (    0.4665     0.8667)     1.9684     1.93741640 (    1.0342     0.9270)     2.7777     3.85791642 (   -0.4208    -0.8041)     1.8152     1.64741643 (   -1.0795    -1.0763)     3.0488     4.64761644 (   -0.7512    -0.2024)     1.5560     1.21061645 (    0.4262     0.8774)     1.9509     1.90301646 (    0.9605     0.8118)     2.5152     3.16301649 (   -0.7451    -0.6711)     2.0055     2.01111651 (    0.4292     0.5677)     1.4235     1.01311654 (   -0.4299    -0.5846)     1.4513     1.05311656 (    0.3248     0.7072)     1.5564     1.21121657 (    0.8936     0.8522)     2.4697     3.04961658 (    0.6013     0.2079)     1.2724     0.80951660 (   -0.9155    -1.0261)     2.7503     3.78211661 (   -0.8391    -0.4314)     1.8870     1.78031663 (    0.7710     0.7510)     2.1526     2.31691664 (    0.6116     0.3559)     1.4153     1.00151666 (   -0.6445    -0.7511)     1.9795     1.95921671 (   -0.4366    -0.7228)     1.6888     1.42611672 (   -0.8308    -0.5387)     1.9803     1.96091674 (    0.8466     0.9201)     2.5007     3.12681675 (    0.7521     0.3795)     1.6849     1.41951677 (   -0.8065    -0.9729)     2.5274     3.19381678 (   -0.8567    -0.4725)     1.9567     1.91431679 (    0.1235     0.6154)     1.2554     0.78801680 (    0.7764     0.7284)     2.1292     2.26671681 (    0.5659     0.3056)     1.2863     0.82721683 (   -0.6042    -0.7033)     1.8545     1.71961685 (    0.3171     0.5617)     1.2900     0.83211686 (    0.6701     0.5375)     1.7181     1.47591689 (   -0.7254    -0.5887)     1.8685     1.74561691 (    0.7279     0.9073)     2.3265     2.70621692 (    0.8275     0.5309)     1.9662     1.93301694 (   -0.6795    -0.9210)     2.2890     2.61981695 (   -0.9242    -0.6791)     2.2937     2.63061697 (    0.7296     0.7948)     2.1578     2.32801698 (    0.6813     0.4235)     1.6044     1.28701700 (   -0.5638    -0.7306)     1.8457     1.70331701 (   -0.6597    -0.3087)     1.4568     1.06111703 (    0.5065     0.4439)     1.3470     0.90721706 (   -0.7258    -0.6583)     1.9597     1.92031708 (    0.4901     0.7264)     1.7525     1.53561709 (    0.7369     0.5527)     1.8423     1.69711711 (   -0.4683    -0.7648)     1.7936     1.60851712 (   -0.8818    -0.7439)     2.3074     2.66201714 (    0.6359     0.7758)     2.0063     2.01261715 (    0.7287     0.5066)     1.7751     1.57551717 (   -0.4906    -0.7183)     1.7397     1.51341718 (   -0.6872    -0.3352)     1.5291     1.16911720 (    0.6665     0.6527)     1.8656     1.74031723 (   -0.6042    -0.6591)     1.7882     1.59881725 (    0.3617     0.6106)     1.4193     1.00721726 (    0.6514     0.5098)     1.6543     1.36841728 (   -0.3398    -0.6308)     1.4331     1.02691729 (   -0.8178    -0.7883)     2.2718     2.58051731 (    0.5277     0.7073)     1.7648     1.55731732 (    0.7133     0.5763)     1.8341     1.68191734 (   -0.3499    -0.6897)     1.5467     1.19621735 (   -0.8273    -0.6361)     2.0872     2.17821737 (    0.4145     0.5149)     1.3220     0.87381740 (   -0.5147    -0.6539)     1.6643     1.38491742 (    0.2933     0.6117)     1.3568     0.92041743 (    0.7094     0.5838)     1.8374     1.68791745 (   -0.3245    -0.5805)     1.3300     0.88451746 (   -0.7712    -0.7880)     2.2051     2.43131748 (    0.4123     0.6631)     1.5617     1.21941749 (    0.7214     0.6162)     1.8976     1.80041752 (   -0.7097    -0.6012)     1.8603     1.73031754 (    0.4279     0.6011)     1.4757     1.08881755 (    0.5290     0.4104)     1.3390     0.89651757 (   -0.3994    -0.6132)     1.4636     1.07111758 (   -0.5697    -0.2795)     1.2691     0.80531760 (    0.6547     0.6175)     1.7999     1.61981763 (   -0.7711    -0.8903)     2.3557     2.77471764 (   -0.6615    -0.1941)     1.3787     0.95041765 (    0.2597     0.5811)     1.2731     0.81041766 (    0.7059     0.6787)     1.9586     1.91811769 (   -0.7353    -0.6805)     2.0038     2.00761774 (   -0.3456    -0.5799)     1.3501     0.91141775 (   -0.5955    -0.3409)     1.3724     0.94181777 (    0.6860     0.7067)     1.9697     1.93991778 (    0.6015     0.3305)     1.3726     0.94201780 (   -0.7709    -0.9791)     2.4923     3.10581781 (   -0.8193    -0.3706)     1.7984     1.61711783 (    0.7863     0.7897)     2.2287     2.48361784 (    0.6386     0.3798)     1.4859     1.10401786 (   -0.6527    -0.6889)     1.8979     1.80111794 (    0.6092     0.6963)     1.8502     1.71171795 (    0.6403     0.4078)     1.5183     1.15271797 (   -0.6073    -0.9037)     2.1776     2.37091798 (   -0.8947    -0.5811)     2.1336     2.27611800 (    0.6402     0.7746)     2.0097     2.01951801 (    0.7210     0.5212)     1.7793     1.58291803 (   -0.5467    -0.6950)     1.7685     1.56381804 (   -0.6232    -0.3690)     1.4485     1.04901809 (   -0.6457    -0.5318)     1.6731     1.39961811 (    0.4876     0.6466)     1.6196     1.31151812 (    0.6688     0.4906)     1.6589     1.37591814 (   -0.4376    -0.7728)     1.7762     1.57741815 (   -0.8517    -0.6448)     2.1364     2.28221817 (    0.4681     0.6593)     1.6172     1.30761818 (    0.6824     0.5767)     1.7870     1.59661820 (   -0.3808    -0.5756)     1.3804     0.95271821 (   -0.5773    -0.3722)     1.3739     0.94381826 (   -0.5235    -0.5277)     1.4866     1.10501828 (    0.3961     0.5850)     1.4130     0.99821829 (    0.6447     0.5126)     1.6473     1.35681831 (   -0.3013    -0.6583)     1.4480     1.04841832 (   -0.8076    -0.6817)     2.1138     2.23411834 (    0.3556     0.5394)     1.2922     0.83491835 (    0.5755     0.5113)     1.5396     1.18511838 (   -0.5621    -0.4479)     1.4374     1.03301843 (   -0.5577    -0.6293)     1.6817     1.41401846 (    0.6783     0.5931)     1.8021     1.62381849 (   -0.7589    -0.7348)     2.1127     2.23171852 (    0.5611     0.4844)     1.4826     1.09901855 (   -0.5268    -0.4049)     1.3287     0.88281857 (    0.4479     0.5029)     1.3469     0.90711860 (   -0.4040    -0.5545)     1.3723     0.94151863 (    0.6084     0.5940)     1.7006     1.44611866 (   -0.7135    -0.7572)     2.0808     2.16481869 (    0.6235     0.5931)     1.7211     1.48101872 (   -0.6399    -0.5927)     1.7444     1.52141877 (   -0.3922    -0.5688)     1.3818     0.95471880 (    0.5493     0.5693)     1.5822     1.25171883 (   -0.6106    -0.7427)     1.9230     1.84901884 (   -0.6148    -0.3051)     1.3727     0.94221886 (    0.5917     0.6357)     1.7368     1.50831887 (    0.5719     0.3247)     1.3153     0.86501889 (   -0.5916    -0.6428)     1.7472     1.52641892 (    0.5014     0.4698)     1.3743     0.94431895 (   -0.5455    -0.3918)     1.3432     0.90211897 (    0.4741     0.5314)     1.4243     1.01441900 (   -0.4978    -0.6858)     1.6949     1.43641901 (   -0.6572    -0.4270)     1.5675     1.22851903 (    0.4999     0.6011)     1.5636     1.22241904 (    0.6008     0.4289)     1.4763     1.08981906 (   -0.4765    -0.6516)     1.6144     1.30321907 (   -0.5718    -0.3313)     1.3216     0.87331912 (   -0.5328    -0.4542)     1.4002     0.98031914 (    0.4262     0.5720)     1.4267     1.01771915 (    0.5523     0.4458)     1.4195     1.00751917 (   -0.4583    -0.7025)     1.6776     1.40711918 (   -0.7217    -0.5466)     1.8107     1.63931920 (    0.4318     0.5975)     1.4744     1.08691921 (    0.6397     0.4978)     1.6212     1.31421932 (    0.4983     0.4477)     1.3398     0.89751934 (   -0.3503    -0.6434)     1.4650     1.07321935 (   -0.7401    -0.6257)     1.9382     1.87841937 (    0.3682     0.5738)     1.3636     0.92971938 (    0.6561     0.5568)     1.7210     1.48091941 (   -0.5630    -0.4198)     1.4046     0.98641949 (    0.5201     0.4733)     1.4065     0.98921951 (   -0.2489    -0.5846)     1.2707     0.80741952 (   -0.7649    -0.7377)     2.1253     2.25841955 (    0.6854     0.6165)     1.8438     1.69971958 (   -0.5426    -0.4192)     1.3713     0.94031966 (    0.5802     0.5520)     1.6017     1.28261969 (   -0.6955    -0.7515)     2.0479     2.09691972 (    0.6026     0.6063)     1.7097     1.46151975 (   -0.5296    -0.4935)     1.4477     1.04791980 (   -0.4691    -0.5739)     1.4825     1.09891983 (    0.5817     0.6276)     1.7116     1.46471984 (    0.5541     0.3526)     1.3135     0.86271986 (   -0.6485    -0.7723)     2.0169     2.03381987 (   -0.6461    -0.3541)     1.4735     1.08561989 (    0.5044     0.5461)     1.4868     1.10541992 (   -0.4451    -0.4639)     1.2859     0.82671998 (   -0.5347    -0.3992)     1.3346     0.89062000 (    0.5005     0.6019)     1.5656     1.22552001 (    0.5902     0.4642)     1.5018     1.12762003 (   -0.5160    -0.7321)     1.7913     1.60432004 (   -0.6948    -0.4559)     1.6621     1.38132006 (    0.4467     0.5232)     1.3758     0.94642007 (    0.5014     0.3821)     1.2608     0.79482009 (   -0.3997    -0.4930)     1.2694     0.80572015 (   -0.5653    -0.5043)     1.5151     1.14782018 (    0.5651     0.5139)     1.5276     1.16682020 (   -0.3460    -0.6168)     1.4144     1.00022021 (   -0.6781    -0.5294)     1.7206     1.48022023 (    0.3921     0.5192)     1.3013     0.84672024 (    0.5370     0.4306)     1.3767     0.94762035 (    0.4505     0.4546)     1.2799     0.81912038 (   -0.6117    -0.5310)     1.6200     1.31232041 (    0.5376     0.4939)     1.4600     1.06582044 (   -0.5229    -0.3653)     1.2757     0.8137

可以发现能量主要集中在“高频”部分。大部分有声音的帧基本都是如此。

看上去有点像“高频”部分是spectral details, “低频”部分就是spectral envolope。

有关包络Spectral Envelope的疑问相关推荐

  1. 声音信号处理笔记(一)

    声音信号处理(Audio Signal Processing)笔记 什么是声音? 声音是一种由振源(vibrating source)造成的机械波(mechanical waves). 波(waves ...

  2. 声音处理之-梅尔频率倒谱系数(MFCC)

    声音处理之-梅尔频率倒谱系数(MFCC) 梅尔(Mel)频率分析 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱 ...

  3. 基于线性预测的语音编码原理解析

    文 | 拍乐云 早期的音频系统都是基于声音的模拟信号实现的,在声音的录制.编辑和播放过程中很容易引入各种噪声,从而导致信号的失真.随着信息技术的发展,数字信号处理技术在越来越多领域得到了应用,数字信号 ...

  4. 语音识别(四)——DTW, Spectrogram, Cepstrum Analysis

    DTW Dynamic Time Warping是Vintsiuk于1968年提出的算法. Taras Klymovych Vintsiuk,1939-2012,乌克兰科学家,毕业于Kyiv Poly ...

  5. 遭遇棘手 交接_Librosa的城市声音分类-棘手的交叉验证

    遭遇棘手 交接 大纲 (Outline) The goal of this post is two-fold: 这篇文章的目标有两个: I'll show an example of implemen ...

  6. 声谱图,梅尔语谱,倒谱,梅尔倒谱系数

    常用的频域音频特征 语音特征提取.声音信号本是一维的时域信号,直观上很难看出频率变化规律.傅里叶变换可把它变到频域上,虽然可看出信号的频率分布,但是丢失了时域信息,无法看出频率分布随时间的变化.为了解 ...

  7. MATLAB语音识别

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 国内语音识别行业的佼佼者科大讯飞的语音听写准确率则达到了95%,表现强悍. 国内诸 ...

  8. 语音信号处理基础(八)——同态处理、倒谱、复倒谱

    文章目录 1.对短时过零率针对不同语音片段进行验证 2.验证窗函数 3.语音的同态处理.复倒谱.倒谱 倒谱图形分析 总结: 1.对短时过零率针对不同语音片段进行验证 短时平均过零率表示一帧语音中语音信 ...

  9. 语音信号处理基础(二)

    语音信号处理基础(二) 1.2.2 语音编码 语音编码的目的 保证在一定语音质量的前提下,尽可能降低编码比特率,以节省频率资源. 语音编码技术的鼻祖:研究开始于1939年军事保密通信的需要,贝尔电话实 ...

最新文章

  1. 关于PKI架构(使用证书)保护Web访问的安全实现SSL的基本理论
  2. android谷歌返色状态栏实例,Android实现状态栏(statusbar)渐变效果的示例
  3. Restful API的设计思路
  4. 剖析Linux系统启动过程(二)
  5. 计算机网络西北大学,西北大学计算机网络复习资料 (拟).doc
  6. [Leetcode][第415题][JAVA][字符串相加][双指针]
  7. java单元格合并多列_ElementUI表格列相同值自动合并单元格( 多列 )
  8. 第七章 路由器、交换机及其操作系统介绍
  9. 关于Windows下使用CuteFTP向Ubuntu传文件时提示“请求被拒绝”
  10. raspberry pi 4检查ch340/ch341驱动
  11. CUDA优化之PReLU性能调优
  12. Python爬虫系列之爬取美团美食板块商家数据,选困的福利
  13. Swift语言实战晋级-第9章 游戏实战-跑酷熊猫-1
  14. 最大元和最小元(直接求解法和分治法)
  15. 我的25年嵌入式生涯-周立功
  16. 内网环路怎么解决_利用生成树协议巧妙解决局域网二层环路
  17. 条码打印机的场景应用及条码打印机的特点有哪些
  18. 伪类选择器和伪元素选择器
  19. NLP01(自然语言处理)第一章 绪论
  20. 手把手教你从微软官网上下载系统镜像【保持最新版】

热门文章

  1. RDKit | 化合物描述符向量化及部分结构检索
  2. Jupyter notebook与Spyder集成
  3. MonkeyRunner的使用二
  4. python如何自定义函数_python基础之函数(自定义函数)
  5. PCE:南农张瑞福组揭示微生物肥料菌种芽孢杆菌应对植物免疫防卫实现根际定殖的新策略...
  6. ISME:南农沈其荣团队基于大数据准确预测土壤的枯萎病发生
  7. 宏基因组数据提交GSA实操手册—发表文章前必备技能
  8. pandas使用apply函数将dataframe多个数据列整合为元组形式并生成新的数据列(combine multiple columns as a single column of tuples)
  9. python使用matplotlib可视化、为可视化图像的X轴和Y轴设置自定义的轴标签(axis labels of matplotlib plot)
  10. 机器学习数据预处理之缺失值:预测填充(回归模型填充、分类模型填充)