基于听觉特性的Mel频率倒谱分析
基于听觉特性的Mel频率倒谱分析
心理学研究表明:人类对于声音音调的感觉其实都不是线性的
客观上:用频率表示
主观上:音调的单位用Mel标度
- 公式
根据人耳对低频信号比对高频信号更敏感这一原则,研究者根据心理学实验得到了类似于耳蜗作用的一组滤波器组 ,这就是Mel频率滤波器组。滤波器组一般为20-40个(26个最好)三角形滤波器
Mel-频率
目的:模拟人耳对不同频率语音的感知
人类对不同频率语音有不同的感知能力
- 1kHz以下,与频率成线性关系
- 1kHz以上,与频率成对数关系
Mel频率定义:1Mel—1kHz音调感知程度的1/1000
Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)
MFCC计算过程
- 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅立叶变换得到其频谱
- 对于每一帧,计算周期功率谱
- 将Mel滤波器应用到功率谱中,计算每个滤波器的能量和
- 将每个滤波器的输出取对数(模仿人耳对数式感知声强、压缩动态范围),得到相应频带的对数功率谱
- 对每个对数能量进行离散余弦变换(DCT,滤波器通常都有交叠,因此滤波器能量彼此相关;DCT对能量进行去相关),得到26个MFCC系数
- 保留DCT的2-13个系数,其余系数舍去(因为DCT的高阶系数代表滤波器能量的快速变化,事实证明这些快速变化影响语音识别的表现,所以我们去除高阶系数)
- 这种直接得到的MFCC特征作为静态特征,将这种静态特征做一阶和二阶差分,得到相应的动态特征(二阶差分:一阶差分的差分)
MFCC将人耳的听觉感知特性和语音的产生机制相结合,因此目前大多数语音识别系统中广泛使用这种特征
过程:
- 语音输入
- 预处理
- 数字化
- 特征提取——整段语音最后变成一系列特征向量
- 增加一阶特征(“delta”)
- 增加二阶特征(“acceleration”)
- 合并特征
MFCC特征参数:
- 26个滤波器,12个MFCC系数,外加短时能量
- 即:静态特征13维+一阶特征13维+二阶特征13维 共39维
clear all;
%读取语音信号
[x1,fs]=audioread('jia.wav');
x2=audioread('jia1.wav');
x3=audioread('yi.wav');
% 帧长
wlen=256;
% 帧移
inc=128;
%MEL滤波器个数
p=24;
% 幅值归一化
x1=x1/max(abs(x1));
x2=x2/max(abs(x2));
x3=x3/max(abs(x3));
%调用函数z_mfcc,计算mfcc参数
ccc1=z_mfcc(x1,fs,p,wlen,inc);
ccc2=z_mfcc(x2,fs,p,wlen,inc);
ccc3=z_mfcc(x3,fs,p,wlen,inc);
%比较mfcc参数
figure(1)
ccc_1=ccc1(:,1);
ccc_2=ccc2(:,1);
plot(ccc_2,'-g');hold on
plot(ccc_1,'-b');
xlabel('甲和甲1的MFCC比较','fontsize',12);
ylabel('幅值','fontsize',12);figure(2)
ccc_1=ccc1(:,1);
ccc_3=ccc3(:,1);
plot(ccc_3,'-g');hold on
plot(ccc_1,'-b');
xlabel('甲和乙的MFCC比较','fontsize',12);
ylabel('幅值','fontsize',12);
效果:
基于听觉特性的Mel频率倒谱分析相关推荐
- 语音信号的同态处理、倒谱分析和Mel频率倒谱系数
1 同态处理 信号的同态处理也称同态滤波.大概步骤为: f(x,y)→ln→DFT→H(u,v)→(DFT)-1→exp→g(x,y) 虽然,一般用于图像处理.但是,博主将同态滤波用于语音信号的滤波. ...
- Mel频率倒谱系数-MFCC
MFCC:Mel频率倒谱系数的缩写. 目的:模拟人耳对不同频率语音的感知 Mel频率和Hz频率的关系 人类对不同频率语音有不同的感知能力: 1kHz以下,与频率成线性关系. 1kHz以上,与频率成对数 ...
- matlab求解rl电路,基于MATLAB的RL并联电路频率响应特性分析
目录 摘要............................................................................................... ...
- 声音处理之-梅尔频率倒谱系数(MFCC)
声音处理之-梅尔频率倒谱系数(MFCC) 梅尔(Mel)频率分析 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱 ...
- 语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现
梅尔倒谱系数(MFCC) 梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC).依据人的听觉实验结果来分析语音的频谱, MFCC分析依据的听觉 ...
- 连续语音信号的短时倒谱分析及其参数用途
文章目录 前言 基本概念 倒谱和倒谱参数 1.倒谱 2.复倒谱 3.倒谱计算 (1).由声门激励信号提取基音周期 (2).由声道冲激响应估算共振峰 4.倒谱的频谱 5.倒谱距离 6.Mel频率倒谱系数 ...
- 语音信号处理之(四)梅尔频率倒谱系数(MFCC)
在任意一个Automatic speech recognition 系统中,第一步就是提取特征.换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊, ...
- 模糊图像的倒谱matlab,基于倒谱分析方法的离焦模糊图像特征鉴别
基于倒谱分析方法的离焦模糊图像特征鉴别 [摘要]在图像拍摄记录的过程中,图像捕获系统因各种原因常常不能精确成像,故而极易产生模糊图像,离焦模糊是常见的模糊图像之一.本文重点介绍了一种倒谱分析方法,在倒 ...
- 梅尔倒谱分析MFCC
梅尔倒谱系数 MFCC 梅尔频率倒谱系数的分析是基于人的听觉特性机理,即根据人的听觉实验结果来分析语音的频谱.因为人耳所能听到的声音高低与声音的频率并不成线性正比关系,所以用mel频率尺度更符合人耳的 ...
最新文章
- 【CVPR 2020】CVPR2020 最新论文下载!看计算机视觉2020在研究什么?
- 让浏览器判断html为手机页面,判断是从手机端还是客户端访问的页面,判断浏览器类型...
- Jsoup实现Iteye自动登录
- 程序员常用编程工具: VS Code,那些你不得不知道的小知识!
- 诗与远方:无题(六十二)
- ai python 代码提示插件_Python 还能实现哪些 AI 游戏?附上代码一起来一把!
- js做四则运算时,精度丢失问题及解决方法
- X2Paddle实践之——Tensorflow版本VGG模型转化为paddle版本模型
- Redis的高级应用-安全性和主从复制
- (转)Java 之 FileReader FileInputStream InputStreamReader BufferedReader 作用与区别
- XCT学习笔记_X射线
- ros + gazebo未报错却加载不出来机器人模型 解决办法
- 0CTF/TCTF2019 Ghost Pepper Writeup
- Mockito使用简介
- TSRC靶场赛-writeup
- macos可以升级到指定版本吗_错过Mac OS升级,找不到旧OS版本怎么办?
- trie图:Computer Viruses in Planet Pandora
- C 语言 数据类型及所占字节数
- 孤独,是优秀的必经之路
- 原生javascript-图片查看器的制作-注释版
热门文章
- 进制转换与位运算的运用
- 修复mysql表快速解决is marked as crashed and should be repaired故障
- Java 面试问题总结(详细) —— MySql 模块(MySQL高级)(建议收藏)
- 给你了解你所不了解的多摩君
- OWASP TOP10 移动安全漏洞(安卓)2017
- centos7下RabbitMQ的安装
- 2020 阿里最新面试题,掌握这些轻松拿offer
- matlab用抛物线族表示马鞍面,matlab实验报告
- 学生用计算机如何弄心形,电脑画图软件内如何绘制心形
- docker重启后启动失败Failed to start Docker Application Container Engine.