语音信号处理及特征提取
1.信号处理基础
模拟信号->数字信号转化 步骤:采样和量化
奈奎斯特定律 :采样频率大于信号中最大频率的二倍
即在原始信号的一个周期中,至少要采样两个点,才能有效杜绝频率混叠问题。
信号进行离散傅里叶变换的条件: 时域离散且周期的信号
DFT的性质:
1.对称性
2. x(m)表示的是谱密度
如果对一个幅度为A实正弦波进行N点DFT,则DFT之后,对应频率上的幅度M和A之间的关系为:
M=A/(2/N)=(AN)/2
3.DFT的线性
4.时移性,对x(n)左移k个采样点,得到x1(n)=x(n-k)
为了提高频率轴的分辨率,可以通过延长时域的信号长度,通常对信号进行补0。在语音特征提取阶段,对于16k的采样频率的信号,一帧语音信号长度为400个采样点,为了进行512点的FFT,通过将400个点补0,得到512个采样点,由于对称性,最后只需前275个点。
2.Fbank和MFCC特征提取
Fbank和MFCC提取流程:
2.1预加重
作用:提高信号高频部分的能量,因为高频信号衰减较快,高频信号包含很多对语音识别有利的特征。
预加重滤波器(一阶高通滤波器),对于时域输入信号x(n),预加重之后的信号:
y(n)=x(n)-a*x(n-1) 其实 0.9<=a<=1
2.2分帧加窗
分帧的过程,在时域上,即用一个窗函数和原始信号进行相乘
y[n]=w[n]x[n] w[n]为窗函数
常见的窗函数:
2.3傅里叶变换
将分帧后的语音帧由时域变换到频域,取DFT系数的模得到谱特征。
2.4梅尔滤波器组和对数操作
将线性频率转化为梅尔频率,梅尔频率和线性频率的关系:
梅尔三角滤波器组:根据其实频率、中间频率和截止频率确定各滤波器组
梅尔滤波器组设计:
1.首先确定梅尔滤波器组个数P
2. 根据采样率fs,DFT点数N,滤波器个数P,在梅尔域上等间隔的产生每个滤波器的起始频率、中间频率和截止频率。 上一个滤波器的中间频率为下一个滤波器的起始频率
3.将梅尔域上每个三角滤波器的起始频率、中间频率和截止频率转换为线性频率域,并对DFT之后的谱特征进行滤波,得到P个滤波器组能量,进行log操作得到Fbank特征
MFCC特征在Fbank特征基础上继续进行IDFT变换等操作
频域信号可以分解成谱包络和谱细节
X[m]=H[m]E[m]
log|X[m]| 梅尔普(Fbank)
log|H[m]| 谱包络
log|E[m]| 谱细节
4.
MFCC特征总结
一般常用MFCC特征维是39维,包括
MFCC特征一般用于GMM训练,Fbank特征一般用于DNN训练
语音信号处理及特征提取相关推荐
- (超详细)语音信号处理之特征提取
语音信号处理之特征提取 语音信号处理之特征提取要对语音信号进行分析,首先要分析并提取出可表示该语音本质的特征参数.有了特征参数才能利用这些特征参数进行有效的处理. 根据提取参数的方法不同,可将语音信号 ...
- 语音识别入门第二节:语音信号处理及特征提取
目录 数字信号处理基础 基础知识 傅里叶分析 常用特征提取 特征提取流程 Fbank MFCC 数字信号处理基础 基础知识 模拟信号到数字信号转化(ADC):在科学和工程中,遇到的大多数信号都是连续的 ...
- python实验六 语音信号处理
目录 实验目的: 实验原理: 实验准备: 实验步骤与内容: 参考代码: 实验目的: 依托语音信号处理领域的声学特征提取任务,学习常用的语音信号处理工具,实现对语音数据的预处理和常用特征提取等操作: 熟 ...
- 基于AI的语音信号处理技术
语音信号处理的目的就是在复杂的语音环境中提取有效的语音信息. 一.语音信号 技术思想及原理分析 语音唤醒的原理是让模型学习特定唤醒词的语音信号特征,当输入设备捕捉到一定阈值范围内的语音信号时,当前设备 ...
- 【语音信号处理】1语音信号可视化——时域、频域、语谱图、MFCC详细思路与计算、差分
基本语音信号处理操作入门 1. 数据获取 2. 语音信号可视化 2.1 时域特征 2.2 频域特征 2.3 语谱图 3. 倒谱分析 4. 梅尔系数 4.1 梅尔频率倒谱系数 4.2 Mel滤波器原理 ...
- 【信息技术】【2018.02】稳健的基于相位的语音信号处理
本文为英国谢菲尔德大学(作者:Erfan Loweimi)的博士论文,共304页. 傅立叶分析在语音信号处理中起着关键作用.作为一个复数,它可以用幅度谱和相位谱以极性形式表示.幅度谱在语音处理的各个方 ...
- python语音信号处理_现代语音信号处理笔记 (一)
本系列笔记对胡航老师的现代语音信号处理这本书的语音处理部分进行总结,包含语音信号处理基础.语音信号分析.语音编码三部分.一开始以为三部分总结到一篇文章里就可以了,但写着写着发现事情并没有那么简单... ...
- 语音信号处理_书单 | 语音研究进阶指南
作为人类最自然的交流方式,"听"和"说"包括了人类大脑皮层从听觉感知到语言处理和理解,再到声音生成这个"神奇"的认知过程.语音领域的探索和研 ...
- matlab关于噪声课设,基于matlab的有噪声的语音信号处理的课程设计.doc
基于matlab的有噪声的语音信号处理的课程设计.doc DSP实验课程设计实验报告DSP实验课程设计实验报告姓名学号班级1课程设计题目基于MATLAB的有噪声的语音信号处理的课程设计.2课程设计的目 ...
- 语音信号处理MATLAB实现
matlab语音信号处理的一段代码 涉及到的函数sound()函数audioread()函数 sound函数的输入参量是音频数据向量.采样频率和转换位数. 也可以自己写些声音数据.下面的声音声调和频率 ...
最新文章
- HDU 6035 Colorful Tree(补集思想+树形DP)
- jquery实战-定宽(二)
- 通过MATLAB读取mnist数据库
- 阿里巴巴向全社会开放黑科技:“泡在水里”的服务器
- 企业开发中,git提交时屏蔽某些文件,怎么搞!【idea的处理方法】
- python特殊函数__str__、__repr__和__len__
- 17 操作系统第四章 磁盘管理 磁盘的结构 磁盘调度算法 减少磁盘延迟时间的方法
- codelite linux 安装,CodeLite + MinGW环境安装
- 计算机相关专业“Python程序设计”教学大纲(参考)
- hibernate_09_关联映射_多对一
- 7.4 倒向随机微分方程-Feynman-Kac公式
- 多线程——分线程通过Handler操作界面
- c语言定时器定时1ms程序,STM32 Cubemx 配置定时器定时1mS
- 高考计算机会考等级划分标准,学考等级怎么划分2020最新标准
- 通过XMind Update制作思维导图
- 服务器nvida显卡驱动安装(亲测)
- 解析迅捷产品的八大特点
- 武汉地铁站点最短路径搜索的实现(一)——Dijkstra算法(资料收集)
- win7创建任务计划:自动关机命令
- 有哪些巧妙说服对方的说话技巧