使用librosa库对音频信号进行采样以及分帧处理

对于时长 T=2s 的音频信号 path.wav，设置采样率为 sr=24000。
采样之后，生成音频时间序列 y，其中 len(y) = T * sr = 2 × 24000 = 48000，y.shape = (48000, )，sr=24000。

import librosa
# 读取音频
y, sr = librosa.load(path='path.wav', sr=24000)
print(len(y), y.shape, sr)

设置：

帧移：frame_shift = 0.0125s，帧长：frame_length = 0.05s。（使用帧长 frame_length=0.05s 的窗口对 T=2s 的音频信号进行处理，帧移 frame_shift=0.0125s，则生成的帧数为：2 / 0.0125 = 160(帧) ）

使用sr=24000的采样率，对序列处理：
帧移：hop_length = frame_shift * sr = 0.0125 × 24000 = 300，
window()加窗，窗长：win_length = frame_length * sr = 0.05 × 24000 = 1200。

对音频时间序列 y 进行分帧处理，加窗-帧移之后，得到的帧数 t = len(y) / hop_length + 1 = 48000 / 300 + 1 = 161。目前还不清楚为什么程序处理会多一帧，后续补充。

# 短时傅里叶变换
stft_matrix = librosa.stft(y=y, n_fft=2048, hop_length=300, win_length=1200)
print(stft_matrix.shape)     # shape=(1 + nfft/2 , t), 其中 t=len(y)/hop_length + 1
"""
结果：(1025, 161)
"""

使用librosa库对音频信号进行采样以及分帧处理相关推荐

LibROSA库提取MFCC特征的过程解析
目录源码解析获取梅尔频谱分帧加窗快速傅里叶变换梅尔滤波器取对数离散余弦变换总结 LibROSA(本文使用的版本是0.6.3)中的mfcc函数可以用来提取音频的梅尔频率倒谱系数(Mel ...
pytorch深度学习之音频librosa库与torchaudio库的安装与使用（windows和ubuntu）
pytorch深度学习之音频librosa库与torchaudio库的安装与使用搭建pytorch 基本框架与 anaconda pytorch虚拟环境创建,去看这里导入librosa库与tor ...
matlab音频信号的采样与重构,信号与系统实验(MATLAB 西电版)实验21 综合实验2－音频信号的采样与重构.ppt...
[摘要]一.实验目的 在掌握相关基础知识的基础上,学会自己设计实验,学会运用MATLAB语言编程,并具有进行信号分析的能力. 音频信号是一种连续变化的模拟信号,计算机只能处理和记录二进制的数字信号, ...
音频文件格式转化，librosa库支持的语音文件类型
语音文本格式转化及在librosa库的语音文本输入要求闲话少说,直接上料! python的librosa库是语音模型进行语音特征提取的常见的库:但使用时请注意,librosa库仅支持wav格式的语音 ...
使用librosa库实现100行代码制作音乐卡点视频
平台:windows 10 家庭中文版 ide:pycharm 环境:3.7 数字信号处理技术:≈0 librosa库 LibROSA is a python package for music an ...
Python 音频处理以及可视化 Amplitude，MFCC，Mel Spectrogram, librosa 库
利用python库 librosa库对于音频文件进行预处理,以及可视化操作. 1. Load Audio Data 导入音频将音频文件(这里使用苹果录音文件 .m4a 格式)导入librosa,音频 ...
Librosa库——语音识别，语音音色识别训练及应用
很多同学以为语音识别是非常难的,其实并不然,起初我也是这么认为,但后来发现语音识别是最简单的,因为同学们可能不知道Python有一个音频处理库Librosa,这个库非常的强大,可以进行音频处理.频谱表 ...
信号处理（二）音频信号的分帧，加窗
1 .语音信号的三个参数语音信号有三个重要的参数:声道数.取样频率和量化位数. 声道数:单声道或者双声道采样频率:一秒钟对声音采样的次数,例如10000HZ代表一秒钟将信号分解为10000份,当采 ...
深度学习（PyTorch）——librosa库的使用
librosa是一个非常强大的python语音信号处理的第三方库, 先总结一下本文中常用的专业名词:sr:采样率.hop_length:帧移.overlapping:连续帧之间的重叠部分.n_fft: ...
Python之librosa库语音信号处理
librosa是一个非常强大的python语音信号处理的第三方库,本文参考的是librosa的官方文档,本文主要总结了一些重要,对我来说非常常用的功能. 学会librosa后再也不用用python去实 ...

使用librosa库对音频信号进行采样以及分帧处理

使用librosa库对音频信号进行采样以及分帧处理相关推荐

最新文章

热门文章