1. 对于时长 T=2s 的音频信号 path.wav,设置采样率为 sr=24000。

  2. 采样之后,生成音频时间序列 y,其中 len(y) = T * sr = 2 × 24000 = 48000,y.shape = (48000, ),sr=24000。

import librosa
# 读取音频
y, sr = librosa.load(path='path.wav', sr=24000)
print(len(y), y.shape, sr)
  1. 设置:
  • 帧移:frame_shift = 0.0125s,帧长:frame_length = 0.05s。(使用帧长 frame_length=0.05s 的窗口对 T=2s 的音频信号进行处理,帧移 frame_shift=0.0125s,则生成的帧数为:2 / 0.0125 = 160(帧) )

  • 使用sr=24000的采样率,对序列处理:
    帧移:hop_length = frame_shift * sr = 0.0125 × 24000 = 300,
    window()加窗,窗长:win_length = frame_length * sr = 0.05 × 24000 = 1200。
  1. 对音频时间序列 y 进行分帧处理,加窗-帧移之后,得到的帧数 t = len(y) / hop_length + 1 = 48000 / 300 + 1 = 161。目前还不清楚为什么程序处理会多一帧,后续补充。
# 短时傅里叶变换
stft_matrix = librosa.stft(y=y, n_fft=2048, hop_length=300, win_length=1200)
print(stft_matrix.shape)     # shape=(1 + nfft/2 , t), 其中 t=len(y)/hop_length + 1
"""
结果:(1025, 161)
"""

使用librosa库对音频信号进行采样以及分帧处理相关推荐

  1. LibROSA库提取MFCC特征的过程解析

    目录 源码解析 获取梅尔频谱 分帧 加窗 快速傅里叶变换 梅尔滤波器 取对数 离散余弦变换 总结 LibROSA(本文使用的版本是0.6.3)中的mfcc函数可以用来提取音频的梅尔频率倒谱系数(Mel ...

  2. pytorch深度学习之音频librosa库与torchaudio库的安装与使用(windows和ubuntu)

    pytorch深度学习之音频librosa库与torchaudio库的安装与使用 搭建pytorch 基本框架 与 anaconda pytorch虚拟环境创建,去看这里 导入librosa库与tor ...

  3. matlab音频信号的采样与重构,信号与系统实验(MATLAB 西电版)实验21 综合实验2-音频信号的采样与重构.ppt...

    [摘要]一.实验目的 在掌握相关基础知识的基础上,学会自己设计实验,学会运用MATLAB语言编程,并具有进行信号分析的能力. 音频信号是一种连续变化的模拟信号,计算机只能处理和记录二进制的数字信号, ...

  4. 音频文件格式转化,librosa库支持的语音文件类型

    语音文本格式转化及在librosa库的语音文本输入要求 闲话少说,直接上料! python的librosa库是语音模型进行语音特征提取的常见的库:但使用时请注意,librosa库仅支持wav格式的语音 ...

  5. 使用librosa库实现100行代码制作音乐卡点视频

    平台:windows 10 家庭中文版 ide:pycharm 环境:3.7 数字信号处理技术:≈0 librosa库 LibROSA is a python package for music an ...

  6. Python 音频处理以及可视化 Amplitude,MFCC,Mel Spectrogram, librosa 库

    利用python库 librosa库对于音频文件进行预处理,以及可视化操作. 1. Load Audio Data 导入音频 将音频文件(这里使用苹果录音文件 .m4a 格式)导入librosa,音频 ...

  7. Librosa库——语音识别,语音音色识别训练及应用

    很多同学以为语音识别是非常难的,其实并不然,起初我也是这么认为,但后来发现语音识别是最简单的,因为同学们可能不知道Python有一个音频处理库Librosa,这个库非常的强大,可以进行音频处理.频谱表 ...

  8. 信号处理(二)音频信号的分帧, 加窗

    1 .语音信号的三个参数 语音信号有三个重要的参数:声道数.取样频率和量化位数. 声道数:单声道或者双声道 采样频率:一秒钟对声音采样的次数,例如10000HZ代表一秒钟将信号分解为10000份,当采 ...

  9. 深度学习(PyTorch)——librosa库的使用

    librosa是一个非常强大的python语音信号处理的第三方库, 先总结一下本文中常用的专业名词:sr:采样率.hop_length:帧移.overlapping:连续帧之间的重叠部分.n_fft: ...

  10. Python之librosa库语音信号处理

    librosa是一个非常强大的python语音信号处理的第三方库,本文参考的是librosa的官方文档,本文主要总结了一些重要,对我来说非常常用的功能. 学会librosa后再也不用用python去实 ...

最新文章

  1. 【 MATLAB 】两个序列的卷积和运算的MATLAB实现(2)
  2. CSS样式:position: absolute
  3. 9.7 top:实时显示系统中各个进程的资源占用状况
  4. 机器学习实战(用Scikit-learn和TensorFlow进行机器学习)(四)
  5. 微信小程序利用缓存提高接口请求性能
  6. angular-cli构建
  7. 信息学奥赛C++语言:求n个数的和
  8. Codeforces 964B(贪心)
  9. python可视化图表生成(一)
  10. 塔防游戏制作教程(一)
  11. c语言中isupper用法,isupper - [ C语言中文开发手册 ] - 在线原生手册 - php中文网
  12. html5中nav标签(导航链接)的详细介绍
  13. a-upload文件夹上传
  14. 后来的我们都老了——看《后来的我们》
  15. 第7章第32节:五图排版:五张图片并列排版 [PowerPoint精美幻灯片实战教程]
  16. Tiny 4412 lcd 驱动分析
  17. 树莓派新手使用iobroker日志三(米家全家桶加入iobroker)
  18. 曲速未来:区块链用于房地产是否会起作用
  19. 微电子科学与工程与计算机硬件的关系,微电子科学与工程和电子信息工程区别...
  20. 13级计算机商务沟通与礼仪结课论文,【商务礼仪结课论文 900字】范文118论文

热门文章

  1. 计算机部分应用显示模糊,win10系统打开部分软件字体总显示模糊的解决方法-电脑自学网...
  2. dns服务器哪个稳定,几个非常好用的DNS服务器(解决电信DNS此劫问题) - 电脑技术,dns,ricky,...
  3. ICMP协议详解和作用
  4. 沪深300成分股分析
  5. win10下装黑苹果双系统
  6. 如何解决windows资源管理器已停止工作?两种方法教会你
  7. 【微信小游戏】微信小游戏开发设置竖屏
  8. 批量去除Word的向下小箭头
  9. 七周成为数据分析师 第三周:Excel篇
  10. 一个由2020年1月7日 京东出现的重大 Bug 漏洞引起的思考...