• librosa.core.load

librosa.core.load(path, sr=22050, mono=True, offset=0.0, duration=None)

返回值:
y:np.ndarray [shape =(n,)或(2,n)] 音频时间序列
sr:number> 0 [标量] y的采样率

 y, sr = librosa(filename, sr)
  • librosa.effects.split

librosa.effects.split(y, top_db=60, ref=<function amax at 0x7fcba2eb3d90>, frame_length=2048, hop_length=512)
将音频信号分成非静音间隔。

参数:
y:np.ndarray,shape =(n,)或(2,n)音频信号
top_db:数字> 0 低于参考值的阈值(以分贝为单位)被视为静音
ref:参考功率。 默认情况下,它使用np.max并与信号中的峰值功率进行比较。

frame_length:int> 0 每帧的样本数

hop_length:int> 0 帧之间的样本数

返回值:
间隔:np.ndarray,shape =(m,2)
interval [i] ==(start_i,end_i)是非静音间隔i的开始和结束时间(以样本为单位)。

intervals = librosa.effects.split(utter, top_db=20)
  • librosa.core.stft

librosa.core.stft(y, n_fft=2048, hop_length=None, win_length=None, window=‘hann’, center=True, pad_mode=‘reflect’)

y:np.ndarray [shape =(n,)],实值. 输入信号
n_fft:int> 0 [标量] 用零填充后窗口信号的长度。默认值n_fft = 2048
在语音处理中,推荐值为512
hop_length:int> 0 [标量] 相邻STFT列之间的音频样本数。默认为win_length / 4。
win_length:int <= n_fft [标量] 音频的每个帧都由长度为win_length的window()进行窗口化,然后用零填充以匹配n_fft。默认为win_length = n_fft。
window:窗口函数长度为n_fft的向量或数组, 默认 hann窗

返回值:
D:np.ndarray [shape =(1 + n_fft / 2,n_frames),dtype = dtype]
短期傅立叶变换系数的复值矩阵。

librosa.effects.split相关推荐

  1. librosa 音频处理

    目录 序言 一.libsora安装 pypi conda source 二.librosa常用功能 核心音频处理函数 音频处理 频谱表示 幅度转换 时频转换 特征提取 绘图显示 三.常用功能代码实现 ...

  2. Librosa音频处理(六)

    劣质的麦克风在录音时会把电流和嗡嗡的背景声录进去,通过对噪声取样去除频率可以达到降噪的目的. 主要步骤: 1. 噪声取样 2. 统计频率 3. 移除频率 代码如下: '''采样降噪''' def te ...

  3. librosa | 系统实战(五~十七)

    文章目录 [ (一 ~ 四)librosa学习点此处](https://blog.csdn.net/qq_44250700/article/details/119685358) 五.频谱特性 Spec ...

  4. 基于Tensorflow实现声纹识别

    前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...

  5. 声纹识别开源框架python_GitHub - yeyupiaoling/VoiceprintRecognition-Tensorflow: 使用Tensorflow实现声纹识别,博客地址:...

    前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...

  6. 使用Tensorflow实现声纹识别

    原文博客:Doi技术团队 链接地址:https://blog.doiduoyi.com/authors/1584446358138 初心:记录优秀的Doi技术团队学习经历 本文链接:使用Tensorf ...

  7. 基于Tensorflow的环境声音分类

    博客转自于:https://yeyupiaoling.blog.csdn.net/article/details/105708251#t2 前言 本章我们来介绍如何使用Tensorflow训练一个区分 ...

  8. 声学参数-MELMFCC-RayhanePPG_hjk2标准: PPG项目audio_hjk2处理wav文件对比Tacotron-Rayhane的audio处理

    0. 说明 参考https://www.cnblogs.com/LXP-Never/p/11561355.html 谢谢作者~ audio_hjk2是我用来提取PPG+mel+mfcc+linear的 ...

  9. python小问题:依赖包/conda-forge/conda无法安装包/librosa/

    依赖包 必须先安装某个版本的某包,这就是依赖 conda-forge 是conda的一个channel,如果不使用这个channel,则使用默认的conda default channel 有的时候会 ...

最新文章

  1. Java数据结构与算法(八)-二叉树
  2. 面试必备|带你彻底搞懂Python生成器
  3. 利用反射及ActionFilterAttribute实现MVC权限管理
  4. VC遍历窗体控件的实现
  5. c 传图片数据给matlab,c++ - 如何通过UDP将数据从C ++应用程序发送到Matlab并进行绘制 - 堆栈内存溢出...
  6. Spring 事务core 模块-JdbcTeamplate 对象
  7. Node.js Express 应用启用资源压缩功能 - compression 库的应用
  8. jmeter的逻辑控制器
  9. git的SSH上传方式
  10. 一些and知识 和ui
  11. 问卷与量表数据分析(SPSS+AMOS)学习笔记(五) : 问卷星数据处理
  12. 维控触摸屏编程手册_维控触摸屏ab plc地址编程实例
  13. 诡异的 com.mysql.cj.jdbc.exceptions.MysqlDataTruncation: Data truncation: Data too long for column “dat
  14. MyEclipse 2016 的破解激活
  15. 如何安装PrCC2019
  16. 案例 7-1.3 寻找大富翁(25 分)
  17. 信息安全中常见的网络知识(一)网络基本概念
  18. html5源码笔记【爱创课堂专业前端培训】
  19. 是不是还在为毕业设计而发愁,看了这篇文章,相信你会感谢我的
  20. Person Re-Identification(ReID行人重识别)

热门文章

  1. 《MLB棒球创造营》:走近棒球运动·明尼苏达双城队
  2. C#-串口-模拟量采集软件-1
  3. AcWing:Dijkstra
  4. 计算机音乐春分秋分,春分秋分是怎么确定的
  5. 我们这一代人的困惑 - 转载
  6. Android初体验——UI
  7. 英语词性篇 - 英语疑问词
  8. 从车联网基础知识出发通往5G彼岸
  9. 多线程下载王者农药高清壁纸
  10. BZOJ2277[Poi2011]Strongbox——数论