librosa.effects.split
- librosa.core.load
librosa.core.load(path, sr=22050, mono=True, offset=0.0, duration=None)
返回值:
y:np.ndarray [shape =(n,)或(2,n)] 音频时间序列
sr:number> 0 [标量] y的采样率
y, sr = librosa(filename, sr)
- librosa.effects.split
librosa.effects.split(y, top_db=60, ref=<function amax at 0x7fcba2eb3d90>, frame_length=2048, hop_length=512)
将音频信号分成非静音间隔。
参数:
y:np.ndarray,shape =(n,)或(2,n)音频信号
top_db:数字> 0 低于参考值的阈值(以分贝为单位)被视为静音
ref:参考功率。 默认情况下,它使用np.max并与信号中的峰值功率进行比较。
frame_length:int> 0 每帧的样本数
hop_length:int> 0 帧之间的样本数
返回值:
间隔:np.ndarray,shape =(m,2)
interval [i] ==(start_i,end_i)是非静音间隔i的开始和结束时间(以样本为单位)。
intervals = librosa.effects.split(utter, top_db=20)
- librosa.core.stft
librosa.core.stft(y, n_fft=2048, hop_length=None, win_length=None, window=‘hann’, center=True, pad_mode=‘reflect’)
y:np.ndarray [shape =(n,)],实值. 输入信号
n_fft:int> 0 [标量] 用零填充后窗口信号的长度。默认值n_fft = 2048
在语音处理中,推荐值为512
hop_length:int> 0 [标量] 相邻STFT列之间的音频样本数。默认为win_length / 4。
win_length:int <= n_fft [标量] 音频的每个帧都由长度为win_length的window()进行窗口化,然后用零填充以匹配n_fft。默认为win_length = n_fft。
window:窗口函数长度为n_fft的向量或数组, 默认 hann窗
返回值:
D:np.ndarray [shape =(1 + n_fft / 2,n_frames),dtype = dtype]
短期傅立叶变换系数的复值矩阵。
librosa.effects.split相关推荐
- librosa 音频处理
目录 序言 一.libsora安装 pypi conda source 二.librosa常用功能 核心音频处理函数 音频处理 频谱表示 幅度转换 时频转换 特征提取 绘图显示 三.常用功能代码实现 ...
- Librosa音频处理(六)
劣质的麦克风在录音时会把电流和嗡嗡的背景声录进去,通过对噪声取样去除频率可以达到降噪的目的. 主要步骤: 1. 噪声取样 2. 统计频率 3. 移除频率 代码如下: '''采样降噪''' def te ...
- librosa | 系统实战(五~十七)
文章目录 [ (一 ~ 四)librosa学习点此处](https://blog.csdn.net/qq_44250700/article/details/119685358) 五.频谱特性 Spec ...
- 基于Tensorflow实现声纹识别
前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...
- 声纹识别开源框架python_GitHub - yeyupiaoling/VoiceprintRecognition-Tensorflow: 使用Tensorflow实现声纹识别,博客地址:...
前言 本章介绍如何使用Tensorflow实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章<基于Tensorflow实现声音分类>.基于这个知识基础之上,我们训练 ...
- 使用Tensorflow实现声纹识别
原文博客:Doi技术团队 链接地址:https://blog.doiduoyi.com/authors/1584446358138 初心:记录优秀的Doi技术团队学习经历 本文链接:使用Tensorf ...
- 基于Tensorflow的环境声音分类
博客转自于:https://yeyupiaoling.blog.csdn.net/article/details/105708251#t2 前言 本章我们来介绍如何使用Tensorflow训练一个区分 ...
- 声学参数-MELMFCC-RayhanePPG_hjk2标准: PPG项目audio_hjk2处理wav文件对比Tacotron-Rayhane的audio处理
0. 说明 参考https://www.cnblogs.com/LXP-Never/p/11561355.html 谢谢作者~ audio_hjk2是我用来提取PPG+mel+mfcc+linear的 ...
- python小问题:依赖包/conda-forge/conda无法安装包/librosa/
依赖包 必须先安装某个版本的某包,这就是依赖 conda-forge 是conda的一个channel,如果不使用这个channel,则使用默认的conda default channel 有的时候会 ...
最新文章
- Java数据结构与算法(八)-二叉树
- 面试必备|带你彻底搞懂Python生成器
- 利用反射及ActionFilterAttribute实现MVC权限管理
- VC遍历窗体控件的实现
- c 传图片数据给matlab,c++ - 如何通过UDP将数据从C ++应用程序发送到Matlab并进行绘制 - 堆栈内存溢出...
- Spring 事务core 模块-JdbcTeamplate 对象
- Node.js Express 应用启用资源压缩功能 - compression 库的应用
- jmeter的逻辑控制器
- git的SSH上传方式
- 一些and知识 和ui
- 问卷与量表数据分析(SPSS+AMOS)学习笔记(五) : 问卷星数据处理
- 维控触摸屏编程手册_维控触摸屏ab plc地址编程实例
- 诡异的 com.mysql.cj.jdbc.exceptions.MysqlDataTruncation: Data truncation: Data too long for column “dat
- MyEclipse 2016 的破解激活
- 如何安装PrCC2019
- 案例 7-1.3 寻找大富翁(25 分)
- 信息安全中常见的网络知识(一)网络基本概念
- html5源码笔记【爱创课堂专业前端培训】
- 是不是还在为毕业设计而发愁,看了这篇文章,相信你会感谢我的
- Person Re-Identification(ReID行人重识别)