依赖库:
python-speech-features-0.6

import python_speech_features
import numpy as np
import scipy.io.wavfile
from matplotlib import pyplot as plt
import os'''
signal - 需要用来计算特征的音频信号,应该是一个N*1的数组
samplerate - 我们用来工作的信号的采样率
winlen - 分析窗口的长度,按秒计,默认0.025s(25ms)
winstep - 连续窗口之间的步长,按秒计,默认0.01s(10ms)
numcep - 倒频谱返回的数量,默认13
nfilt - 滤波器组的滤波器数量,默认26
nfft - FFT的大小,默认512
lowfreq - 梅尔滤波器的最低边缘,单位赫兹,默认为0
highfreq - 梅尔滤波器的最高边缘,单位赫兹,默认为采样率/2
preemph - 应用预加重过滤器和预加重过滤器的系数,0表示没有过滤器,默认0.97
ceplifter - 将升降器应用于最终的倒谱系数。 0没有升降机。默认值为22。
appendEnergy - 如果是true,则将第0个倒谱系数替换为总帧能量的对数。
'''def get_mfcc(data, fs, winSize, winStep):# MFCCwav_feature = python_speech_features.mfcc(data, fs,numcep=13, winlen=winSize, winstep=winStep,  # winstep = 0.01nfilt=26, nfft=512, lowfreq=0, highfreq=None, preemph=0.97)# 一阶差分 二阶差分 MFCC d_mfcc_feat = python_speech_features.delta(wav_feature, 1)d_mfcc_feat2 = python_speech_features.delta(wav_feature, 2)feature = np.hstack((wav_feature, d_mfcc_feat, d_mfcc_feat2))# 三者叠加 尺寸为 【len:39】return featuredef readWavToMFCCnpy(path, destination, win=0.025, step=0.025):idx = 0for wav in os.listdir(path):idx += 1if idx % 100 == 1:print("======= ",idx,"MFCC npy done =======")sample_rate, signal = scipy.io.wavfile.read(path +"/"+ wav)mfcck = get_mfcc(signal, sample_rate, win, step)np.save(destination + "/" + "win{}step{}-{}.npy".format(win*1000, step*1000, wav.split(".wav")[0]), mfcck)print("----------------------finish get_mfcc----------------------")if __name__ == '__main__':# 源wav路径 和 npy存放路径 和 窗长 和 移动长source_path = "D:/ASVsproof/2017v2/ASVspoof2017_V2_train"des_path = "D:/ASVsproof/2017v2npy/train"readWavToMFCCnpy(source_path, des_path, win=0.025, step=0.01)

python 提取MFCC特征、一阶差分及二阶差分相关推荐

  1. 一阶差分与二阶差分及还原

    一阶差分与二阶差分及还原 一阶差分 arr = np.arange(10) np.random.shuffle(arr) arr = pd.Series(arr) arr d1 = arr.diff( ...

  2. ARIMA一阶差分和二阶差分还原

    文章目录 一.思路: 1.差分 2.还原 2.1 一阶差分还原 2.2 二阶差分还原 二.python实现 一.思路: 1.差分 原始序列:a1,a2,a3,a4,a5,a6,a7a_1,a_2,a_ ...

  3. LibROSA库提取MFCC特征的过程解析

    目录 源码解析 获取梅尔频谱 分帧 加窗 快速傅里叶变换 梅尔滤波器 取对数 离散余弦变换 总结 LibROSA(本文使用的版本是0.6.3)中的mfcc函数可以用来提取音频的梅尔频率倒谱系数(Mel ...

  4. python提取人物特征_基于图像人物面部表情识别的特征提取优化方法与流程

    本发明涉及一种基于图像人物面部表情识别的特征提取优化方法,主要利用基于统计特征提取的二维主成分分析法和改进的粒子群算法优化图像矩阵的解,属于图像处理.模式识别和计算机视觉交叉技术应用领域. 背景技术: ...

  5. 声音信号识别(一)——提取MFCC特征

    文章背景 本文基于对特殊声音(警笛声.汽车鸣笛声)的MFCC特征提取. 应用软件:MATLAB 2020A 数据集来源:由于作为自己学习过程中的记录,暂时采用 1.

  6. python声音分类_Python音频信号分类MFCC特征神经网络

    我试图把声音信号从语音到情感进行分类.为此,我提取音频信号的MFCC特征,并将其输入到一个简单的神经网络(由PyBrain的BackpropTrainer训练的前馈网络).不幸的是结果非常糟糕.从这5 ...

  7. 【语音识别】基于mfcc特征模板匹配算法实现声纹识别matlab源码含GUI

    在任意一个Automatic speech recognition 系统中,第一步就是提取特征.换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊, ...

  8. 利用python声音处理库librosa提取声音信号的mfcc特征及特征融合

    利用python库librosa提取声音信号的mfcc特征及特征融合 前言 librosa库介绍 librosa 中MFCC特征提取函数介绍 解决特征融合问题 总结 前言 写这篇博文的目的有两个,第一 ...

  9. 语音识别MFCC 一阶差分与二阶的含义

    我们都知道MFCC很好的表达了语音的特征,但只是静态的特征.提取动态特征,一般都采用一阶二阶差分,但一阶二阶差分究竟表示什么,什么含义: 一阶差分就是离散函数中连续相邻两项之差:定义X(k),则Y(k ...

最新文章

  1. Windows下编译TensorFlow1.3 C++ library及创建一个简单的TensorFlow C++程序
  2. Qt Linguist手册
  3. 清华大学 张春良 计算机系,南京张春良老师小学生信息学辅导
  4. python位运算符_详细介绍Python语言中的按位运算符
  5. 静态页面实现include
  6. numpy版本过高的解决方案
  7. 利用 MPI 进行蒙特卡洛模拟
  8. L2-035 完全二叉树的层序遍历 (25 分)-PAT 团体程序设计天梯赛 GPLT
  9. java中rhino什么用_使用require.js和Java / Rhino解析模块
  10. 《Nmap渗透测试指南》—第7章7.10节扫描Web漏洞
  11. 接口与抽象类的应用(包括各自设计模式)
  12. 【web前端特效源码】使用HTML5+CSS3制作一个会动的文字闪动动画效果~~适合初学者~超简单~ |前端开发|IT软件
  13. MAX30102学习笔记(下)
  14. avue-crud初始化下拉列表,以及复选框,默认选中
  15. 即构上线“语音社交+互动直播”鉴黄整套方案
  16. k8s 配置存储之 Configmap secret
  17. Maven中settings文件详解
  18. flask 智能图灵机器人
  19. 工业过程建模与先进控制(三)MPC基本原则
  20. Labview视觉一键尺寸测量仪,多产品

热门文章

  1. 代码解析之自行车模型在Apollo规划中的应用
  2. iPhone14升级iOS16.4正式版后无法连接WiFi怎么办?
  3. 【开源电机驱动】电流数据处理与分析
  4. LeetCode - 593 有效的正方形
  5. 记【友盟+】Outing之旅 | 山西篇 (内附招聘)
  6. 广西交科集团业务大规模容器化最佳实践
  7. some any和all的区别
  8. 网格化管理管理新概念
  9. TVS Schottky Zenner介绍
  10. python计算24点