python从语音生成MFCC特征

文章目录

  • python从语音生成MFCC特征
    • MFCC特征原理
    • 引入必要的库
    • 生成MFCC特征

MFCC特征原理

@TODO

引入必要的库

import os
import wave
import numpy as np
import matplotlib.pyplot as plt
import scipy.io.wavfile as wav
from python_speech_features import mfcc

生成MFCC特征

def gen_mfcc(audio_path, mfcc_path, sample_num=32000):spf = wave.open(audio_path, 'r')params = spf.getparams()nchannels, sampwidth, framerate, nframes = params[:4]print(nframes)strData = spf.readframes(nframes)print("nframs:", nframes)waveData = np.fromstring(strData, dtype=np.int16)spf.close()print(waveData)# tmp = np.array(np.zeros(272000), dtype=np.int16)tmp = np.array(np.zeros(sample_num), dtype=np.int16)print("esefse")for iw in range(len(waveData)):tmp[iw] = waveData[iw]print("filename")basename = audio_path.split('/')[-1].split(".")[0]print("basename", basename)ouname = mfcc_path + basenameprint(ouname)fs, audio = framerate, tmp# 26 featuresinputs = mfcc(audio, numcep=26, nfilt=26 * 2, samplerate=fs, winlen=0.02, winstep=0.01)inputs2 = np.transpose(inputs)print(np.shape(inputs2))print("---inputss--")print(inputs2)# inputs3=inputs2.reshape((224*13))inputs3 = inputs2print("inputs", inputs3)train_inputs = (inputs3 - np.mean(inputs3)) / np.std(inputs3)print(train_inputs)plt.figure(1)plt.imshow(train_inputs)plt.show()np.save(ouname, train_inputs)

python从语音生成MFCC特征相关推荐

  1. python 语音特征提取_使用python实现语音文件的特征提取方法

    概述 语音识别是当前人工智能的比较热门的方向,技术也比较成熟,各大公司也相继推出了各自的语音助手机器人,如百度的小度机器人.阿里的天猫精灵等.语音识别算法当前主要是由rnn.lstm.dnn-hmm等 ...

  2. python声音分类_Python音频信号分类MFCC特征神经网络

    我试图把声音信号从语音到情感进行分类.为此,我提取音频信号的MFCC特征,并将其输入到一个简单的神经网络(由PyBrain的BackpropTrainer训练的前馈网络).不幸的是结果非常糟糕.从这5 ...

  3. Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)

    Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习.深度学习.大数据.云计算等)推荐系统(包括语音生成.识别等前沿黑科技) 导读 基于Python的GUI界面设计的一套 ...

  4. 利用python声音处理库librosa提取声音信号的mfcc特征及特征融合

    利用python库librosa提取声音信号的mfcc特征及特征融合 前言 librosa库介绍 librosa 中MFCC特征提取函数介绍 解决特征融合问题 总结 前言 写这篇博文的目的有两个,第一 ...

  5. Python通过文字生成语音,随机获取视频或图片素材生成伪原创的短视频

    前段时间写了一篇<抖音自动引流脚本源码>主要通过语录系统自动生成语句或随机评论,适用于自动评论引流脚本. 今天脑洞大开,想用Python通过文字生成语音,随机获取视频或图片素材生成伪原创的 ...

  6. python 视频语音转文字_使用Python和百度语音识别生成视频字幕的实现

    从视频中提取音频 安装 moviepy pip install moviepy 相关代码: audio_file = work_path + '\\out.wav' video = VideoFile ...

  7. python实现手写笔迹,手写识别,语音识别,语音生成

    文章目录 1,先说思路 2,实现截图 3,祭出源代码 1,先说思路 1,应该实现对于手写笔迹的记录,生成字迹截图 1.1怎么实现呢?在定点和移动中的鼠标所在处画一条线,鼠标按住移动的话,线也会跟着移动 ...

  8. 利用函数wavread对语音信号进行采样_语音识别第4讲:语音特征参数MFCC

    一.MFCC概述[1] 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency ...

  9. 语音识别第4讲:语音特征参数MFCC

    一.MFCC概述[1] 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency ...

最新文章

  1. 他在京东每天做1000万图灵测试
  2. 2017-09-27 前端日报
  3. c语言歌曲评选系统报告,C语言程序设计报告—歌曲信息管理系统精要.doc
  4. mysql -- 死锁
  5. C++网易云课堂开发工程师-拷贝构造,拷贝复制,析构函数
  6. WCF服务编程设计规范(9):中文、中英文对照、英文版资料共享下载
  7. Tomcat 8.5 配置 SSL 证书
  8. [转载]与索引相关的概念---聚簇因子
  9. 程序员笑话集锦:丈夫与妻子篇
  10. JDBC系列 之 存储过程
  11. P1125 [NOIP2008 提高组] 笨小猴
  12. 使用Cytoscape-BiNGO 对非模式生物做go富集
  13. Peoplesoft Pentest
  14. 华硕双路服务器主板装系统,华硕双路服务器主板Z8PE-D12X
  15. js视频封面(截帧)
  16. (HOTA)多目标跟踪MOT指标计算方法
  17. Day13_06_openssl 对称加密算法enc命令详解
  18. python定义函数求解一元二次方程
  19. 老罗的android rss,为新品打气?罗永浩再作惊人语:锤子系统比安卓苹果好30%以上...
  20. 应用于语义分割问题的深度学习技术综述(语义分割综述)

热门文章

  1. Git学习(一)本地操作
  2. c语言程序设计abcd拍大小,《C语言程序设计》选择、填空。热门考题
  3. ak和sk怎么认证 海康威视_“海康威视”也遭遇美断供了?董事长陈宗年回应:正在消化这一信息...
  4. mysql in和or扫描全表_MySQL对OR条件查询不支持优化,会进行全表扫描
  5. java我的世界混搭包_Minecraft辐射混搭包地图
  6. 亚马逊CloudFront
  7. Spring 4 Security MVC登录注销示例
  8. Android Location API跟踪您当前的位置
  9. ng-admin引用UEditor 插件 Angular-UEditor
  10. 学习CSS中的BFC