EMO-DB 数据集的 Speech 特征提取
EMO-DB 数据集的 Speech 特征提取
- 数据集介绍
- 提取相关特征
- 总结
数据集介绍
- EMO-DB数据集是由柏林工业大学录制的德语情感语音库
- 535条语音文件(一共有十名演员其中五男五女)其中语句内容包含日常生活用语的5个短句和5个长句,具有较高情感自由度,不包含某一特定情感倾向。采用16kHZ采样,16bit量化,并以WAV格式保存文件。
- 其中情绪组成:anger, neutral, fear, boredom, happiness, sadness, disgust.
主要是用到这个语音标签 audio 文件的XXXWa.wav中W就是情绪
提取相关特征
import feature
import os
import pickle
import tqdm
def extract_emodb(file_name:str):label = file_name.split('.')[0][-2]feature_27 = feature.extract_mfcc_feature(file_name)return (label,feature_27)database_dir = "H:\dataset\EM-DB\wav"
feature_tuple =()
dir_file = os.listdir(database_dir)
for i in tqdm.tqdm(dir_file):file_path = os.path.join(database_dir,i)feature_tuple = feature_tuple+ (extract_emodb(file_path),)
with open('emo_db.pkl', 'wb+') as file:pickle.dump(feature_tuple,file)
工具
def read_file(filename):"""input a filename and get wave data and time,framerate:param filename::return:"""file = wave.open(filename, 'r')params = file.getparams()nchannels, sampwidth, framerate, wav_length = params[:4]str_data = file.readframes(wav_length)wavedata = np.fromstring(str_data, dtype=np.short)time = np.arange(0, wav_length) * (1.0 / framerate)file.close()return wavedata, time, framerate
def extract_mfcc_feature(filename):"""input a filename extract mfcc from audio:param filename::return:"""data, time, rate = read_file(filename)mel_spec = ps.logfbank(data, rate, nfilt=13)np.set_printoptions()time = mel_spec.shape[0]if time <= 300:part = mel_specpart = np.pad(part, ((0, 300 - part.shape[0]), (0, 0)), 'constant',constant_values=0)mfcc = dct(part)else:begin = 0end = 300part = mel_spec[begin:end, :]mfcc = dct(part)return mfcc
总结
这个数据集还是比较简单,明了,听不懂。
EMO-DB 数据集的 Speech 特征提取相关推荐
- MNIST数据集的gist特征提取(含全部实例代码下载地址)
这些天处理图像检索的一些benchmark数据集,今天处理了MNIST数据集,并对其进行了特征的提取.我的方法可能不一定是最优,但是按照这样的步骤来做,得到了我最后想要的特征数据结果.需要的朋友可以参 ...
- 垃圾邮件分类(trec06c数据集)数据处理-特征提取
目录 目标:我要提取 发件人(From).收件人(To).邮件主题(Subject).邮件正文(zhengwen) 作为邮件特征,然后输入到线性分类模型中进行训练 首先是这四个特征提取的部分 发件人 ...
- CloudKit快速入门之02 通过保存记录创建数据库架构 (SwiftUI iCloud CloudKit中文文档手册教程)...
通过保存记录创建数据库架构 在开发过程中,使用CloudKit API创建架构很容易.将记录对象保存到数据库时,将自动为您创建关联的记录类型及其字段.此功能称为即时模式,仅当您使用开发环境(商店中出售 ...
- SwiftUI 2.0 CoreData通过CloudKit同步公开数据库(WWDC20 讲稿)
CoreData通过CloudKit同步公开数据库 CoreData通过CloudKit同步公开数据库 您好,欢迎来到WWDC. 嗨,我叫尼克·吉列(Nick Gillett).我是苹果公司核心数据团 ...
- PDB Database - AlphaFold DB PDB 数据集的多维度分析与整理 (2)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/13 ...
- 人脸识别数据集精粹(上)
人脸识别数据集精粹(上) 人脸识别 人脸检测和关键点检测都是比较底层的任务,而人脸识别是更高层的任务,它就是要识别出检测出来的人脸是谁,完成身份比对等任务,也是人脸领域里被研究最多的任务. 1.1 人 ...
- 第5章 图像分类的数据集
第5章图像分类的数据集 在我们实际进入到代码编写阶段来构建分类器之前,我们首先回顾下在本书中用到的数据集.一些数据集可理想的获得大于95%的准确率,另一些则还在开放研究阶段,还有一些是图像分类竞赛的部 ...
- 【数据共享】深度学习异常行为数据集—疲劳驾驶数据集—行为分析数据集
今天分享一下这几种数据集: 异常行为数据集 疲劳驾驶数据集 行为分析数据集 文章目录 行为分析数据集: 疲劳驾驶数据集 异常行为监控数据集 三维卷积特征提取器: 100G异常行为数据集送上: 异常行为 ...
- 计算机视觉——SIFT特征提取与检索+匹配地理标记图像+RANSAC算法
SIFT特征提取与检索 1. SIFT算法 1.1 基本概念 1.2 SIFT算法基本原理 1.2.1 特征点 1.2.2 尺度空间 1.2.3 高斯函数 1.2.4 高斯模糊 1.2.5 高斯金字塔 ...
最新文章
- 刀片服务器与机架服务器对比
- android 9.0 https 适配,android9.0适配HTTPS:not permitted by network security policy'
- 【错误记录】Android 模拟器安装应用报错 ( INSTALL_FAILED_INSUFFICIENT_STORAGE )
- 你会利用css写下拉列表框吗?
- python求斐波那契数列第n个数及前n项和_使用python求斐波那契数列中第n个数的值示例代码...
- Jquery$和$$的区别
- 机器学习如何用于芯片系统设计?《机器学习系统芯片设计》
- PHP parseurl 一个好用的函数
- 国内电动车召回12万辆有余 电池衰减和充电故障成头号问题
- 使用SQL数据库在Python中执行CRUD操作
- STL 源代码分析 算法 stl_algo.h -- includes
- c语言汽水瓶编程,汽水瓶 题目(C语言代码)
- Linux 如何限制用户的磁盘使用量 -- quota
- Vue.js 踩坑记 (一)
- 幻立方解法之素数3阶幻立方
- 框架:什么是框架?为什么要使用框架?框架有什么作用
- MySQL创建/查看/修改/删除数据库
- 使用IDEA完成一个SpringBoot的demo
- 女孩上中专学财经类号还是计算机好,女生学财经类专业好吗
- ec12编码器电路图_光电编码器电路图.DOC
热门文章
- 解释任何ML模型?--关于XAI的目标和能;基于梯度的动态RRAM阵列神经形态学习;SARNet:大规模城市点云的语义增强注册;基于加权一致性指数损失的多模式生存模型在鼻咽癌放疗放射性脑病评估中的应用
- CameraLink 转万兆光纤图像传输板(1 路 CameraLink图像信号转换成 4 路 SFP+万兆光纤信号)
- 本科生尝试安卓APP开发:手机调音器节拍器(音乐学习者使用)
- [数值分析]离散数据拟合-最小二乘法
- 如何实现一款自动考勤打卡软件
- 2021-08-11 00:56 计网OS
- IIS服务器网站自动创建并部署
- 投资界百年老店,巨头之友,现在它来中国买起了茅台
- SDL Trados 2021 最新版本的下载地址 (2021年12月更新)
- 2010南非世界杯半决赛预测