Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取,对于WAV格式的音频,mfcc特征提取命令为:

bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm

保存的mfcc特征文件test.tmp.prm,前10个字节是非特征信息,每一帧的特征维度为60,读取代码如下:

% sproread.m

function [data] = sproread(filename)
% reads features with SPro format
%
fid = fopen(filename, 'rb');
fseek(fid, 10, 'bof');data = fread(fid, [60,Inf], 'float'); fclose(fid);

声纹识别交流QQ群:875705987

声纹识别之Alize入门教程(四):matlab代码读取Spro工具提取的mfcc特征相关推荐

  1. 声纹识别(一)——简介

    ​一.基本概念 声纹识别也称为说话人识别,是指根据说话人语音中个性化的特征自动识别说话人身份的一种生物识别技术.说话人的声音特征不仅与其肺部.气管.喉部.声带.咽部.鼻腔.口腔.唇部等人体发声器官相关 ...

  2. 声纹识别技术助力远程身份认证

    作者简介: 李通旭,清华大学博士后,主要从事说话人识别方向的研究.现于清华大学与得意音通声纹识别联合实验室. 刘乐,得意音通研发部经理,主攻声纹识别及语音识别算法研究.有丰富的模式识别算法研发和工程实 ...

  3. 声纹识别技术小结(1):声纹建模技术

    文章目录 1. 概论和流程 概论 流程 2. 核心:声纹建模 2.1 深度学习之前的方法 高斯混合模型(GMM) 高斯混合-通用背景模型(GMM-UBM) 联合因子分析(JFA)+ GMM-UBM i ...

  4. 《ASV-Subtools 声纹识别实战》课程

    AI工匠学堂https://xjw.h5.xeknow.com/s/2XhsYq ASV-Subtools简介 近年来,随着深度学习的快速发展,简单易用.性能稳定.开发高效的深度学习框架越来越被科研和 ...

  5. 声纹识别(说话人识别)技术

    说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来"谁在说话",是根据 ...

  6. 声纹识别开源工具 ASV-Subtools

    今天非常荣幸有机会在Speechhome语音技术研讨会上分享我们团队在开源项目上的一些工作.今天我分享的主题是声纹识别开源工具ASV-Subtools. 今天我分享的主要有5个部分的内容,分别是背景介 ...

  7. 一文看懂“声纹识别VPR” | AI产品经理需要了解的AI技术概念_团员分享_@cony

    前言:声纹识别是AI领域中一个看似很小.但其实有机会在近期落地,且比较有意思的细分方向:本文作者是"AI产品经理大本营"团员@cony  ,她总结了AI产品经理"最必要& ...

  8. 业界首个声纹识别与音频检索系统上线,10分钟搭建产业级应用

    随着深度学习技术的升级与产业的发展,智能语音交互已成为了我们日常生活中一个重要的组成部分,并广泛应用在地图导航播报.智能客服回访.手机语音输入以及各类智能助手等应用场景中,可以说语音已成为了人与机器之 ...

  9. 业界首个声纹识别与音频检索系统,10分钟搭建产业级应用

    随着深度学习技术的升级与产业的发展,智能语音交互已成为了我们日常生活中一个重要的组成部分,并广泛应用在地图导航播报.智能客服回访.手机语音输入以及各类智能助手等应用场景中,可以说语音已成为了人与机器之 ...

  10. 干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选

    作者 | xjdier 来源 | CSDN博文精选 (*点击阅读原文,查看作者更多精彩文章) 近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE) ...

最新文章

  1. 新晋 ACM Fellow 陶大程,8 篇 NeurIPS 论文详解
  2. 服务器系统选择什么,服务器选择什么系统
  3. 开发日记-20190619 关键词 读书笔记《鸟哥的Linux私房菜-基础学习篇》
  4. Python学习笔记(六)if判断语句
  5. MySQL存储引擎、MyISAM、InnoDB
  6. 剪板机自动上下料_机器人联轴器,用于机器人自动化上下料
  7. less(css)语言快速入门
  8. mysql 安装问题汇总_Windows 10 下MySQL安装及常见问题
  9. Node.js的require()的工作原理
  10. 工程项目经济评价的基本方法
  11. 2018年华为数通技术大赛复赛拓扑题
  12. 深度linux系统硬件要求,国产操作系统Deepin Linux(深度系统)安装体验
  13. robotium测试
  14. MP3的采样率和比特率
  15. 联想小新Air2020ill版换硬盘及安装Win11详细过程
  16. 常见文件扩展名及简要说明
  17. 【opencv 450 core】使用统一向量指令(Universal Intrinsics)对代码进行矢量化
  18. 性能测试:Loadrunner 脚本录制、设置事务、添加检查点、参数化以及添加关联
  19. 那年花一个钟用PS改证件照的背景色,今天用Excel我只花了60秒!
  20. TUP第30期:微软资深专家论如何用Visual Studio开发iOS、Android应用

热门文章

  1. Jmeter启动失败
  2. 江苏省计算机三级理论考试,春江苏省计算机三级偏硬考试真题及答案
  3. 【ffmpeg】视频解码器
  4. SqlParameter的参数值为 null
  5. 浅谈数字证书安装证书原理
  6. gif如何转html,gif动画怎么转视频格式 gif转swf工具
  7. 员工新参(北京)社保所需材料
  8. 解决LDAP客户端统一认证DirectoryEntry出现 Ox80005000的问题
  9. 动态数组索引越界问题
  10. 智能烟感与物联网卡可以了解一波