语音识别的第一步是特征提取,也就是提取语音信号中有助于理解语言内容的部分而丢弃掉其它的东西(比如背景噪音和情绪等等)。

语音的产生过程如下:语音信号是通过肺部呼出气体,然后通过声门的开启与闭合产生的周期信号。再通过声道(包括舌头牙齿)对信号调制后产生。区分语音的关键就是声道的不同形状。不同的形状就对应不同的滤波器,从而产生了不同的语音。如果我们可以准确的知道声道的形状,那么我们就可以得到不同的音素(phoneme)的表示。声道的形状体现在语音信号短时功率谱的包络(envelope)中,因此好多特征提取方法需要准确的表示包络信息。

在任意一个Automatic speech recognition 系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊,情绪啊等等。


搞清语音是怎么产生的对于我们理解语音有很大帮助。人通过声道产生声音,声道的shape(形状?)决定了发出怎样的声音。声道的shape包括舌头,牙齿等。如果我们可以准确的知道这个形状,那么我们就可以对产生的音素phoneme进行准确的描述。声道的形状在语音短时功率谱的包络中显示出来。而MFCCs就是一种准确描述这个包络的一种特征。

MFCCs(Mel Frequency Cepstral Coefficents)是一种在自动语音和说话人识别中广泛使用的特征。它是在1980年由Davis和Mermelstein搞出来的。从那时起。在语音识别领域,MFCCs在人工特征方面可谓是鹤立鸡群,一枝独秀,从未被超越啊&

语音信号处理-概念(三):FBank特征、MFCC特征(梅尔频率倒谱系数)【由于二者蕴含信息较少,已不适合这个大数据时代。但有些任务由于其本身的特殊性质,还是会使用到MFCC谱。如情感语音转换任务】相关推荐

  1. 深入理解MFCC(梅尔频率倒谱系数)

    从倒谱图出发 MFCC是Mel Frequency Cepstral Coefficient的简称,要理解MFCC特征,就需要先明白这里引入的一个新的概念--Cepstral,这个形容词的名词形式为C ...

  2. 语音信号处理之(四)梅尔频率倒谱系数(MFCC)

    在任意一个Automatic speech recognition 系统中,第一步就是提取特征.换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊, ...

  3. 梅尔频率倒谱系数MFCC总结

    一.听觉特性. 人们不能完全搞清楚人耳的内部构造,这就不能利用状态空间的方法来分析人耳的听觉特性.但是,可以把人耳当成黑匣子,声音作为激励,人类的反应作为响应,利用信号与系统的经典分析方法,把声音作用 ...

  4. 声音处理之-梅尔频率倒谱系数(MFCC)

    声音处理之-梅尔频率倒谱系数(MFCC) 梅尔(Mel)频率分析 在语音识别(SpeechRecognition)和话者识别(SpeakerRecognition)方面,最常用到的语音特征就是梅尔倒谱 ...

  5. MFCC梅尔频率倒谱系数

    MFCC梅尔频率倒谱系数原理及python实现 文章目录 MFCC梅尔频率倒谱系数原理及python实现 MFCC梅尔频率倒谱系数的原理 计算MFCC的步骤 1.音频信号文件读取及预加重 2.信号分帧 ...

  6. 【语音识别】之梅尔频率倒谱系数(mfcc)及Python实现

    [语音识别]之梅尔频率倒谱系数(mfcc)及Python实现 一.mel滤波器 二.mfcc特征 Python实现 语音识别系统的第一步是进行特征提取,mfcc是描述短时功率谱包络的一种特征,在语音识 ...

  7. 语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现

    梅尔倒谱系数(MFCC) 梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC).依据人的听觉实验结果来分析语音的频谱, MFCC分析依据的听觉 ...

  8. 音频特征-梅尔频率倒谱系数(MFCC)详解

    总结一些关于MFCC写的比较好的资源: 1. MFCC提取过程讲解的非常详细,形象(图表多): http://blog.csdn.net/zouxy09/article/details/9156785 ...

  9. 梅尔频率倒谱系数(MFCC)资源

    总结一些关于MFCC写的比较好的资源: 1.MFCC提取过程讲解的非常详细,形象(图表多): http://blog.csdn.net/zouxy09/article/details/9156785 ...

  10. 大数据时代时代舍恩伯格书资源_大数据时代的特征和思维

    随着信息技术的发展和应用, 人类进入了一个大数据时代.大数据时代和我们以前的时代有什么不同?什么又是大数据时代的特征,和应具备的思维呢? 维克多·舍恩伯格在<大数据时代>一书中将大数据时代 ...

最新文章

  1. 17篇论文入选CVPR 2019,百度AI都在关注什么?(附论文地址)
  2. 个人博客二|创建项目
  3. SAP采购Invoice保存检查增强:INVOICE_UPDATE
  4. java 下对字符串的格式化
  5. 服务器2003添加共享文档权限,Windows2003使用命令行设置共享权限与安全权限心得...
  6. vue概述、vue文件特点、vue核心思想、双向数据流、单文件、启动一个vue项目、声明式渲染
  7. python语音属于什么语音_python语音识别
  8. java maven 读取配置文件_Java项目和maven项目中如何获取设置配置文件中的属性
  9. 计算机行业更看重学历还是更看重技术?
  10. linux命令-locale字符显示
  11. pl/mysql安装_PL/SQL环境安装设置
  12. MyEclipse破解 CI-2018.9.0版本
  13. Redis安装可视化管理软件
  14. 百度有啊创始团队写博客 自曝高层动荡内幕
  15. 零预算引爆个人和企业品牌
  16. java ary是什么,填充N-ary树-Java
  17. 【cmd】linux常用命令的英文单词缩写
  18. php梗相亲梗,没文化太可怕了,心疼这位相亲的php程序员
  19. Android蓝牙bt/ble开发
  20. 通信原理学习笔记6-5:数字解调——译码的硬判决与软判决

热门文章

  1. ssh反向代理实现内网穿透;ssh+nginx实现公网云服务器代理访问内网服务器
  2. u盘计算机里打不开怎么办,电脑能识别U盘但是打不开怎么办
  3. php坏处,cpu超频有什么坏处
  4. 我是怎样的一个人感悟
  5. html中svg修改背景颜色,在用作背景图像时修改SVG填充颜色
  6. 渗透之——SQLMap参数说明
  7. 今日头条含室内设计用户粉丝数量统计(2019.12.24)
  8. word 2013 尾注后继续添加正文的方法
  9. docker网络模式--资源分配叙述(1)
  10. Debian10.6 Xfce 系统安装教程