【实例简介】

语音信号处理中基频提取算法综述,论述了各种基频检测的算法,对比分析各方法与思想,不错的总结

增刊

张杰等:语音信号处理中基频提取算法综述

101

信号是由频率具有谐波关系的信号组成的,因此有的一个改进是采用多分辩率方法。该方法的思想是:

很多尝试利用频域信息提取基频的方法

如果一个特定算法在特定分辨率下的准确性是可疑

21基于滤波器的算法

的,那么采用更高或者更低的分辨率,可以进一步

21.1最佳梳状滤波器法

判断前面的基频估计是否可信。如果在全部或人部

最仹梳状滤波器法閃是具有高鲁棒性但计算代分的分辨率下求得相同的基频,那么该频率值就可

价很大的算法。一个梳状滤波器有很多等距离分布以作为最终的基频估计结果。当然,在带来好处的

的通带,在最佳梳状滤波器算法中,通带的位置都同时,该方法也会带来计算量上的代价,因为针对

是由第一个迸带决定的,即通带的中心频率都是第每个分辨率都需要重新计算频谱,这也是为什么

一个通带中心频率的整数倍。输入信号通过多个与多分辨率的傳里叶分析比专门的多分辨率变换(如

第一个通带中心频率不同的梳状滤波器。如果输入离散小波变換)要慢的原因

信号是由一组频率成谐波关系的信号组成的,那么2.4离散小波变换法

滤波器的输出在全部谐波成分都通过滤波器时达到

离散小波变换是一个强大的工具,它允许在连

最大。但是如果信号只有一个基频成分,该方法就续的尺度上把信号分解为高频成分和低频成分,它

会失效,因为会有很多个梳状滤波器能让信号通过。是时间和频率的局部变换,能有效地从信号中提取

不过,语音信号的频率具有谐波结构,所以可采用信息。与快速傅里叶变换相比,离散小波变换的主

该方法提取基频。

要好处在于,在髙频部分它可以取得好的时间分辨

2.1.2可调的IR滤波器

率,在低频部分可以取得好的频率分辨率。

文献四提出了一种基于中心频率可调节的带通3统计的方法

IR滤波器提取棊频的方法,随着用户的调节,滤波

器的中心频率扫过整个频域。当输入信号的一个强

在某种意义上,基频提取的问题可以被看作是

的频率成分在通带沱围内时,滤波器会输出最大值,

个统计问题。每一个输入帧都被划分给一组类中

信号的基频就可以用此时滤波器的中心频率来估的一个,代表信号的基频估计。所以很多研究者

计。文献[9提到,对于可调的I滤波器,有经验的

直试图将现代的统计方法应用于基频提取问题

用户能够识别只有一个谐波结构的信号的输出和包

Boris和 Xavier发表了一系列使用最人似然法估

含多个基频信号的输出的差异

计基频的方法。他们的模型如卜:观察集是语音信

2.2倒谱分析法

号分帧后做短时傅里叶变换的结果,每一个观察都

倒谱分析是谱分析的一种方法,翰出是傅里叶被看作是基频激励产生的信号与其他剩余信息(包

变换的幅度谱取对数后做傅里叶逆变换的结果。该括非谐波部分和噪声)两部分的混合。该模型是由

方法所依据的理论是,一个具有基频的信号的傅立般的语音信号产生的模型的简单化得到的,假没

叶变换的幅度谱有一些等距离分布的峰值,代表信个语音包括在基频及其整数倍点的值处较大的谐波

号中的谐波结构,当对幅度谱取对数之后,这些峰成分,以及在非谐波处和噪声处的很小的值。对于

值被削弱到一个可用的范围。幅度谱取对数后得到一组候选的基频值,该方法计算每一个观察可能是

的结果是在频域的一个周期信号,而这个频域信号由某一个基频产生的概率,并将概率最大的基频值

的周期(是频率值)可以认为就是原始信号的基频,所作为最终的估计值。所以候选的基频值的选择是很

以对这个信号做傅里叶逆变换就可以在原始信号的重要的,因为从理论上讲,观察可能对应着任意的

基音周期处得到一个峰值

基频值。

另妒,如果对信号的傅里叶变换的嘔度谱取对

数后的结果直接进行分析,而不是雨接着做傅里叶4算法的改进

逆变换,就是谐波成分谱的方法。进一步,如果在

前面提到的每种算法都有自己的改进方法,下

求频域的变换时不使用傅里叶变换,而使用能使频面介绍两种对以上大部分算法均适用的改进方法。

谱更加精细的Chip变换,就是基」Chi变换的提取41人的听觉模型

基频的方法,该方法具有高分辨率和高鲁棒性。

由于基频提取本身就是听觉感知问题,所以所

23多分辨率的方法

有的算法都可通过加入人耳的听觉模型提扃性能

对于任何基于傅里叶分析的频域方法都可以做人耳的听觉模型将人的听觉系统对声音信号的处理

102

电子科技大学学报

第39卷

分为分析、传递和还原3个阶段。分析阶段主要考虑5经典的基频检测方法

耳蜗的分频效应,耳蜗的外端对高频敏感,内端对

低频敏感,可以用一组中心频率不同的带通滤波器

自从有了语音信号分析饼究这门学科以来,基

来模拟。传递阶段声波振动沿基膜传播,并在听觉频的检测一直是一个重点研究的课题。经典的基频

神经纤维内产生电流,最终传入听觉中枢。还原阶

检测方法可以大致分为3类,如表1所示

段听觉系统提取语音中诸如音质、音调、时域和位

表1经典的基音检测方法以及特点

置等信息。

分类基因检测方法

特点

在声学中,声强是指单位时间内通过垂直」声

由多种简单的波形峂值

泼传播方向的单位面积的声波能量,用表示。当声

并行处理法

检沏器提取基音周期

波的频率在20~20000Hz(可闻频率)之间,而声强

波形

根据各种理沦探作,从波形中去

行计法数据减少法

达到一定的强度(听阈),就能被人耳感知。前人大量

掉修正基音以外的数

的实验测试结果表明,人耳对不同频率的声波感受

讨零率法

利用波形的讨零率,差眼于重复图形

到相同响度时的声强是不同的。人耳对两端频段的

利用语音波形的自相关函数提取

自相关法

声波反应较为迟钝,而对中间频段的声波反应相对

基音,采用中心削波平坦欠理频谱,

及其改进

较为敏感

采用峰值削波可以简化运算

对于任意的频域方法,简单的改进是用Q值恒

语音波形降低采样率斤,进行IPC分析

相关

定的谱变换方法代替傅里叶变换。恒的变换方法

SIFT法用逆滤波器平坦处理频谱,通过预测误差

处埋法

计算代价更人,但更接近于人的听觉感知系统。

的自相关函数恢复时间精度

在决定是否使用人的听觉模型吋必须考虑两个

采用平均幅度差函数(AMDF检测周期

AMDF法

性,也可以根据残差信号的

因素:(1)基频提取的用途。如果应用的目的很简单,

AMDF法行提取

要求也不是太高,那么人的听觉感知因素也许不是

倒谱法

根据对数功率谱的傅立叶反变换

很必要。(2)计算的复杂度。使用人的听觉感知模型

分离频谱包络和微细结构

会使计算复杂度大大增加,如果原来算法的复杂度变换法

在频谱上求出基频高次谐波成分的直方

已经很大,再加入人的听觉感知模型可能会使算法

循环直方图法

图,根据高次谐波的公约数决定某音

的复杂度过高

4.2基频的跟踪

(1)波形估计法。直接由语音波形估计、分析波

另一种对基频提取的改进是基频跟踪。前面提形上的周期峰值

到的基频提取都是在个单独的时间窗内进行的。

(2)相关处珄法。时域中周期信号最明显的特征

人的听觉系统是能够眼踪输入信号的基频的。一个是波形的类似性,因而可以道过比较原始信号和它

只包含有限个基音周期的时间窗内的基频是很难提

位移后的信号之间的相似性确定基音周期。该类方

取的。但是,如果输入是连续的语音信号,相当于法抗波形的相位失真能力强,且馍件处理结构简单。

很多时间窗个接个输入,基频的提取反而变得

3)变换法。将语音信号变換至频域或倒谱域估

很容易。研究发现,语音信号的基频具有连续性,

计基音周期

即前后两帧的基频是连续的,不出现跳变。一帧内6总结

的基频提取常见的问题是得到的佔计值是正确值的

本文列出了若干基频提取的主要方法,对它们

整数倍或者整数倍分之一。针对该问题,利用语音分别进行了简单的介绍,并讨论了对算法的改进。

信号基频的连续性,可对基频提取算法做一个简单需要注意的是,所介绍的方法都是针对一个语音信

的改进:在计算某一恢的基频时对于它前血一帧的号而言的,对于混合的语音信号的基频提取,如果

基频附近的值给予更大的可能性,即一唢语音信号可以先将混合的语音信号分离丌,那么基频提取就

中基频的值不可能出现崁变的情况。这就是简单的会变待很简单。同样地,在一些基于时频分析的语

基频跟踪思想,并且不会在计算上增加任何复杂度。音分离算法中,如果知道了各个语音的基频,那么

另外一种比较复杂的基频跟踪方法是使用隐马语吝分离也就变得很容易解决了。

尔科大模型。

(下转第126页)

126

电子科技大学学报

第39卷

L9 GONG L, NEEDIIAM R, YAIIALOM R Reasoning about

1990 IEEE Symposium on Research in Security and privacy

belief in cryptographic protocols C]/Proceedings of the Los Alamitos, CA: IEEE Computer Society Press, 1990

编辑税红

(上接第102页)

参考文献

[5 BENJAMiN K. Spectral analysis and discrimination by

[ DELLER了R, PROAKIS了 G HANSEN J H L

zero-crossings[C]Proceedings of the Institute of Electrical

Discrete-time processing of speech signals [M]. New York:

and Electronics Engineers. S 1.: [ s.n. 1986: 1477-1493

[6] CURTIS R. The computer music tutorial]. Cambridge

Maxell McMillan. 1993

MIT Press. 1996

[2 FORT A, ISMAELLI A, MANFREDI C, et al. Parametric

[7] DE CHEVEIGNE A, YIN H K. A fundamental frequency

d non-parametric estimation of

application to infant cry[]. Med Eng Phys, 1996, 18(8

estimator for speech and music[J]. Journal of the Acoustical

Society of America, 2002,11(4):1917-1930

[3] PARSONS T. Voice and speech processing[M]. New York

[8 EARGLE J M. Music, sound and technology M. Toronto

Hill,1986.

Van Nostrand reinhold. 1995

4 RABINERR L, SCIIAFERR W. Digital processing of

speech signals. Englewood Cliffs M]. New Jersey: Prentice

编辑税红

Hll,1978

【实例截图】

【核心代码】

matlab提取语音信号基频检测,语音信号处理中基频提取算法综述相关推荐

  1. 《MATLAB语音信号分析与合成(第二版)》:第3章 语音信号在其他变换域中的分析技术和特性

    <MATLAB语音信号分析与合成(第二版)>:第3章 语音信号在其他变换域中的分析技术和特性 前言 1. 数据与函数路径设置 2. MATLAB仿真一:信号倒谱图.声道冲激响频谱.声门激励 ...

  2. 语音信号分析(语音分帧)

    语音分帧 不管是进行什么参数分析以及采用什么分析方法,都需要一些预先的处理,如语音信号的数字化.语音信号的端点检测.预加重.加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术.贯穿于语音分析全过程 ...

  3. python信号端点检测_语音信号端点检测

    语音信号的端点检测方法有很多种,简单的方法可以直接通过计算出声音的音量大小,找到音量大于某个阈值的部分,认为该部分为需要的语音信号,该部分与阈值的交点即为端点,其余部分认为非语音帧. 计算音量 计算音 ...

  4. 语音信号的短时语音能量

    由于语音信号的能量随时间而变化,清音和浊音之间的能量差别相当显著,因此对短时能量和短时平均幅度进行分析,可以描述语音的这种特征变换情况.定义n时刻某语音信号的短时平均能量E为: 式中,N为窗长,可见短 ...

  5. matlab振动信号源程序,MATLAB 王济老师《 在振动信号处理中的应用》书中源程序 238万源代码下载- www.pudn.com...

    文件名称: MATLAB下载 收藏√  [ 5  4  3  2  1 ] 开发工具: matlab 文件大小: 623 KB 上传时间: 2014-12-18 下载次数: 5 提 供 者: 邹小兵 ...

  6. 基于matlab的相干信号的doa 估计,基于空间平滑MUSIC算法的相干信号DOA估计(1)

    基于空间平滑MUSIC算法的相干信号DOA估计(1) 基于空间平滑MUSIC算法的相干信号DOA估计(1) 空间平滑MUSIC算法(1) 在上一篇博客中有提到,当多个入射信号相干时,传统MUSIC算法 ...

  7. 语音信号端点检测 matlab,matlab中语音端点检测

    首先在matlab中装好voicebox工具箱,里面有一些需要用到的.m文件 具体程序如下: x=readwav('D:/hao.wav'); t=x; N=size(x) x=double(x); ...

  8. c语言电流检测模块程序,C语言和MATLAB程序设计在电力谐波电流检测方法仿真中的应用...

    前言第1章 绪论1.1 计算机仿真的基本概念1.2 C语言简介1.3 MATLAB概述1.4 电力谐波电流检测方法的研究现状1.4.1 有源电力滤波器的丁作原理1.4.2 电力谐波电流检测方法的研究现 ...

  9. 论文推荐 | 目标检测中不平衡问题算法综述

    (图片付费下载于视觉中国) 作者 | CV君 来源 | 我爱计算机视觉(ID:aicvml) 今天跟大家推荐一篇前几天新出的投向TPAMI的论文:Imbalance Problems in Objec ...

最新文章

  1. c++ primer,友元函数上的一个例子(By Sybase)
  2. maven2创建或者导入eclipse工程 设置M2_REPO消除错误
  3. linux grep 点号的匹配
  4. day03: oracle的sql增 、删、改,事务处理
  5. linux studo命令,在 Linux 上使用 Visual Studio 开发环境
  6. 记一次死锁问题的排查和解决
  7. Python之自动单元测试之一(unittest使用实例)
  8. webService 客户端调用及异常信息First Element must contain the local name, Envelope , but found definitions...
  9. 207. Course Schedule 课程表
  10. Cubieboard:享誉国外 Linux 圈子的中国产品
  11. PHP PSR4自动加载代码赏析
  12. Tosca 添加 modules,添加Library,引用重复步骤
  13. 中英文对照 —— 体育与健身
  14. java 跨平台的等宽字体_值得推荐的优秀编程字体/代码等宽字体收集(转)
  15. 香橙派 One Plus 像单片机一样硬件寄存器 控制GPIO 点灯
  16. gif动态图太大如何发微信?手机如何快速压缩动图?
  17. 关于VS2017许可证过期问题
  18. ​英伟达 CEO 黄仁勋:摩尔定律结束了;苹果新专利:折叠式iPhone可自行修复折痕;Rust 1.64.0 发布|极客头条...
  19. 从一个叫灵异拼图(the forgotten) 影片看东西方文化的差异
  20. R语言实战笔记 基本统计分析-相关

热门文章

  1. 图深度学习入门教程(六)——注意力机制与图注意力
  2. 【Go】三、函数与方法
  3. unity网格变形插件Megafiers简介
  4. 解决服务器80端口监听异常导致无法打开和访问网站的问题
  5. 使用DQN进行价格管理
  6. 教你如何用手机连接电脑上网
  7. C/C++函数传递二维数组
  8. 城市园林类毕业论文文献包含哪些?
  9. 【sketchup 2021】草图大师中二维图像交互(jpeg等格式图像的导入、图像的输出、图像导入变得模糊处理方法)与三维图像交互(其他软件导出的三维导入到草图大师、草图大师导出为三维模型】
  10. 浅谈抢票软件的危害及模拟分析