1. 基音周期:

基音周期: 表示声带的震动周期,每隔这么长时间(震动周期),有一个气流通过,“每隔”就体现了周期性,这就是基音周期。

基音频率: 是基音周期的倒数, 谱图上就应该有这个频率的信号分量,而且这个频率的幅度(能量)不应该很小,因为每隔一段时间“就有”一团能量通过声带。

图1: 上 :语音波形 , 下边: 对应的窄带语谱图

图1小图可明显看到,基音频率也不是不变的,其也具有波动,我们可以人为的将基频线连接起来为一条曲线,这称为基音跟踪。

共振峰表示“谐振”,频谱上表示为频谱包络(其实是上包络)的峰值,那么频谱下包络的谷值点就表示“反谐振”。

频谱的“尖峰”显示的是源的信息,小尖包突起是周期性的,是有用的,那么“杂乱”的源头是非周期性的,这在语音转换中是一种很重要的信息。

比如,窄带语谱图上基本上可以发现,低频部分,横条纹比较直,而高频部分,条纹变“弯”了,这表示什么?

基音频率和共振峰是能从谱图、频谱上看出来的语音的最基本的信息,当然可以看出其他更多的信息。

2 时域与频谱中的音频特征:

2.1 时域中估计基音周期, 频谱中估计基音频率

选取0.5s处的一段语音片段,长度为20ms。其时域波形和频谱如图:

图2: 左 语音波形 , 右边: 对应频谱

左图,用红圈圈示的尖峰用于估计基音周期,双向箭头表示时间范围内5个圈共4个相似的波段,这4段就表示4个基音周期,则可估计基音周期约为4.25ms,则基音频率约为235.2941Hz。

右图,频谱具有明显小尖峰,这些尖峰在低频部分(可认为语音频率3400Hz内)比较有规律且平滑,高频出现小幅度的“杂乱”,这些“杂乱”表示噪声,来源有录音设备及量化噪声等(虽然幅度很小,甚至根本就“听”不出来,但存在是事实)。这些尖峰就是各次谐波,从左往右一次是1次、2次、3次……谐波。其中最左边的尖峰对应基音频率,其横坐标对应的值表示基音频率,从小图可看到大约为234.83Hz。利用各次谐波可以得到更精确的估计,图中用红圈表示用于估计基频的谐波,共选取了15个,估计出基频为234.8337Hz。

2.2 频谱中看共振峰

基音频率体现的是声源的信息.

共振峰体现的是声道的信息。

为便于比较和观察,将图2这个语音片段的源和系统分离,分别展示源的频谱和声道的频谱,观察一致性。
图3、4显示的是源的频谱、声道的频谱、语音的频谱及共振峰的位置信息,图4去掉了小图。

图3: 语音片段时域波形及其源、声道和语音频谱,小图遮挡了部分信息

红线: 是语音的频谱, 黑色虚线: 是语音频谱的包络,

粉红线: 源信息的频谱,
蓝线: 是声道频谱,蓝色圈圈: 标示出声道频谱的峰值点,

粉红虚竖线: 显示这些峰值点的位置。

根据语音产生的源-滤波器模型及源、系统的卷积解释,语音频谱的包络显示的是声道的信息,而小尖峰显示源的信息,如谐波。

可看到粉红线和红线二者的峰值的位置正好一一对应,体现了源的信息,而且粉红线(源)明显没有包络峰值,说明声道的信息被滤除。同样,蓝线没有了小尖峰,即滤掉了源的信息。

图4: 语音片段时域波形及其源、声道和语音频谱

并且声道的峰值点位置与语音频谱包络的峰值位置也正好一一对应。蓝圈圈的个数表示共振峰的个数,共有4个,从左至右分别称为F1、F2、F3、F4,(F0是基音频率)。它们横轴值表示共振峰频率值,某共振峰带宽就表示该共振峰所占频带宽度。

这个图还暗示了另一个有趣的事实,源所占的频率范围和声道所占的频率范围是一样的,在频域利用高通或低通或带通的方法分离源和系统是行不通的。

3. 语谱图的取对数

这为: 后面对语谱图的 取对数 埋下了伏笔;

人类的发声系统发出的信号是由基音信息与声道信息卷积而成。记作"s卷积v"

经过语谱图FFT变换后,卷积变成了乘法。即"FFT(s)*FFT(v)"。

取对数后,乘法变成了加法。即"Log(FFT(s))+Log(FFT(v))"

把卷积信号转换成加性信号,这就是取FFT和对数的原因

------------------------------------------------------- reference -------------------

1、源-系统信息分离和提取参考论文:
“Glottal wave analysis with pitchsynchronous iterative adaptive inverse filtering” Paavo Alku. SpeechCommunication 11(2-3): 109-118 (1992)

音频(二) 基音周期与共振峰相关推荐

  1. 音频信号处理——基音周期

    音频信号处理--基音周期 标签(空格分隔): 音频处理 一.简介 1.1 什么是基音?什么是基音周期 基音顾名思义就是声音的基础.这里我们主要讨论人的发声,根据声带震动的方式的不同,将声音信号分为清音 ...

  2. Matlab实现倒谱法 求 基音频率和共振峰

    文章目录 前言 一.倒谱 二.基音周期 1.流程图 2. 实现代码(Matlab) 三.共振峰 四.实验 总结 前言 有关同态.倒谱.基音周期等概念,可参考一篇本科毕业论文,链接:link 一.倒谱 ...

  3. 音频信号处理(二)语音信号采集处理与基音周期

    语音信号采集与处理 语音信号采集 根据自相关估计基音周期 语音信号采集 先创建用于录制音频的对象,在创建时确定录制音频的采样率.位数.通道数,分别录制,各录一段5秒钟的音频,并保存 r1=audior ...

  4. 语音信号处理之(二)基音周期估计(Pitch Detection)

    语音信号处理之(二)基音周期估计(Pitch Detection) zouxy09@qq.com http://blog.csdn.net/zouxy09 这学期有<语音信号处理>这门课, ...

  5. 《MATLAB语音信号分析与合成(第二版)》:第8章 基音周期的估算方法

    <MATLAB语音信号分析与合成(第二版)>:第8章 基音周期的估算方法 前言 1. 数据与函数路径设置 2. MATLAB仿真一:基音周期提取的预处理 3. MATLAB仿真二:倒谱法的 ...

  6. python自相关函数提取基音周期_Python语音基础操作--4.2基音周期检测

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  7. 倒谱基音周期matlab,Matlab基于倒谱和EMD的语音基音周期的提取.doc

    Matlab基于倒谱和EMD的语音基音周期的提取 Matlab基于倒谱和EMD的语音基音周期的提取 在语音信号处理中,常用的语音特性是基于Mel频率的倒谱系数(MFCC)以及一些语音信号的固有特征,如 ...

  8. python自相关函数提取基音周期_自相关函数法基音周期提取(matlab版)

    1.引言 人在发浊音时,气流通过声门使声带产生张弛振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量.这种声带振动的频率称为基频,相应的周期就称为 ...

  9. 基音周期检测acf算法及matlab仿真,基音周期检测算法研究及在语音合成中的应用...

    摘要: 语音信号的基音周期是描述激励源的重要特征参数之一,准确的检测语音信号的基音周期对高质量的语音分析与合成,语音压缩编码,语音识别等都具有重要意义.本文讨论了几种常用的基音周期检测方法以及小波变换 ...

最新文章

  1. 一行代码都不写!Github 博客小白版入门教程
  2. poj 1637(混合图求欧拉回路)
  3. UA MATH567 高维统计III 随机矩阵10 亚高斯矩阵的应用:协方差估计与聚类问题的样本量需求计算
  4. 【收藏】wsl2 出现 Vmmem内存占用过大问题解决
  5. 部署App-V Client,应用程序虚拟化体验系列之三
  6. 单调有界定理适用于函数吗_《实变函数》——论有界变差函数
  7. JavaScript关于json的处理
  8. R语言题目及参考答案(3)
  9. mysql 重启_解决MYSQL死机,定时重启MYSQL,wdcp计划任务设定方法,
  10. Java 24 岁!Google 加持的 Kotlin 真能取代它?
  11. mysql 8 配置参数优化_MySQL性能优化之参数配置
  12. Jenkins通过FTP上传站点太多文件导致太慢且不稳定,切换为压包上传再解压的思路(asp.net)...
  13. Atitit  Persistence API持久性标准化法总结 目录 1. 持久性对于大多数企业应用程序都非常要害 1 2. 持久化api内容 2 2.1. 一种声明式地执行O-R映射的方式。 2
  14. Mongodb入门到精通---> 保姆级别教程
  15. 模拟静态小米商城官网html+css
  16. linux将文件修改时间改为现在
  17. Matlab计算状态转移频数,matlab统计频数
  18. 重启计算机关闭账户,电脑开机重启提示您的账户已被停用怎么办
  19. Filenet P8阶段性总结
  20. 用记事本实现打开页面浏览器

热门文章

  1. 报表工具的 SQL 植入sql注入风险及规避方法
  2. Origin画图技巧之放大局域图技巧2
  3. Windows 微信双开(批处理)
  4. (MIUI)小米手机录音丢失找回
  5. [zz]2007年的152条牛人经典BT语录,强烈推荐!
  6. 国家密码管理局公告——密码行业标准更新26项
  7. Win10正式版Guest来宾账户开启使用方法
  8. 可以实现图片编辑修改文字app有哪些?这三款工具很实用
  9. Rinne Loves Dynamic Graph
  10. java节假日算法_「国家法定节假日」java 国家法定节假日和双休日判断工具类 - seo实验室...