单通道语音信噪分离算法研究
摘要:为了评估单通道语音信噪分离的效果,本文分别对六种传统语音增强算法进行了探讨。在理想的高斯白噪声环境下,子空间法增强后的语音信号输出信噪比SNR最大,VMD(Variational Mode Decomposition, VMD)增强后的语音信号语谱图保留频率细节部分更多,分段信噪比 segSNR 最高。在八种不同场景不同信噪比复杂环境下,维纳滤波法增强后的语音信号分段信噪比segSNR最大,语音感知度最高。

关键词:语言增强;VMD;子空间;维纳滤波法;

目录
1 绪论 2
2 单通道语音增强技术 3
2.1 语音与噪声特性 3
2.1.1 语音特性 3
2.1.2 噪声特性 4
2.2 语音增强算法 4
2.2.1 谱减法 4
2.2.2 时域维纳滤波 5
2.2.3子空间 6
2.2.4 小波分析 7
2.2.5 变分模态分解 8
2.3 语音增强算法的性能评估标准 10
2.3.1 主观评价标准 10
3. 语音增强效果及评估 12
3.1 数据来源 12
3.2 仿真效果及分析 12
3.2.1 谱减法 13
3.2.2 维纳滤波法 14
3.2.3 子空间法 15
3.2.4 小波变换 15
3.2.5 变分模态算法 16
3.3 客观分析 17
4. 结论 20
5. 致谢 21
6. 参考文献 22

code
pdf

1 绪论
在单麦克风场景下,语音增强算法主要通过对带噪语音信号进行时域、频域、时频域、KLT域以及 SVD 域的系数变换,并根据变换后的系数特征来区分纯净的语音信号和噪声,进而达到信噪分离的目的。在简单场景下输入信噪比较高的情况下,可以直接通过将噪声系数置零来达到语音增强的目的,但对于复杂场景下低信噪比的带噪语音信号简单地进行噪声系数置零可能会导致增强后的语音信号失真。
在八九十年代,所提出大多数语音增强算法是基于频域的。最先谱减法(Spectral Subtraction, SS)思想含噪语音信号能量谱与前几帧估计到的平均能量谱相减,得到估计到的增强语音信号能量谱;但其中噪声能量谱估计得不准确会导致频谱过减而产生“音乐噪声”,降低了语音增强质量。然而,谱减法还存在“相位问题”,将带噪语音信号的相位直接作为增强语音信号的相位可能会造成失真现象。基于统计模型的语音增强算法有维纳滤波法(Wiener Filter, WF)、最小均方误差(Minimum Mean Square Error, MMSE)算法等;MMSE算法增强后的语音信号中残留噪声量相对较少,其中最小均方误差(Log-MMSE)算法残留噪声更少且舒适度得到了提升。子空间(subspace)方法的原理是将观测信号的向量空间分解为信号子空间和噪声子空间,通过保留信号子空间和消除噪声子空间并从而估计出干净语音。在复杂环境低信噪比情况下,子空间方法仍不能有效地分离出噪声。
由于语音信号非线性、非平稳性等性质,传统的傅里叶变换方法已不再适用。针对语音信号的非平稳、时变等特性,许多学者提出了一些基于时频域方法。小波变换(Wavelet Transform, WT)是时间和频率的局部化分析,通过伸缩平移运算对信号逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节。大量实验表明小波变换能够在很大程度上对非平稳信号进行去噪,增强语音信号的信噪比优于其他传统方法增强语音信号的信噪比,但小波去噪的关键取决于阈值的选取,一个合适的小波阈值可以达到较好的语音增强效果,且小波变换不适用于非线性信号。经验模态分解(Empirical mode decomposition, EMD)算法根据信号的局部特性将带噪信号分解为有限个固有模态函数(Intrinsic mode function, IMF),从而适用于非线性非平稳信号,大量实验结果表明增强语音信号质量在不同程度上均有一定的提升;但EMD算法可能会由于端点检测不准确造成模态混叠现象,造成语音重构信号不准确,从而导致语音质量下降。针对EMD存在模态混叠问题,EEMD (Ensemble EMD)、CEEMD (Complementary EEMD)算法可以避免模态混叠现象发生,但无法消除。为了解决EMD的模态混叠问题,Konstantin Dragomiretskiy和 Dominique Zosso提出了变分模态分解 (Variational Mode Decomposition, VMD)算法,实验表明该算法可以避免端点检测所造成的模态混叠问题,从而增强语音信号质量要明显好于EMD增强语音信号质量
本课程论文第2章介绍了几种传统的单声道语音增强算法和语音质量评估的主、客观指标。第3章为不同语音增强方法对在不同场景下不同信噪比的语音信号进行去噪增强,然后在客观评价的尺度下分别计算分段信噪比和语音感知度。

2 单通道语音增强技术
2.1 语音与噪声特性
2.1.1 语音特性
语音信号是一个典型的随机信号,虽然其二阶统计量的变化随时间变化但是其满足短时平稳性,即在很短的时间内(10~30ms)可以把语音信号看成平稳随机过程。语音信号具有周期性,这是人体本身的发声机制所决定的。实际工程中可通过提取语音信号的基音周期进行一系列的语音信号处理,同时研究语音的声学特征可很好的提升语音可懂度与质量。在工程模型中,声带与声道可分别看作激励源和滤波器,而声带的震动可以是周期同时也可以是非周期的。图 2-1 为工业中通用的语音产生模型。









篇幅太长,省!
详见文件资源。

[1] 吉慧芳,贾海蓉,王雁.改进相位谱补偿的语音增强方法[J].计算机工程与应用, 2019,55(08):48-52.

[2] Thimmaraja G. Yadava, H. S. Jayanna, Speech enhancement by combining spectral subtraction and minimum mean square errorspectrum power estimator based on zero crossing[J]. International Journal of Speech Technology, 2019, 22(3): 639-648.

[3] Yadava T G, Jayanna H S. Speech enhancement by combining spectral subtraction and minimum mean square error-spectrum power estimator based on zero crossing[J]. International Journal of Speech Technology, 2019, 22(3): 639-648.

[4] Yan L, Addabbo P, Zhang Y, et al. A sparse learning approach to the detection of multiple noise-like jammers[J]. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(6): 4367-4383.

[5] Dragomiretskiy K, Zosso D. Variational mode decomposition[J]. IEEE transactions on signal processing, 2013, 62(3): 531-544.

[6] 郭欣. 基于K-SVD稀疏表示的语音增强算法研究[D].太原理工大学,2016.

[7]路敬祎,马雯萍,叶东,姜春雷.基于VMD的声音信号增强算法研究[J].机械工程学报,2018,54(10):10-15.

[8] 陆振宇,卢亚敏,夏志巍,黄现云.基于变分模态分解和小波分析的语音信号去噪方法[J].现代电子技术,2018,41(13):47-51.

[9] 贾海蓉,张雪英,牛晓薇.用小波包改进子空间的语音增强方法[J].太原理工大学学报,2011,42(02):117-120.

单通道语音信噪分离算法研究相关推荐

  1. 滴滴单通道语音分离与目标说话人提取和抑制技术进展

    桔妹导读:为了将目标语音从含多种干扰(如车噪.导航音.车内FM等)的复杂声学环境中分离出来同时尽量减小对原始语音的损伤,提高人机交互.客服听音等的效率,滴滴结合了在前端信号处理的多年研发积累与该领域的 ...

  2. 语音顶会 ICASSP 2022 成果分享:基于时频感知域模型的单通道语音增强算法

    近日,阿里云视频云音频技术团队与新加坡国立大学李海洲教授团队合作论文 <基于时频感知域模型的单通道语音增强算法 >(Time-Frequency Attention for Monaura ...

  3. 功率谱 魏凤英统计程序_单通道语音增强之统计信号模型

    [欢迎访问我的博客原文](单通道语音增强之统计信号模型) 1. 信号估计理论简述 信号估计理论是现代统计处理的基础课题[@ZhangXianDa2002ModernSP],在通信.语音.图像领域均有广 ...

  4. 基于语音的疲劳度检测算法研究

    基于语音的疲劳度检测算法研究 摘 要 疲劳是一种自然现象,是人体的一种自我调节和保护功能.检测疲劳状态对于当今社会从事各行各业都有积极意义.本课题提出了一种基于语音特征参数和概率神经网络的语音疲劳度识 ...

  5. 二维海浪波数谱的matlab,基于波数谱的风涌分离算法研究

    哈尔滨工程大学 硕士 2018 基于波数谱的风涌分离算法研究 Research on Wind Sea and Swell Separation Algorithm Based on Wave Num ...

  6. 毕业设计-基于深度学习的单通道语音降噪技术

    目录 前言 课题背景和意义 实现技术思路 一.基于子空间投影的时域语音降噪 二.基于噪声信息辅助的双阶段语音降噪 三.感知高相关时频损失函数研究 实现效果图样例 最后 前言

  7. 基于EWT的单通道时频混合信号的分离研究

    基于EWT的单通道时频混合信号的分离研究 主要探讨基于经验小波分解(EWT)的数据自驱动分解方法是否适用于时频混叠信号,这里通过实验数据与分类效果对该方法进行研究和探讨. 首先定义混合信号,为了方便对 ...

  8. 腾讯AI Lab语音技术中心应用与研究介绍

    "CCF语音对话与听觉专业组走进企业系列活动"第十期之"走进腾讯"研讨会于上周六圆满闭幕,本次研讨会由上海交通大学钱彦旻副教授主持,并邀请到四位专家介绍腾讯语音 ...

  9. 【信息技术】【2011】噪声环境下语音信号的分离

    本文为美国马里兰大学帕克分校(作者:Srikanth Vishnubhotla)的博士论文,共110页. 从单通道录音中自动分离重叠的语音信号是语音处理中的一个具有挑战性的问题.类似地,从含噪语音中提 ...

最新文章

  1. R语言将多个dataframe导出到excel的多个表单(sheet)实战
  2. WEB标准页面CSS命名参考
  3. Flask基础知识点1
  4. 使用DPM 2010备份还原Exchange2010单个邮箱
  5. delphi bmp绘制矢量文件效率慢_聊一聊矢量瓦片的常识
  6. suse linux vnc配置文件,怎么在linux suse中配置VNC服务器
  7. 使用pandas循环数据帧的最有效方法是什么? [重复]
  8. 为VS2005添加X64编译平台
  9. vector的初始化
  10. 生物化学复习题I·蛋白质
  11. 大一新生计算机专业对未来的展望,大学生未来展望简短
  12. python|数据分析
  13. python项目总结
  14. 如何从华为云服务器上找回手机,华为云服务怎么样使用手机找回功能
  15. 九龙证券|半导体又涨嗨了!券商再喊牛市起点!
  16. 华为畅享20 pro 和华为畅享Z 的区别 哪个好
  17. 索尼sw2刷android wear,索尼SW2改进不错 体验很舒适_索尼 SmartWatch SW2_GPS评测-中关村在线...
  18. 转载:解决采集UTF-8网页空格变成问号乱码
  19. [python]使用python实现Hadoop MapReduce程序:计算一组数据的均值和方差
  20. 3、Kubernetes的基本使用

热门文章

  1. 教育市场藏宝图:寻找机会和模式
  2. 送东西“送”出新花样,成为他人生重要的契机
  3. 九游与阿里手游初步整合 将获淘宝支付宝入口
  4. R包安装时安装程序包****时退出的状态不是0,或者版本不适的一种解决方法。
  5. 凹形长方形的周长计算_凹周长的计算公式
  6. warning: React does not recognize the xxx prop on a DOM element
  7. 苹果xr邮件无法连接服务器,iPhone XR手机怎么添加QQ邮箱?苹果XR添加QQ邮箱的方法...
  8. PMP®|如何做好项目进度管理?
  9. 点聚weboffice使用总结
  10. 维度解析(第三章)- 二维