1.语音增强技术概述

2024-05-01 04:58:15

一、语音增强发展历史

1987年：Lim和Oppenheim发表语音增强的维纳滤波方法；
1987年：Boll发表谱减法；
1980年：Maulay和Malpass提出软判决噪声一直方法；
1984年：Ephraim和Malah提出基于最小均方误差短时谱幅度估计的语音增强算法；

随后随着DSP发展，相继出现：最小均方（LMS）自适应滤波语音增强算法、基于短时谱（STS）估计的语音增强法、基于小波变换的语音增强算法、改进谱减法等。

二、语音信号特征以及语音信号模型

1.语音信号特征

语音生成过程与发音器官的运动过程密切相关。例如元音发音是气流不受口腔的阻碍发出的，辅音实在口腔阻碍气流时发出的音。同时根据声带的振动与否可以分为**清辅音（声带不振动）和浊辅音（声带振动）**两种。

清音的特点：
没有明显的时域和频域特征，看上去类似于白噪声
浊音的特点：
(1) 在时域上呈现出明显的周期性
(2) 频谱中有明显的几个凸起点，他们的出现频率与声道的谐振频率相对应，这些凸起点称为共振峰，其频率成为共振峰频率。

语音增强中可以利用浊音的明显周期性来区别一直非语音噪声。

2.语音信号模型

为了用计算机定量对语音信号进行模拟和处理，建立了语音发声模型 ， 语音增强信号模型

1）语音发声模型
Av和Au分别为浊音和清音的激励幅度

2）语音增强信号模型
表达式为 : y(n)=s(n)+d(n)
y(n) 表示带噪语音
s(n) 表示纯净语言
d(n) 表示干扰噪音

三、主要研究方法

1）谱减法
经典的谱减法通过假设噪声时平稳的加性噪声，且语音信号与噪声不相关，估计噪声频谱并减去该估计值得到估计的原声，从而实现语音增强。虽然这种方法容易实现，但这种方法在非平稳环境下处理效果不明显，并且在信噪比低的情况下，对语音的可懂度与自然度损害较大。

2）噪声对消法（自适应滤波技术）
需要采集背景噪声作为参考信号，易班采用自适应滤波技术，在输入信号与统计特征或变化未知的情况下，通过调整自身参数，来达到最佳滤波效果。有”自主学习“的过程。

四、效果评价参数

信噪比（SNR）与分段信噪比（segment-SNR）

信噪比=语音信号平均功率/噪声信号的平均功率

信噪比越大，说明噪声和失真越小，波形越接近纯净语音波形

1.语音增强技术概述相关推荐

ICASSP 2023 | 解密实时通话中基于 AI 的一些语音增强技术
‍ 动手点关注干货不迷路背景介绍实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备.多人. ...
语音增强算法的概述[转]
选自:http://www.cnblogs.com/chunge2050/p/3159158.html 本课题隶属于学校的创新性课题研究项目.2012年就已经做完了,今天一并拿来发表. 目录: --基 ...
语音增强相关技术综述
1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://git ...
无中生有！没有视觉信号的视觉语音增强
今天跟大家分享一篇非常有意思也很有用的文章,是WACV 2021的录用论文Visual Speech Enhancement Without A Real Visual Stream.该文研究涉及计算 ...
音视频开发（39）---语音增强
语音增强 1.1 语音增强概况语音增强,英文名:Speech Enhancement,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的"污染"语 ...
【信号处理】基于小波变换的语音增强matlab源码
一.简介语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平 ...
基于小波变换的语音增强算法简单综述
前言: 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平稳 ...
短时幅度谱估计在语音增强中的研究和应用
语音处理过程中受到各种各样噪声的干扰,不但降低了语音质量,而且还将使整个系统无法正常工作.因此,为了消除噪声干扰,在现代语音处理技术中,工业上一般采用语音增强技术来改善语音质量从而提高系统性能. 本论 ...
ICASSP2023 | TEA-PSE 3.0: 深度噪声抑制（DNS）竞赛个性化语音增强冠军方案解读
实时通信 (RTC) 在我们的日常生活中变得不可或缺,诸如腾讯会议在内的语音RTC应用已经成为我们日常使用的在线交流工具.然而在通话过程中,语音质量受到背景噪声.混响.干扰说话人等多种干扰的显著影响. ...
2020五大技术趋势一览！超自动化、人类增强技术、无人驾驶发展、机器视觉崛起、区块链实用化...
文章原载于 RichardLiu 自动驾驶技术的发展近年来,自动驾驶技术一直在发展,特斯拉.英特尔等大公司在这一领域取得了长足的进展. 虽然我们还没有达到L4级或L5级自动驾驶汽车的水平,但我们已 ...

最新文章

热门文章