1.语音增强技术概述
一、语音增强发展历史
1987年:Lim和Oppenheim发表语音增强的维纳滤波方法;
1987年:Boll发表谱减法;
1980年:Maulay和Malpass提出软判决噪声一直方法;
1984年:Ephraim和Malah提出基于最小均方误差短时谱幅度估计的语音增强算法;
随后随着DSP发展,相继出现:最小均方(LMS)自适应滤波语音增强算法、基于短时谱(STS)估计的语音增强法、基于小波变换的语音增强算法、改进谱减法等。
二、语音信号特征以及语音信号模型
1.语音信号特征
语音生成过程与发音器官的运动过程密切相关。例如元音发音是气流不受口腔的阻碍发出的,辅音实在口腔阻碍气流时发出的音。同时根据声带的振动与否可以分为**清辅音(声带不振动)和浊辅音(声带振动)**两种。
清音的特点:
没有明显的时域和频域特征,看上去类似于白噪声
浊音的特点:
(1) 在时域上呈现出明显的周期性
(2) 频谱中有明显的几个凸起点,他们的出现频率与声道的谐振频率相对应,这些凸起点称为共振峰,其频率成为共振峰频率。
语音增强中可以利用浊音的明显周期性来区别一直非语音噪声。
2.语音信号模型
为了用计算机定量对语音信号进行模拟和处理,建立了语音发声模型 , 语音增强信号模型
1)语音发声模型
Av和Au分别为浊音和清音的激励幅度
2)语音增强信号模型
表达式为 : y(n)=s(n)+d(n)
y(n) 表示带噪语音
s(n) 表示纯净语言
d(n) 表示干扰噪音
三、主要研究方法
1)谱减法
经典的谱减法通过假设噪声时平稳的加性噪声,且语音信号与噪声不相关,估计噪声频谱并减去该估计值得到估计的原声,从而实现语音增强。虽然这种方法容易实现,但这种方法在非平稳环境下处理效果不明显,并且在信噪比低的情况下,对语音的可懂度与自然度损害较大。
2)噪声对消法(自适应滤波技术)
需要采集背景噪声作为参考信号,易班采用自适应滤波技术,在输入信号与统计特征或变化未知的情况下,通过调整自身参数,来达到最佳滤波效果。有”自主学习“的过程。
四、效果评价参数
信噪比(SNR)与分段信噪比(segment-SNR)
信噪比=语音信号平均功率/噪声信号的平均功率
信噪比越大,说明噪声和失真越小,波形越接近纯净语音波形
1.语音增强技术概述相关推荐
- ICASSP 2023 | 解密实时通话中基于 AI 的一些语音增强技术
动手点关注 干货不迷路 背景介绍 实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备.多人. ...
- 语音增强算法的概述[转]
选自:http://www.cnblogs.com/chunge2050/p/3159158.html 本课题隶属于学校的创新性课题研究项目.2012年就已经做完了,今天一并拿来发表. 目录: --基 ...
- 语音增强相关技术综述
1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://git ...
- 无中生有!没有视觉信号的视觉语音增强
今天跟大家分享一篇非常有意思也很有用的文章,是WACV 2021的录用论文Visual Speech Enhancement Without A Real Visual Stream.该文研究涉及计算 ...
- 音视频开发(39)---语音增强
语音增强 1.1 语音增强概况 语音增强,英文名:Speech Enhancement,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的"污染"语 ...
- 【信号处理】基于小波变换的语音增强matlab源码
一.简介 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平 ...
- 基于小波变换的语音增强算法简单综述
前言: 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平稳 ...
- 短时幅度谱估计在语音增强中的研究和应用
语音处理过程中受到各种各样噪声的干扰,不但降低了语音质量,而且还将使整个系统无法正常工作.因此,为了消除噪声干扰,在现代语音处理技术中,工业上一般采用语音增强技术来改善语音质量从而提高系统性能. 本论 ...
- ICASSP2023 | TEA-PSE 3.0: 深度噪声抑制(DNS)竞赛个性化语音增强冠军方案解读
实时通信 (RTC) 在我们的日常生活中变得不可或缺,诸如腾讯会议在内的语音RTC应用已经成为我们日常使用的在线交流工具.然而在通话过程中,语音质量受到背景噪声.混响.干扰说话人等多种干扰的显著影响. ...
- 2020五大技术趋势一览!超自动化、人类增强技术、无人驾驶发展、机器视觉崛起、区块链实用化...
文章原载于 RichardLiu 自动驾驶技术的发展 近年来,自动驾驶技术一直在发展,特斯拉.英特尔等大公司在这一领域取得了长足的进展. 虽然我们还没有达到L4级或L5级自动驾驶汽车的水平,但我们已 ...
最新文章
- Java OpenCV-4.0.0 图像处理22 图像模板匹配
- 082_html5Web存储
- 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR
- linux怎么修改sftp默认端口,转:linux 修改sftp服务默认提供者sshd的session timeout
- 使用MQTT与函数计算做热力图的实践
- 异步fifo_【推荐】数字芯片异步FIFO设计经典论文
- 根据Request获取客户端IP
- 【廖雪峰官方网站/Java教程】设计模式(二)
- Ubuntu15.10下华南师大锐捷认证客户端的使用详解
- itest听力答案2020_itest大学英语测试答案2019
- 保姆级Ruby on rails安装教程
- 简单html,用CSS设计一个留言板
- 财务想转行?SAP咨询顾问了解一下
- qt html表格自动增加行,QT中的tablewidget如何插入一行数据
- android脚本需语言,Android中使用脚本语言Lua
- java基于easypoi实现对导出的excel文档加密
- AMiner背后的技术细节与挑战
- pygame-KidsCanCode系列jumpy-part14-背景音乐及音效
- 计算机声音在线模拟,计算机声场模拟软件ODEON及其应用.pdf
- 【C++】RAll,裸指针,弃用auto_ptr原因