一、语音增强发展历史

1987年:Lim和Oppenheim发表语音增强的维纳滤波方法;
1987年:Boll发表谱减法;
1980年:Maulay和Malpass提出软判决噪声一直方法;
1984年:Ephraim和Malah提出基于最小均方误差短时谱幅度估计的语音增强算法;

随后随着DSP发展,相继出现:最小均方(LMS)自适应滤波语音增强算法、基于短时谱(STS)估计的语音增强法、基于小波变换的语音增强算法、改进谱减法等。

二、语音信号特征以及语音信号模型

1.语音信号特征

语音生成过程与发音器官的运动过程密切相关。例如元音发音是气流不受口腔的阻碍发出的,辅音实在口腔阻碍气流时发出的音。同时根据声带的振动与否可以分为**清辅音(声带不振动)浊辅音(声带振动)**两种。

清音的特点:
没有明显的时域和频域特征,看上去类似于白噪声
浊音的特点:
(1) 在时域上呈现出明显的周期性
(2) 频谱中有明显的几个凸起点,他们的出现频率与声道的谐振频率相对应,这些凸起点称为共振峰,其频率成为共振峰频率。

语音增强中可以利用浊音的明显周期性来区别一直非语音噪声。

2.语音信号模型

为了用计算机定量对语音信号进行模拟和处理,建立了语音发声模型语音增强信号模型

1)语音发声模型
Av和Au分别为浊音和清音的激励幅度

2)语音增强信号模型
表达式为 : y(n)=s(n)+d(n)
y(n) 表示带噪语音
s(n) 表示纯净语言
d(n) 表示干扰噪音

三、主要研究方法

1)谱减法
经典的谱减法通过假设噪声时平稳的加性噪声,且语音信号与噪声不相关,估计噪声频谱并减去该估计值得到估计的原声,从而实现语音增强。虽然这种方法容易实现,但这种方法在非平稳环境下处理效果不明显,并且在信噪比低的情况下,对语音的可懂度与自然度损害较大。

2)噪声对消法(自适应滤波技术)
需要采集背景噪声作为参考信号,易班采用自适应滤波技术,在输入信号与统计特征或变化未知的情况下,通过调整自身参数,来达到最佳滤波效果。有”自主学习“的过程。

四、效果评价参数

信噪比(SNR)与分段信噪比(segment-SNR)

信噪比=语音信号平均功率/噪声信号的平均功率

信噪比越大,说明噪声和失真越小,波形越接近纯净语音波形

1.语音增强技术概述相关推荐

  1. ICASSP 2023 | 解密实时通话中基于 AI 的一些语音增强技术

    ‍ 动手点关注 干货不迷路 背景介绍 实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备.多人. ...

  2. 语音增强算法的概述[转]

    选自:http://www.cnblogs.com/chunge2050/p/3159158.html 本课题隶属于学校的创新性课题研究项目.2012年就已经做完了,今天一并拿来发表. 目录: --基 ...

  3. 语音增强相关技术综述

    1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://git ...

  4. 无中生有!没有视觉信号的视觉语音增强

    今天跟大家分享一篇非常有意思也很有用的文章,是WACV 2021的录用论文Visual Speech Enhancement Without A Real Visual Stream.该文研究涉及计算 ...

  5. 音视频开发(39)---语音增强

    语音增强 1.1 语音增强概况   语音增强,英文名:Speech Enhancement,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的"污染"语 ...

  6. 【信号处理】基于小波变换的语音增强matlab源码

    一.简介 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平 ...

  7. 基于小波变换的语音增强算法简单综述

    前言: 语音通信是人类传播信息,进行交流时使用最多.最自然.最基本的一种手段.而这种通信中的信息载体-语音信号却是一种时变的.非平稳的信号,只有在很短的一段时间内(通常为10~30ms)才被认为是平稳 ...

  8. 短时幅度谱估计在语音增强中的研究和应用

    语音处理过程中受到各种各样噪声的干扰,不但降低了语音质量,而且还将使整个系统无法正常工作.因此,为了消除噪声干扰,在现代语音处理技术中,工业上一般采用语音增强技术来改善语音质量从而提高系统性能. 本论 ...

  9. ICASSP2023 | TEA-PSE 3.0: 深度噪声抑制(DNS)竞赛个性化语音增强冠军方案解读

    实时通信 (RTC) 在我们的日常生活中变得不可或缺,诸如腾讯会议在内的语音RTC应用已经成为我们日常使用的在线交流工具.然而在通话过程中,语音质量受到背景噪声.混响.干扰说话人等多种干扰的显著影响. ...

  10. 2020五大技术趋势一览!超自动化、人类增强技术、无人驾驶发展、机器视觉崛起、区块链实用化...

    文章原载于  RichardLiu 自动驾驶技术的发展 近年来,自动驾驶技术一直在发展,特斯拉.英特尔等大公司在这一领域取得了长足的进展. 虽然我们还没有达到L4级或L5级自动驾驶汽车的水平,但我们已 ...

最新文章

  1. Java OpenCV-4.0.0 图像处理22 图像模板匹配
  2. 082_html5Web存储
  3. 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR
  4. linux怎么修改sftp默认端口,转:linux 修改sftp服务默认提供者sshd的session timeout
  5. 使用MQTT与函数计算做热力图的实践
  6. 异步fifo_【推荐】数字芯片异步FIFO设计经典论文
  7. 根据Request获取客户端IP
  8. 【廖雪峰官方网站/Java教程】设计模式(二)
  9. Ubuntu15.10下华南师大锐捷认证客户端的使用详解
  10. itest听力答案2020_itest大学英语测试答案2019
  11. 保姆级Ruby on rails安装教程
  12. 简单html,用CSS设计一个留言板
  13. 财务想转行?SAP咨询顾问了解一下
  14. qt html表格自动增加行,QT中的tablewidget如何插入一行数据
  15. android脚本需语言,Android中使用脚本语言Lua
  16. java基于easypoi实现对导出的excel文档加密
  17. AMiner背后的技术细节与挑战
  18. pygame-KidsCanCode系列jumpy-part14-背景音乐及音效
  19. 计算机声音在线模拟,计算机声场模拟软件ODEON及其应用.pdf
  20. 【C++】RAll,裸指针,弃用auto_ptr原因

热门文章

  1. 信息安全工程师考试科目
  2. 计算机专业有没有3D打印,3D打印技术属于哪个专业_招生问答
  3. 韩立刚老师 -- 1、Linux 入门
  4. Excel对比两列数据相似度函数
  5. 安装pyltp遇到的问题
  6. 计算机主板上常用的接口,电脑主板上接口怎么接 主板所有接口插线功能作用识别图解...
  7. 周期信号的博里叶级数表示(连续时间)
  8. js将阿拉伯数字转换成汉字大写
  9. 转换YV12到RGB565图像转换,附YUV转RGB测试
  10. C++借助Eigen库实现矩阵开方(开根号)运算