在学习语音增强材料的时候,第一章不讲其他,直接开门见山地为Sound Fields And Room Acoustics,主要讲述声波的传输、统计模型以及房间的脉冲响应和时空特性。声波传播模型、房间脉冲响应及时空特性是我研究生阶段的主要课程之一,还算比较熟悉,但统计模型就涉及到一些随机过程的知识了,我打包票,此方面绝对在我研究生课程Kuttruff的《室内声学》中学习过,奈何后来工作学习的过程中用到地方太少以致遗忘的太快,脑阔里一点关于此的存货也没有了。不幸的是,忘掉的这些恰巧对学习理解自适应滤波、维纳滤波、阵列原理等非常重要。好在,仍有机会重温复习,幸甚!

声传播模型

声传播的过程,即波动的过程,是一个涉及到空间、时间的物理过程。根据波阵面的不同,可以简单的做一些分类。常见的有球面波和平面波(还有线型声源扩散,波阵面为圆柱面)。很好理解,石头落入水中荡起的涟漪好比是球面波的横截面,其波阵面是球形。而平面波则更好理解了。两张图,下面左侧为球面波的截面,右侧为平面波的截面。

实际上我们身处的声学环境,大部分均是球面波声场,可认为发声源是一点源。但是,可以看到,当距离声源足够远时(左图两个黑点),圆弧近似看作为直线,此时认为左侧的场景同右侧一样,是为平面波。这就好比我们站在地球上,感觉不到地球上圆的一样。以上就是平面波假设,是我们研究阵列及其他一些算法的重要前提假设。

声场统计模型

我们假设声场中任一点的信号是一个时空域的随机采样过程。描述声场中任意两点不同时刻信号之间的相关系数为两点信号相乘的期望,可以写作为:

而在匀强声场中,上述则可改写为:

在研究声场时,更一般的假设则是:静态且各向同性的,因此上述距离d 可以加个绝对值。

声场的空间交叉功率谱密度,直接借鉴随机信号的功率谱密度,由维纳钦金定理,信号的功率度密度等于信号自相关系数的傅立叶变换:

而归一化的空间交叉功率谱(Normalized Spatial Cross-PSD)写作:

上式,也即幅度均方相关系数(Magnitude Squared Coherence,MSC),用以描述空间声场的相关性:

1.当MSC = 1时,声场为Coherence Sound,完全相关声场

2.当MSC = 0时, 声场为Incoherent Sound,完全不相关声场,比如麦克风的底噪、电流噪音

有了上述,自然可以推导出平面波及球面波的MSC,球面波只取决于两点之间的距离,也即传播到两点的时差。而平面波则取决于两点之间连线与声波传播方向的角度。

一类比较特殊的声场——扩散场(混响室),其MSC:

这在后面求解阵列指向性因数的时候要一直用到。

可以看到

1.低频时,MSC近似为1,可以认为是空间相关声场,高频时MSC接近于0,可以认为是空间无关声场。

2.两点之间的距离是MSC的重要决定参数,这个是肯定的,几乎所有于频率有关的参数,都要牵涉到距离。毕竟距离与波长挂钩,而波长和频率成反比。

3.这种扩散声场近似可以认为是车内噪声场、后期混响场等典型声场。

其他的混合声场,都可以用上述模型进行加权逼近,不过用到的不多。

房间声学

关于这部分,我其实算是科班出身,我研究生主攻建筑声学,其中一门重要的课程就是上述提到过的Kuttruff的《Room Acoustics》,授课老师即是鄙人之导师,所以备课预习格外认真,且老师授课方式很新颖,无论是授课方式还是教学内容,我都印象深刻,受益匪浅。所以,下面也不仔细说了,流水账翻一翻吧。

上图,左侧小人是声源,可以认为是喇叭,右边的小人是听众,可以认为是麦克风,麦克风接受到的信号除了直达声,还有经过墙面一次反射延后到达的一次反射声,经过墙面二次反射延后到达的二次反射声。。。

墙面反射一次(或者传播途径远),可以认为声波能量产生了一定比列的损失(乘以损失系数),延后到达即认为产生一次时延,假设声源发出的信号为 ,接收到的信号则为:

上式是不是和滤波器的差分方程很像?!没错,这就是房间的脉冲响应(Impulse Response),是房间传递函数在时域上的表现形式。别小瞧这个式子,时域卷积运算的时候为什么反转序列移序相乘再相加,参透上式即可得彀中玄妙。

下图1即是脉冲响应的时域形式,图2为其时谱图,是一个房间典型的脉冲响应。这个IR在房间声学里作用非常之巨大,是一切研究的基础,可由此导出非常多的建筑声学参量,比如混响时间、早期衰变时间、时间重心等等等,这部分可参考任一本建筑声学教材。。这部分就不多赘述了,属于数字信号处理的范畴,是基础知识。

语音增强一,声场统计模型及房间声学相关推荐

  1. 功率谱 魏凤英统计程序_单通道语音增强之统计信号模型

    [欢迎访问我的博客原文](单通道语音增强之统计信号模型) 1. 信号估计理论简述 信号估计理论是现代统计处理的基础课题[@ZhangXianDa2002ModernSP],在通信.语音.图像领域均有广 ...

  2. 音视频开发(39)---语音增强

    语音增强 1.1 语音增强概况   语音增强,英文名:Speech Enhancement,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的"污染"语 ...

  3. ICASSP 2023 | 解密实时通话中基于 AI 的一些语音增强技术

    ‍ 动手点关注 干货不迷路 背景介绍 实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备.多人. ...

  4. AliCloudDenoise 语音增强算法:助力实时会议系统进入超清音质时代

    简介:近些年,随着实时通信技术的发展,在线会议逐渐成为人们工作中不可或缺的重要办公工具,据不完全统计,线上会议中约有 75% 为纯语音会议,即无需开启摄像头和屏幕共享功能,此时会议中的语音质量和清晰度 ...

  5. 音视频开发(37)---麦克风阵列语音增强(二)

    麦克风阵列语音增强(二) 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/zhanglu_wind/article/details/81217093 ...

  6. 音视频开发(35)---麦克风阵列语音增强

    1. 引言   对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列的语音增强算法(也称为,多通道的语音增强算法).麦克风阵列的语音增强方法的优势在于考虑了声源的位置信息,可 ...

  7. 语音增强算法的概述[转]

    选自:http://www.cnblogs.com/chunge2050/p/3159158.html 本课题隶属于学校的创新性课题研究项目.2012年就已经做完了,今天一并拿来发表. 目录: --基 ...

  8. ICASSP2023 | TEA-PSE 3.0: 深度噪声抑制(DNS)竞赛个性化语音增强冠军方案解读

    实时通信 (RTC) 在我们的日常生活中变得不可或缺,诸如腾讯会议在内的语音RTC应用已经成为我们日常使用的在线交流工具.然而在通话过程中,语音质量受到背景噪声.混响.干扰说话人等多种干扰的显著影响. ...

  9. 语音增强原理之噪声估计

    语音增强的整个过程,通常假设噪声为加性随机平稳噪声,且语音短时平稳,下面的原理描述中,都是在这两个假设前提之下来做的.整个语音增强的流程大致可以分为两大部分 一.噪声估计 二.衰减因子(有的地方也叫做 ...

最新文章

  1. openresty开发系列26--openresty中使用redis模块
  2. Asp学习者完整攻略之三:操作SQL:SQL基础:
  3. 深入理解HashMap+ConcurrrentHashMap扩容的原理
  4. Oracle(三)多行函数
  5. GetConsoleTitle 函数--获取控制台窗口标题
  6. 100% 的程序员都想挑战的算法趣题!
  7. python文件和路径操作
  8. java输入两个整数_Java中从键盘输入多个整数的方法
  9. 财务想转行?SAP咨询顾问了解一下
  10. 【实用性程序】弧微分计算圆周长
  11. js中undefined
  12. 倾斜摄影——三维建模软件ContextCapture (简体中文版安装教程-附软件下载)
  13. 人工神经网络分析方法,人工神经网络算法步骤
  14. 计算机网络英文论文,计算机网络与因特网论文(英文版)
  15. KlayGE-001-简介
  16. 驯龙高手java版_石器时代2驯龙高手
  17. java for 获取索引_获取Java列表中的对象索引
  18. Vue使用photo-sphere-viewer360°×180°全景插件模拟VR看房、房间切换和自定义标注
  19. 所有的事情都会趋于平淡
  20. 最大流问题与福特-富尔克森算法

热门文章

  1. c15语言中不支持十六进制的数据,浙江省普通高中2017学考选考(16年10月)信息技术试卷及答案解析...
  2. VMware上安装Hadoop安装配置与教程小白必看
  3. 爬虫08-验证码的处理
  4. 南京邮电大学计算机科学与技术分数线,南京邮电大学计算机科学与技术(中外合作办学)专业2016年在江苏理科高考录取最低分数线...
  5. 旷视首席科学家孙剑因突发疾病抢救无效去世:天妒英才
  6. MySQL中的substring_index()函数使用方法与技巧
  7. 如何用ChatGPT进行剧本/广告脚本写作?
  8. 谁偷偷删了你的微信?别慌!Python 把 TA 揪出来
  9. Python实现迪杰斯特拉算法和贝尔曼福特算法求解最短路径
  10. WIN 7下安装WIN 10双系统教程