麦克风阵列概述与波束形成—(1) 麦克风阵列概述
目录
引言:
解决鸡尾酒会问题:
一. 麦克风阵列概述
麦克风阵列增强的原理:
近场与远场:
波达方向(DOA):
零陷:
空域混叠:
空域采样定理:
极坐标图和二维深度图:
线性阵列的波束响应与麦克风个数及间距的关系:
麦克风阵列对噪音信号建模:
引言:
麦克风阵列和其对应的波束形成算法,是远场语音交互中前端处理的核心部分。(SNR较低)经典的场景如多人说话的嘈杂场景称为鸡尾酒会效应。
解决鸡尾酒会问题:
方案1: BSS.
利用单通道算法解决鸡尾酒会问题属于盲源分离问题(BSS,Blind Source Seperation),目标是从多个混合的信号中提取目标信号。盲源分离问题从独立元分析(ICA)发展到如今使用神经网络,但效果仍然不佳。
方案2:利用麦克风阵列。
利用麦克风阵列能获取空间信息,通过空间滤波对信号实现定向增强。 波束形成方法就是一种典型的空间滤波。 并且定向增强能抑制语音反射,起到减轻混响作用。
一. 麦克风阵列概述
麦克风阵列定义:多个按照一定规则排列的麦克风。最常用的阵型包括线性、环形和矩形等。
环形阵列:适用于平面360度收音,可以区分水平与垂直角度。比如圆柱形音箱。
线性阵列:平面180度收音,但无法区分水平和垂直角度。比如微软Kinect等游戏设备,智能交互大屏。
矩形阵列:可以区分水平和垂直角度。
波阵面(英语:wave surface)简称“波面”,为波在介质中传播时,经相同时间所到达的各点所连成的直线、曲线(二维内)或面(三维内)。也就是说,它指的是某一时刻波动所达到的各点所连成的曲面。最前方的曲面叫做“波前”(英语:wave front)。波阵面质点的振动情况与机械波的波源初始振动情况相同。由于同一波阵面上各点的振动相位相同,所以波阵面是同相面(即相位差为零)。
麦克风阵列增强的原理:
不同相位信号叠加时,同相增强,反相抵消。
近场与远场:
对麦克风阵列,语音看作点声源:
- 当声源距离小于2*d^2 / λ,为近场,可看作球面波模型(每个麦克风收到的信号幅度和相位均不同)
- 当声源距离大于2*d^2 / λ,为远场,可看作平面波模型(每个麦克风收到信号幅度一致,相位不同)
(这里只考虑远场情况,采样率一般16kHZ, 最高频率8kHz, 对应波长0.0425m, 即此时2*d^2 / λ = 47*(d^2)
波达方向(DOA):
声波入射方向与麦克风连线的法线的夹角。
两个麦克风收到的信号差与在波达方向上的投影间距成正比。
零陷:
当两个麦克风信号完全反相,输出为0,这种现象称之为”零陷“。
零陷条件为,波达时间差的绝对值等于周期的一半。
空域混叠:
当出现零陷,DOA进一步增大,输出幅度会再次增加,从而在波束特性中形成栅瓣,这种现象为空域混叠。
空域采样定理:
d <= λ/2 , λ为最高频率信号的波长(8kHz的波长时0.0425m, 因此麦克风之间的间距应该小于0.02125m).
实际应用中由于高频信号传播损耗严重,可以适当放开对高频信号的混叠,允许高频部分出现一定程度的栅瓣。
时域的那奎斯特采样定理:f >= 2fmax
线性均匀分布麦克风阵列的波束增益一般形式:
极坐标图和二维深度图:
如上图左,角度是DOA,半径反映信号增益。0度和180度方向上是主瓣,对应右图中间黄色条带,其他是旁瓣,旁瓣能量较小。
主瓣的增益和宽度是评价麦克风阵列的重要指标。增益是指对目标信号的增强能力,宽度是指增益下降3db时,从最高点往左右两侧下降组成的夹角。
主瓣的宽度在不同频率上是不一样的,语音信号这样的宽带信号,处理后会导致各频率之间能量比的改变,带来一定的失真。
线性阵列的波束响应与麦克风个数及间距的关系:
由图:
- 麦克风数量增加,主瓣宽度变窄,旁瓣数量增多。
- 同样数量麦克风,间距越大,旁瓣数量越多,旁瓣的峰值增益越高。
如上图,对于均匀线性阵列,只需将所有信号相加即可实现正面0度方向对指向性波束。
但对于环形阵列和矩形阵列,不存在一个方向的波束使得每个麦克风接受到的信号相位相同,因此不能直接将信号相加。
麦克风阵列对噪音信号建模:
通常使用噪声场对麦克风阵列采集到的噪声进行建模,即定义不同通道之间的噪音互功率谱相关性。
理想无散射环境下(如消声室),每个麦克风接受到的噪声说一样,可采用相干噪声场模型。对于电气特性产生的噪音,认为它们完全不相干采用不相干噪声场模型。
利用sinc函数对散射噪声场进行建模:
总结自《语音识别服务实战》
麦克风阵列概述与波束形成—(1) 麦克风阵列概述相关推荐
- HFSS仿真宝典 | 阵列天线的波束扫描
目录 前言 1. 阵列天线的波束扫描 2. HFSS阵列天线模型 3. 仿真求解设置技巧 4. 波束扫描方法一:变量扫参 5. 波束扫描方法二:自定义权值表 关注"电磁学社",让电 ...
- 阵列信号处理及matlab实现_麦克风阵列原理及应用
01 - 什么是麦克风阵列 麦克风阵列是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统. 目前常用的麦克风阵列可以按布局形状分为:线性阵列,平面阵列,以及立体阵列.其几何构型是按设计已知 ...
- Win11麦克风测试在哪里?Win11测试麦克风的方法
Win11麦克风测试在哪里?如果你的麦克风很久没使用了,想要测试麦克风能否正常使用,那么可以参考以下小编带来的Win11测试麦克风的两种方法,这个步骤教程还是比较简单的. 还有详细的系统重装教程可参 ...
- 麦克风声音小怎么设置 怎么调节麦克风声音
最近各种播音节目非常受大家欢迎,普及率最高的莫过于YY语音了.在使用电脑麦克风录音或者K歌的时候,总感觉麦克风录音声音小,但又不知道如何设置解决.下面安装系统小编为大家带来了一篇比较完整的麦克风录音声 ...
- android 麦克风权限设置,绝地求生刺激战场麦克风权限怎么设置?刺激战场麦克风权限设置方法[多图]...
绝地求生刺激战场麦克风权限有哪些方法设置?麦克风可以和玩家之间进行沟通,但是有时候开了语音也没有声音,下面就让安卓乐园小编为大家带来,刺激战场麦克风权限设置方法. 绝地求生刺激战场语音怎么没声音 1. ...
- Win10初次使用麦克风时该怎么设置才能发挥麦克风应有效果
个人博客完整原文 1 麦克风设置 (1)试音方法 不要对麦克风用力吹气或用手拍打其头部以试音,正确的试音方法是对准麦克风以正常口气说话. 根据麦克风指向性进行选择麦克风朝向,我这里用的是心形麦克风,因 ...
- 麦克风音频服务器未响应,耳机和麦克风都没坏,插上电脑后为什么不能语音聊天?...
耳机和麦克风都没坏,插上电脑后为什么不能语音聊天?以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 耳机和麦克风都没坏,插 ...
- pc端html调用麦克风_如何减少PC上的麦克风背景噪音
pc端html调用麦克风 Micolas/Shutterstock.com Micolas / Shutterstock.com Whether you're video conferencing w ...
- mac实时麦克风_如何在Mac上选择麦克风
mac实时麦克风 Whether they're built-in to your computer or webcam (or not), you likely have multiple micr ...
- inventor 波纹阵列_Inventor技巧之草图驱动的阵列图文教程
继矩形阵列和环形阵列之后,加入了第三种阵列方式,草图驱动的阵列,该命令和其他两个阵列命令一起,位于三维模型标签的阵列面板上. 对于阵列的对象,与另外两个阵列命令一样,可以选择特征或者是实体.每一个阵列 ...
最新文章
- 基于互联网大脑架构的阿里巴巴未来趋势分析【系列2】
- .net平台的rabbitmq使用封装
- RequestDispatcher
- 软件项目管理课后题下载【共5个章(1、3、4、5、6)】
- 计算机管理档案有什么好处,利用资料管理系统管理档案有什么好处
- Spring Boot RestTemplate 忽略证书访问https
- 谷歌AI用“深度”学习来虚化背景,单摄手机可用,Jeff Dean表示优秀
- android tcp 工具,TcpIp工具包app
- 测试驱动开发(TDD)在海外组的实践总结
- 数学分析教程(科大)——1.6笔记+习题
- 诛仙服务器技能修改,2021年5月21日正式服技能修改公告
- 杨洋江疏影封面照合体,《全职》诠释衣品即人品
- DINO Emerging Properties in Self-Supervised Vision Transformers 论文阅读
- 机器学习算法笔记之K近邻算法(KNeighborsClassifier)
- 浙江移动智能语音服务器,电视还能这样玩?中国移动智能语音遥控器,让电视机听你的...
- 综述论文包含哪些内容?
- 自旋芯片什么时候应用到计算机,史上首次!硅量子计算机芯片的完整设计公布...
- 10 降维算法(PCA降维/LDA分类/NMF非负矩阵)
- MybatisPlus之代码生成器(有此一篇即可)
- CT影像中肺结节自动检测算法的验证、比较和组合:The LUNA16 challenge