目录

引言:

解决鸡尾酒会问题:

一.  麦克风阵列概述

麦克风阵列增强的原理:

近场与远场:

波达方向(DOA):

零陷:

空域混叠:

空域采样定理:

极坐标图和二维深度图:

线性阵列的波束响应与麦克风个数及间距的关系:

麦克风阵列对噪音信号建模:


引言:

麦克风阵列和其对应的波束形成算法,是远场语音交互中前端处理的核心部分。(SNR较低)经典的场景如多人说话的嘈杂场景称为鸡尾酒会效应。

解决鸡尾酒会问题:

方案1 BSS.

利用单通道算法解决鸡尾酒会问题属于盲源分离问题(BSS,Blind Source Seperation),目标是从多个混合的信号中提取目标信号。盲源分离问题从独立元分析(ICA)发展到如今使用神经网络,但效果仍然不佳。

方案2:利用麦克风阵列。

利用麦克风阵列能获取空间信息,通过空间滤波对信号实现定向增强。 波束形成方法就是一种典型的空间滤波。    并且定向增强能抑制语音反射,起到减轻混响作用。

一.  麦克风阵列概述

麦克风阵列定义:多个按照一定规则排列的麦克风。最常用的阵型包括线性、环形和矩形等。

环形阵列:适用于平面360度收音,可以区分水平与垂直角度。比如圆柱形音箱。

线性阵列:平面180度收音,但无法区分水平和垂直角度。比如微软Kinect等游戏设备,智能交互大屏。

矩形阵列:可以区分水平和垂直角度。

波阵面(英语:wave surface)简称“波面”,为波在介质中传播时,经相同时间所到达的各点所连成的直线、曲线(二维内)或面(三维内)。也就是说,它指的是某一时刻波动所达到的各点所连成的曲面。最前方的曲面叫做“波前”(英语:wave front)。波阵面质点的振动情况与机械波的波源初始振动情况相同。由于同一波阵面上各点的振动相位相同,所以波阵面是同相面(即相位差为零)。

麦克风阵列增强的原理:

不同相位信号叠加时,同相增强,反相抵消。

近场与远场:

对麦克风阵列,语音看作点声源:

  1. 当声源距离小于2*d^2 / λ,为近场,可看作球面波模型(每个麦克风收到的信号幅度和相位均不同)
  2. 当声源距离大于2*d^2 / λ,为远场,可看作平面波模型(每个麦克风收到信号幅度一致,相位不同)

(这里只考虑远场情况,采样率一般16kHZ, 最高频率8kHz, 对应波长0.0425m,   即此时2*d^2 / λ = 47*(d^2)

波达方向(DOA):

声波入射方向与麦克风连线的法线的夹角。

两个麦克风收到的信号差与在波达方向上的投影间距成正比。

零陷:

当两个麦克风信号完全反相,输出为0,这种现象称之为”零陷“

零陷条件为,波达时间差的绝对值等于周期的一半。

空域混叠:

当出现零陷,DOA进一步增大,输出幅度会再次增加,从而在波束特性中形成栅瓣,这种现象为空域混叠。

空域采样定理:

 d <= λ/2 , λ为最高频率信号的波长(8kHz的波长时0.0425m, 因此麦克风之间的间距应该小于0.02125m).

实际应用中由于高频信号传播损耗严重,可以适当放开对高频信号的混叠,允许高频部分出现一定程度的栅瓣。

时域的那奎斯特采样定理:f >=  2fmax

线性均匀分布麦克风阵列的波束增益一般形式:

极坐标图和二维深度图:

如上图左,角度是DOA,半径反映信号增益。0度和180度方向上是主瓣,对应右图中间黄色条带,其他是旁瓣,旁瓣能量较小。

主瓣的增益和宽度是评价麦克风阵列的重要指标。增益是指对目标信号的增强能力,宽度是指增益下降3db时,从最高点往左右两侧下降组成的夹角。

主瓣的宽度在不同频率上是不一样的,语音信号这样的宽带信号,处理后会导致各频率之间能量比的改变,带来一定的失真。

线性阵列的波束响应与麦克风个数及间距的关系:

由图:

  1. 麦克风数量增加,主瓣宽度变窄,旁瓣数量增多。
  2. 同样数量麦克风,间距越大,旁瓣数量越多,旁瓣的峰值增益越高。

如上图,对于均匀线性阵列,只需将所有信号相加即可实现正面0度方向对指向性波束。

但对于环形阵列和矩形阵列,不存在一个方向的波束使得每个麦克风接受到的信号相位相同,因此不能直接将信号相加。

麦克风阵列对噪音信号建模:

通常使用噪声场对麦克风阵列采集到的噪声进行建模,即定义不同通道之间的噪音互功率谱相关性。

理想无散射环境下(如消声室),每个麦克风接受到的噪声说一样,可采用相干噪声场模型。对于电气特性产生的噪音,认为它们完全不相干采用不相干噪声场模型。

利用sinc函数对散射噪声场进行建模:

总结自《语音识别服务实战》

麦克风阵列概述与波束形成—(1) 麦克风阵列概述相关推荐

  1. HFSS仿真宝典 | 阵列天线的波束扫描

    目录 前言 1. 阵列天线的波束扫描 2. HFSS阵列天线模型 3. 仿真求解设置技巧 4. 波束扫描方法一:变量扫参 5. 波束扫描方法二:自定义权值表 关注"电磁学社",让电 ...

  2. 阵列信号处理及matlab实现_麦克风阵列原理及应用

    01 - 什么是麦克风阵列 麦克风阵列是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统. 目前常用的麦克风阵列可以按布局形状分为:线性阵列,平面阵列,以及立体阵列.其几何构型是按设计已知 ...

  3. Win11麦克风测试在哪里?Win11测试麦克风的方法

    Win11麦克风测试在哪里?如果你的麦克风很久没使用了,想要测试麦克风能否正常使用,那么可以参考以下小编带来的Win11测试麦克风的两种方法,这个步骤教程还是比较简单的. ​还有详细的系统重装教程可参 ...

  4. 麦克风声音小怎么设置 怎么调节麦克风声音

    最近各种播音节目非常受大家欢迎,普及率最高的莫过于YY语音了.在使用电脑麦克风录音或者K歌的时候,总感觉麦克风录音声音小,但又不知道如何设置解决.下面安装系统小编为大家带来了一篇比较完整的麦克风录音声 ...

  5. android 麦克风权限设置,绝地求生刺激战场麦克风权限怎么设置?刺激战场麦克风权限设置方法[多图]...

    绝地求生刺激战场麦克风权限有哪些方法设置?麦克风可以和玩家之间进行沟通,但是有时候开了语音也没有声音,下面就让安卓乐园小编为大家带来,刺激战场麦克风权限设置方法. 绝地求生刺激战场语音怎么没声音 1. ...

  6. Win10初次使用麦克风时该怎么设置才能发挥麦克风应有效果

    个人博客完整原文 1 麦克风设置 (1)试音方法 不要对麦克风用力吹气或用手拍打其头部以试音,正确的试音方法是对准麦克风以正常口气说话. 根据麦克风指向性进行选择麦克风朝向,我这里用的是心形麦克风,因 ...

  7. 麦克风音频服务器未响应,耳机和麦克风都没坏,插上电脑后为什么不能语音聊天?...

    耳机和麦克风都没坏,插上电脑后为什么不能语音聊天?以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 耳机和麦克风都没坏,插 ...

  8. pc端html调用麦克风_如何减少PC上的麦克风背景噪音

    pc端html调用麦克风 Micolas/Shutterstock.com Micolas / Shutterstock.com Whether you're video conferencing w ...

  9. mac实时麦克风_如何在Mac上选择麦克风

    mac实时麦克风 Whether they're built-in to your computer or webcam (or not), you likely have multiple micr ...

  10. inventor 波纹阵列_Inventor技巧之草图驱动的阵列图文教程

    继矩形阵列和环形阵列之后,加入了第三种阵列方式,草图驱动的阵列,该命令和其他两个阵列命令一起,位于三维模型标签的阵列面板上. 对于阵列的对象,与另外两个阵列命令一样,可以选择特征或者是实体.每一个阵列 ...

最新文章

  1. 基于互联网大脑架构的阿里巴巴未来趋势分析【系列2】
  2. .net平台的rabbitmq使用封装
  3. RequestDispatcher
  4. 软件项目管理课后题下载【共5个章(1、3、4、5、6)】
  5. 计算机管理档案有什么好处,利用资料管理系统管理档案有什么好处
  6. Spring Boot RestTemplate 忽略证书访问https
  7. 谷歌AI用“深度”学习来虚化背景,单摄手机可用,Jeff Dean表示优秀
  8. android tcp 工具,TcpIp工具包app
  9. 测试驱动开发(TDD)在海外组的实践总结
  10. 数学分析教程(科大)——1.6笔记+习题
  11. 诛仙服务器技能修改,2021年5月21日正式服技能修改公告
  12. 杨洋江疏影封面照合体,《全职》诠释衣品即人品
  13. DINO Emerging Properties in Self-Supervised Vision Transformers 论文阅读
  14. 机器学习算法笔记之K近邻算法(KNeighborsClassifier)
  15. 浙江移动智能语音服务器,电视还能这样玩?中国移动智能语音遥控器,让电视机听你的...
  16. 综述论文包含哪些内容?
  17. 自旋芯片什么时候应用到计算机,史上首次!硅量子计算机芯片的完整设计公布...
  18. 10 降维算法(PCA降维/LDA分类/NMF非负矩阵)
  19. MybatisPlus之代码生成器(有此一篇即可)
  20. CT影像中肺结节自动检测算法的验证、比较和组合:The LUNA16 challenge

热门文章

  1. 数据库设计 资源表与资源收藏表的设计
  2. Cygwin 安装使用
  3. 如何用Mockplus快速做一个手风琴菜单?
  4. android跳到自带浏览器打开pdf
  5. javascript键盘事件
  6. [ubuntu]Ubuntu查看cpu温度
  7. python终止死循环和开启死循环
  8. Microsoft Sync Framework Runtime 简介(一篇非常好的MSF介绍文章)
  9. 小案例:利用Python实现图片上下、左右翻转
  10. graphpad7.04多组比较p值_GraphPad Prism 7进行pearson相关性分析