您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn.

语音设备 SDK 麦克风阵列建议

07/16/2019

本文内容

本文介绍如何为语音设备 SDK 设计麦克风阵列。

语音设备 SDK 最适合与根据以下准则设计的麦克风阵列(包括麦克风几何结构和组件选择)配合使用。 本文还提供了有关集成和电力注意事项的指导。

麦克风几何结构

建议将以下阵列几何结构用于 Microsoft 音频堆栈。 借助更多的麦克风以及与特定应用程序、用户方案和设备外形规格之间的依赖关系,可以改善音源定位和环境噪声的抑制。

麦克风数和几何结构

环形阵列

环形阵列

线性阵列

线性阵列

# 麦克风数目

7

4

4

2

几何结构

6 个外置,1 个中置,半径 = 42.5 毫米,均匀排布间距

3 个外置,1 个中置,半径 = 42.5 毫米,均匀排布间距

长度 = 120 毫米,间距 = 40 毫米

间距 = 40 毫米

应根据上述每个阵列的编号(从 0 开始递增)排列麦克风声道的顺序。 需要为 Microsoft 音频堆栈提供额外的音频播放参考流才能让它执行回声消除。

组件选择

应选择适当的麦克风组件来准确重现无噪声和失真的信号。

选择麦克风时建议的属性如下:

参数

建议

信噪比

>= 65 dB(1 kHz 信号,94 dBSPL,A 加权噪声)

振幅匹配

± 1 dB @ 1 kHz

相位匹配

± 2° @ 1 kHz

声学过载点 (AOP)

>= 120 dBSPL (THD = 10%)

比特率

最小 24 位

采样率

最小 16 kHz*

频率响应

± 3 dB,200-8000 Hz 浮动掩码*

可靠性

存储温度范围:-40°C 到 70°C

工作温度范围:-20°C 到 55°C

*对于优质通信 (VoIP) 应用程序,可能需要更高的采样率或“更宽”的频率范围

必须搭配良好的电声集成选择适当的组件,以免降低所用组件的性能。 独特的用例还可能需要满足额外的要求(例如工作温度范围)。

麦克风阵列集成

集成到设备后,麦克风阵列的性能将与组件规格不同。 必须确保在集成后适当匹配麦克风。 因此,在经过任何固定增益或均衡 (EQ) 之后测量的设备性能应符合以下建议:

参数

建议

信噪比

> 63 dB(1 kHz 信号,94 dBSPL,A 加权噪声)

输出灵敏度

-26 dBFS/Pa @ 1 kHz(建议)

振幅匹配

± 2 dB,200-8000 Hz

总谐波失真率*

≤ 1%,200-8000 Hz,94 dBSPL,5 阶

频率响应

± 6 dB,200-8000 Hz 浮动掩码**

**需要使用一个低失真扬声器(例如 Neumann KH120)来测量总谐波失真

**对于优质通信 (VoIP) 应用程序,可能需要“更宽”的频率范围

扬声器集成建议

由于包含扬声器的语音识别设备需要回声消除,因此我们在扬声器选择和集成方面提供了附加的建议。

参数

建议

线性注意事项

在扬声器参考信号后面不要进行非线性处理,否则需要基于硬件的环回参考流

扬声器环回

通过 WASAPI、专用 API、自定义 ALSA 插件 (Linux) 提供,或通过固件通道提供

总谐波失真率

1/3 倍频程,最低 5 阶,70 dBA 播放 @ 0.8 m ≤ 6.3%,315-500 Hz ≤ 5%,630-5000 Hz

麦克风回声耦合

> -10 dB TCLw,使用 ITU-T G.122 Annex B.4 方法,规范化为麦克风水平

TCLw = TCLwmeasured + (测量水平 - 目标输出灵敏度)

TCLw = TCLwmeasured + (测量水平 - (-26))

集成设计体系结构

将麦克风集成到设备时,需要遵守以下体系结构方面的准则:

参数

建议

麦克风端口相似性

阵列中的所有麦克风端口具有相同的长度

麦克风端口尺寸

端口大小:Ø0.8-1.0 毫米 端口长度/端口直径:< 2

麦克风密封性

在堆栈中使用统一的密封垫片。 建议对泡沫垫片实施 > 70% 的压缩率

麦克风可靠性

应使用滤网来阻挡灰尘和入口污物(安装在端口位于底部的麦克风的 PCB 与密封垫片/顶盖之间)

麦克风隔离

在结构中安装橡胶垫片和振动解耦装置,专门用于隔离集成扬声器后出现的任何振动路径

采样时钟

设备音频不可出现低偏差的抖动和断续

录制功能

设备必须能够同时录制单个原声道流

USB

所有 USB 音频输入设备必须根据 USB 音频设备修订版 3 规范设置描述符

麦克风几何结构

驱动程序必须正确实现麦克风阵列几何描述符

可发现性

设备中不能包含任何不可发现或不可控的硬件、固件或第三方基于软件的非线性音频处理算法

捕获格式

捕获格式必须使用最小 16 kHz 采样率和建议的 24 位深度

电力体系结构注意事项

在适用的情况下,阵列可以连接到 USB 主机(例如,运行 Microsoft 音频堆栈的 SoC),并可与语音服务或其他应用程序对接。

硬件组件(例如 PDM-TDM 转换组件)应确保在再采样器中保留麦克风的动态范围和信噪比。

高速 USB 音频类 2.0 应在任何音频 MCU 中受支持,以便在使用较高采样率和位深度时,为最多 7 个声道提供所需的带宽。

后续步骤

android usb麦克风阵列,语音设备 SDK 麦克风阵列建议相关推荐

  1. Android USB的AOA协议设备端(主机模式,配件模式),ADB连接

    USB的ADB/AOA协议(一种是ADB模式,一种是AOA模式).AOA协议是Google公司推出的用于实现Android设备与外围设备之间USB通信的协议. ADK中与USB配件模式相关的两个类是U ...

  2. OTG – Android USB Hos

    OTG在Android3.1及以上被支持.也就是minSdkVersion为12. API概述 UsbManager 允许您枚举已连接的USB设备并且与其进行"交流". UsbDe ...

  3. 微信语音技术原理_智能语音技术中麦克风阵列的原理

    麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列.也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统. 早在20世纪70.80年代 ...

  4. 音视频开发(37)---麦克风阵列语音增强(二)

    麦克风阵列语音增强(二) 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/zhanglu_wind/article/details/81217093 ...

  5. 音视频开发(35)---麦克风阵列语音增强

    1. 引言   对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列的语音增强算法(也称为,多通道的语音增强算法).麦克风阵列的语音增强方法的优势在于考虑了声源的位置信息,可 ...

  6. android实现从耳机和自带麦克风,android插上耳机的时候仍然使用机身的麦克风录音,解决!...

    我愿望正在插上耳机的时间,依然应用机身的麦克风接收中界输进,耳机播放音频取机身麦克风接收中音互没有滋扰. 然则:正在采纳灌音音源MediaRecorder.AudioSource.MIC时,插上耳机以 ...

  7. Android语音直播SDK

    本文讲述如何在Android环境下集成即构语音直播SDK,实现同一房间内的成员进行语音直播,有需要时也可进行实时语音通话. 请从 ZegoAudioRoom iOS 下载 SDK.如果要实现播放本地音 ...

  8. Windows,Android设备刷机(重装系统)时遇到USB读取不到设备信息(设备驱动异常)问题及解决办法

    Windows,Android设备刷机(重装系统)时遇到USB读取不到设备信息(设备驱动异常)问题及解决办法 前言 当刷Android系统时,我们要进入boot模式,**adb reboot boot ...

  9. Android+usb+spi,Android设备如何使用USB的硬件接口

    你知道Android设备如何使用USB的硬件接口吗?下面将由学习啦小编带大家来解答这个疑问吧,希望对大家有所收获! 如何处理硬件接口问题 最近业界的发展显示,智能手机/便携系统与自动化系统或机械系统之 ...

最新文章

  1. matlab最小分类错误全局二值化算法
  2. 详解基于busybox、dropbear、ngnix制作完整的嵌入式Linux系统
  3. CSS 关于雪碧图预处理和后处理方案的讨论
  4. Android之moveTaskToBack()方法实现手动隐藏当前Activity
  5. 记录一个JS异常Uncaught NotFoundError
  6. PHP学习笔记【9】_表达式
  7. 单片机从00到99c语言,跪求单片机0~99数码管显示用C语言编写的程序
  8. mysql 创建聚集索引_索引为什么会加快Mysql的查询速度?
  9. 教你如何用Python自动下载抖音好看小姐姐,有对象的同学小心尝试!
  10. Ubuntu java 环境变量
  11. 2021财经直播系统 H5网页直播 大区直播间源码
  12. 异步电动机的matlab建模与仿真,异步电动机的matlab建模与仿真
  13. thinkpadt410接口介绍_Thinkpad-T410 T410S笔记本左右接口以及硬件设备详细介绍!
  14. PX4中四元数更新(毕卡求解法与一阶龙格库塔)
  15. wps中设置公式编辑器字体颜色
  16. Centos7 搭建 Svn+ReviewBoard
  17. supervisor+cesi多服务器进程集中管理
  18. h5 vr效果_浅谈html5在vr中的应用
  19. 怎样利用DOI快速检索文献?
  20. keras的数字图像识别

热门文章

  1. 定时脚本任务列子(crontab)
  2. 股票数据转换和数据提取软件。
  3. 大数据分析案例-基于决策树算法构建金融反欺诈分类模型
  4. android局部布局刷新,Android RecyclerView 局部刷新分析
  5. LVS部署准备工作-DRBD的部署
  6. 【QT】Qtcreator常用快捷键
  7. 【正则化;岭回归、lasso回归】(转载)
  8. 头铁!我就硬钢算法岗!
  9. 金融直播APP方案开发
  10. 通过socks 代理 攻击局域网的电脑