远场语音交互硬件声学性能测试标准

文档版本 V1.8

修改日期2019.11.26

谙声科技声学实验室

文档修改记录

版本

修改日期

修改人

批准人

批准日期

描述

V1.0

2018.10.12

V1.1

2018.10.29

修改测试顺序,MIC判定

V1.2

2018.11.09

增加术语定义

V1.3

2018.12.29

更新测试程序

V1.4

2019.03.05

底噪更新为信噪比

V1.7

2019.06.19

增加信噪比判定标准

V1.8

2019.06.26

更新信噪比判定标准

目录

一、术语定义

二、测试内容

三、测试设备要求

四、测试环境要求

五、测试项目

5.1 MIC密封性

5.2 时延一致性

5.3 回声消除

5.4 MIC相干一致性

5.5 声源定位同步性

5.6 信噪比

5.7 回采预处理(参考)

5.8 通道频响一致性(参考)

5.9 总谐波失真(参考)

一、术语定义

下列术语和定义适用于本标准。

1)声压(sound pressure)

p

瞬时压强与静压强之差。单位为帕斯卡(Pa)。

2)声压级(sound pressure level)

Lp

声压平方与基准声压平方之比,取以10为底的对数的10倍,用分贝(dB)表示。

(1.1)

式中,p0为基准值,p0=20uPa。

3) MIC(Microphone

指麦克风,学名为传声器,用拾取和传送声音,可以将声音信号转换为电信号。

本标准中的MIC如无特别注释,一般指待测设备中MIC阵列中的MIC。

4)灵敏度(Sensitivity)

单通道的输出电压与无干扰时校准位置处声压的比值为灵敏度。

5)频率响应(Frequency Response)

单通道灵敏度级随频率的变化关系曲线为频率响应,标识为FR,单位为dB。

灵敏度以10为底的对数乘以20为灵敏度级(Sensitivity Level),标识为S,单位dB。

(1.2)

式中,V指采集信号输出电压有效值,P指校准位置处声压有效值。

6) MIC同步性

MIC同步性又称MIC一致性,指各个MIC通道间接收到同一信号的时间差的稳定性。

7)时延(Delay)

任意两个通道间接收到同一信号的时间差,单位为采样点数。

8)参考通道时延稳定性

参考通道信号和MIC通道信号的时延差随时间变化保持稳定的能力。

9)总谐波失真(Total Harmonic Distortion)

输出电信号中谐波余量的有效值与谐波和基频的总的比值为总谐波失真,缩写为THD。

(1.3)

式中,Unf指n 次谐波分量电压,Ut指基频总电压。

10)截幅(Clipping)

因信号波形的幅度太大,而超出系统的线性范围的现象。

11)回声消除(Acoustic Echo Cancellation

待测设备在播放声音时,通过声学回路又被自身麦克风采集到的信号,在接收信号中减去该信号称为回声消除,简称AEC。

、测试内容

远场语音交互硬件声学测试包括:AEC性能、时延、噪声级、相干性、谐波失真以及一致性。其中,时延、AEC性能、噪声级为强制指标,其它为参考指标,不作为评判硬件通过的标准,只用来帮助定位硬件问题点。

本标准所提测试项原则上均基于整机设备。

、测试设备要求

1)测试中需要的设备如表1所示

表1 测试设备

序号

名称

型号

用途

1

音频分析仪

ANST 8192D

信号采集/分析

2

标准MIC

ANST AN-M320

校准环境/接收信号

3

人工嘴

ANST M210

音频信号播放

4

测试软件

ANST.Audio SYS

信号处理

5

功放电源一体机

ANST AN-633A

MIC/人工嘴信号放大/供电

备注:该设备配置为最低配置标准,若客户需复现测试场景,测试设备要求需不低于该配置要求。

2)测试声卡要求:

采样率范围:16kHz/44.1kHz/48kHz;

采样深度:16bit/32bit/64bit;

模数转换失真≤0.001%;

模数转换动态范围≥113dBA;

3)标准MIC要求:

灵敏度≥-30dBV;

频率响应:20Hz~20kHz;

4)标准音箱要求:

灵敏度≥96dB;

频响在100Hz~8000Hz平直(容差小于2.5dB);

100Hz~500Hz谐波失真小于5%,500Hz谐波失真小于3%;

5)声级计要求:

符合标准IEC61672-1:2013;

准确度等级1级;

线性范围:20dBA~134dBA;

采样率:48kHz;

6)测试软件要求:

硬件测试软件使用《ANST远场语音交互硬件测试软件V2.0》;

、测试环境要求

1)一般在标准大气条件下测量:环境温度24±2℃,相对湿度15%~65%,气压86kpa~106kpa;

2)背景噪声≤35dBA;

3)房间混响(100Hz~8kHz)≤500ms;

4)待测设备放置到房间中间的支架上,建议扬声器离待测麦克风的距离为1m,扬声器中心距地面1.2m。待测设备麦克风阵列的中心位置与扬声器发音中心位置在一条水平线上,即声波的入射方向与参考轴方向夹角为90°。设备测试示意图如图1。

图1. 测试环境示意图

、测试项目

硬件测试项目包括密封性、时延一致性、回声消除特性、本底噪声级、通道相干性、MIC信号同步性、回采预处理特性、通道频响一致性以及总谐波失真特性。

5.1MIC密封性

定义:

MIC密封性,指待测设备MIC孔处通过物理密封隔绝外界噪声的能力,通常以物理密封MIC前后录到的音频时段的平均振幅差表征,单位为dB。

测试目的:

MIC密封性会影响MIC接收声信号的传播路径,MIC密封不好会影响声源定位。

测试方法:

标准音箱距离待测设备0.5米,使用标准音箱播放播放白噪声,待测设备MIC阵列处声压级80dB,使用待测设备的MIC阵列接收信号。使用黑胶堵住某一MIC孔保持10s,然后逆时针顺序到下一个MIC,依次堵完后,待测设备采集到的音频使用音频软件查看各MIC物理密封前后的平均振幅,求差得到各MIC的密封性数值。

判定:

Ⅰ级标准:各MIC的密封性数值均在20dB以上为合格。合格结果如下表所示。

Ⅱ级标准:各MIC的密封性数值均在15dB以上为合格。

表2. MIC密封性

1#MIC

2#MIC

3#MIC

4#MIC

5#MIC

6#MIC

密封性

20dB

20dB

20dB

20dB

20dB

20dB

5.2时延一致性

定义:

时延,指参考信号和MIC通道的时延差。时延稳定性即参考信号和MIC通道的时延差随时间变化保持稳定的能力。

测试目的:

判断MIC信号和参考信号之间测得信号的时间差是否随时间发生波动。

测试方法:

使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的delay_calc模块计算,得到MIC信号和参考信号的时延随时间变化的结果图。

判定:

Ⅰ级标准:chirp count的纵坐标单位为1/16000s,判定标准为chirp count的20个点稳定在同一个值,且该值范围在(0~512),且上下间波动最大不超过1个点认为合格。时延稳定合格如图2示例。

Ⅱ级标准: chirp count的20个点稳定在同一个值,且该值范围在(0~1000),且上下间波动最大不超过1个点认为合格。

图2.时延稳定性测试结果

5.3回声消除

定义:

回声消除定义:待测设备在播放声音时,通过声学回路又被自身麦克风采集到的信号,在接收信号中减去该信号称为回声消除(Acoustic Echo Cancellation),标识为AEC。

ERLE定义:回声返回损耗增益值(Echo Return Loss Enhancement)简称 ERLE,反映的是原回声信号与剩余回声残差的比值,单位为dB。

测试目的:

测试MIC阵列消除自身设备扬声器输出信号的能力。

测试方法:

在待测设备100%音量和50%音量下,使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的aec_calc模块计算,得到AEC性能图。

判定标准:

Ⅰ级标准:要求100%音量下所有MIC的ERLE数值大于23dB,50%音量下所有MIC的ERLE数值大于20dB为合格。合格结果如图3示例。

Ⅱ级标准:要求100%音量下所有MIC的ERLE数值大于18dB,50%音量下所有MIC的ERLE数值大于16dB。

图3. 100%音量下ERLE性能测试结果

图4. 信噪比测试结果

5.4MIC相干一致性

定义:

衡量两个变量之间的相关程度叫做相干性(Coherence)。在该项测试中,相干性衡量的是各MIC通道和REF通道之间的相关程度。

测试目的:

测试MIC信号和REF信号之间的相关程度,相关程度越小,说明MIC信号失真越大,噪音越多,AEC越差。

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的coherence_calc模块计算,得到不同音量下各MIC通道相对REF通道的相干性曲线。

判定:

Ⅰ级标准:200Hz~1000Hz范围内相干性值大于0.3,且各MIC通道间同频率值对应的的相干性差值不大于0.1。相干性测试合格结果如图5示例。

Ⅱ级标准:200Hz~1000Hz范围内各MIC通道间同频率值对应的的相干性差值不大于0.6。

图5. 100%音量下相干性测试结果

5.5声源定位同步性

定义:

声源定位同步性本质即MIC信号间的同步性,指各MIC之间接收信号的时间差随时间变化的稳定性。

测试目的:

测试MIC阵列不同MIC之间接收同一信号的时间差是否稳定。

测试方法:

声源距离待测设备距离1m,线阵MIC和声源的角度需测0°和45°两个角度,环阵需测两个角度,两个角度间隔90°。使用标准音箱播放“chirp+60s白噪”信号(文件名《同步_频响测试音频.wav》),使用待测设备的MIC阵列接收信号,录到的音频使用《ANST远场语音交互硬件测试软件V1.0》step1分析,得到MIC同步性结果图。

判定:

Ⅰ级标准:环型MIC阵列的定位声源角度(Angle)随时间波动≤±5°,测得两个角度的角度差90°±15°,合格结果如图2示例;线型MIC阵列定位声源角度(Angle)随时间波动≤±5°,测试声源角度和实际声源摆放角度差值小于10°。

Ⅱ级标准:环型MIC阵列的定位声源角度(Angle)随时间波动≤±10°,测得两个角度的角度差90°±20°;线型MIC阵列定位声源角度(Angle)随时间波动≤±10°,测试声源角度和实际声源摆放角度差值小于15°。

图6. 环型MIC阵列同步性测试结果

5.6信噪比

定义:

音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率称为信号噪声比(signal-noise ratio),标识为SNR,单位为dB。

测试目的:

设备的信噪比越高表明它产生的噪声越少。信噪比越大,信号对算法的影响越小。

测试方法:

使用高保真音箱播放“ANST测试音频.wav”,距离待测设备1米距离,待测设备MIC处声压级94dBA。MIC阵列平面与高保真音箱喇叭平面平行,使每个mic到喇叭的距离相等。使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的SNR_calc模块计算,得到MIC通道和REF通道的信噪比性能图。

判定:

Ⅰ级标准:各MIC通道信噪比均大于50dB,MIC灵敏度大于-25dBFS。合格结果如图7示例。

Ⅱ级标准:各MIC通道信噪比均大于35dB,MIC灵敏度大于-32dBFS。

图7. 信噪比测试结果

图8. 底噪和灵敏度测试结果

5.7回采预处理(参考)

定义:

传递函数是指零初始条件下线性系统响应(即输出)量的拉普拉斯变换(或z变换)与激励(即输入)量的拉普拉斯变换之比。记作G(s)=Y(s)/U(s),其中Y(s)、U(s)分别为输出量和输入量的拉普拉斯变换。理论上,传递函数是由系统的本质特性确定的,与输入量无关。

测试目的:

测试音频信号是否经过DRC(动态范围压缩)处理。

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的传递函数曲线。

判定:

回采预处理特性为参考指标,仅用于帮助定位问题点。整机谐波失真测试如图5示例,上图为回采通道传递函数曲线,下图为MIC通道传递函数曲线。上图表示回采通道存在自动增益控制(AGC),会影响回声消除,需关闭该功能。

图6. 回采预处理测试结果

5.8通道频响一致性(参考)

定义:

待测设备任意MIC通道间的频率响应及谐波失真的相关程度为MIC通道一致性(MIC Consistency),标识为Consistency。在该项测试中,MIC通道一致性可以用频率响应曲线和谐波失真曲线两个指标来表征。

测试目的:

判断MIC阵列中任意MIC间的频率响应是否一致,该项会影响声源定位。

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的一致性结果。

判定:

MIC通道一致性为参考指标,仅用于帮助定位问题点。MIC通道一致性测试如图6示例,上图为频率响应一致性,下图为谐波失真一致性。

图6. MIC通道一致性测试结果

5.9总谐波失真(参考)

定义:

输出电信号中谐波余量的有效值与谐波和基频的总的比值,为总谐波失真(Total Harmonic Distortion),标识为THD。在该项测试中,整机谐波失真分为MIC通道谐波失真和REF通道谐波失真。

测试目的:

谐波失真会影响AEC性能,失真越大,AEC性能越差。

测试方法:

分别在100%音量和50%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的谐波失真曲线。

判定:

整机谐波失真为参考指标,仅用于帮助定位问题点。理论上,谐波失真越小越好。整机谐波失真测试如图5示例,上图为REF通道谐波失真,下图为MIC通道谐波失真。

图6. 整机谐波失真测试结果

叶金生

Mobile:13823318060

E-mail:js.ye@audio-s.com

Company:深圳市谙声科技有限公司

Address:深圳市龙华区观澜桂月路302号新桂园工业园A3栋

 ANST   HTTP://www.audio-s.com

远场语音交互硬件声学性能测试标准相关推荐

  1. 超全面的语音交互知识总结:从原理、场景到趋势

    1. 什么是语音交互? 语音交互(VUI)指的是人类与设备通过自然语音进行信息的传递.一次完整的语音交互需要经历ASR→NLP→Skill→TTS的流程: (1)ASR 用于将声学语音进行分析,并得到 ...

  2. 问答:从智能音箱看待语音交互和人工智能(1)

    1.在智能语音领域,为什么是亚马逊脱颖而出? 1)没有技术包袱,更注重产品和技术相结合,把握远场语音交互的痛点,其他巨头几乎没有技术优势: 2)对产品细节的打磨和对技术的耐心程度超过其他巨头: 3)站 ...

  3. 声智科技完成2亿元B轮融资,将持续拓展语音交互产品的规模化落地

    整理 | 一一 出品 | AI科技大本营 寒冬之下,不少创业公司依然得到了资本青睐. AI科技大本营消息,12 月 29 日消息,声智科技(SoundAI)已于近期完成 2 亿人民币 B 轮融资,本轮 ...

  4. 语音交互有哪些优势与劣势?

    转载自公众号[谈人工智能],转载请联系授权 语音交互是指人与人.人与设备之间,通过自然语音进行信息传递的过程.人与人之间通过语音来传递信息.交流感情等等,其实就是一种最基本的人与人之间的语音交互. 为 ...

  5. 科大讯飞股价暴跌趋势不明,语音交互产业风险巨大吗?

    一直以来,科大讯飞(002230)被称为"人工智能第一股".5月份开始,股价涨势迅猛,市值近千亿.然而,在8月27日讯飞的股价却开始了毫无征兆的闪崩跳水,8月27日-28日两个交易 ...

  6. 聚焦语音交互,引爆智能硬件——暨讯飞语音云沙龙杭州站成功举办

    5月16日,"让世界聆听我们的声音"--2014年语音云开发者沙龙暨"聚焦语音交互引爆智能硬件"在杭州贝塔咖啡成功举办. 自2013年8月以来,由讯飞语音云举办 ...

  7. 智能硬件语音交互流程分析

    "智能音箱"技术详解 如今智能语音控制特别火热,智能音箱.汽车.手机-- 君子动口不动手,下面讲讲如何实现"动口不动手"? 语音控制的流程 声音采集->降 ...

  8. CSK6语音交互最小硬件系统电路设计

    文章目录 CSK6系列芯片区别 设计区别 Pin-map差异点 最小系统电路设计 CSK6最小系统设计 CSK6内部电源树结构 电路设计-供电部分 电路设计-低功耗设计 电路设计-硬件复位 电路设计- ...

  9. 聊一聊麦克风阵列技术:语音交互应该选用怎样的方案?(转载)

    转自:http://news.soundai.com/?id=7 雷锋网(公众号:雷锋网)按:本文作者陈孝良,工学博士,声智科技创始人.雷锋网独家文章. 亚马逊Echo和谷歌Home争奇斗艳,除了云端 ...

最新文章

  1. React Native小白入门学习路径——五
  2. 生成全1矩阵_全矩阵捕获技术:一种最大限度提升便携式相控阵超声检测设备功能的新技术...
  3. python3 获取当前目录和上级目录
  4. CICS FILE OPEN
  5. python输入语句-python输入语句
  6. 【Android 内存优化】Android 原生 API 图片压缩原理 ( 图片质量压缩方法 | 查找 Java 源码中的 native 方法对应的 C++ 源码 )
  7. 单片机c语言程序设计实训报告,(整理)单片机C语言程序设计实训100例.doc
  8. 关于leetcode第K个最大元素的几种解法
  9. javascript定时器及Date对象
  10. Spring 系列,第 3 部分: 进入 Spring MVC
  11. 如何在hadoop中控制map的个数
  12. JAVA企业级应用TOMCAT实战视频课程
  13. 【渝粤教育】国家开放大学2018年春季 0674-22T财务管理 参考试题
  14. docker-compose安装rabbitmq
  15. 学硕、全日制停招!研究生重大变革,来了
  16. 设计模式速查手册-创建型
  17. 【3】测试用例设计-因果图
  18. 力扣-409 最长回文串
  19. mongo的‘模糊匹配’
  20. Maxwell 是什么?

热门文章

  1. 软件之聊天工具:QQ,MSN,Google talk,Skype, Lync
  2. 解决项目上的红叉和红色感叹号的方法。
  3. 二进制中截断及浮点数储存规则
  4. 计算机网络-快速搞懂HTTP和HTTPS
  5. 计算机公共课1-信息技术与计算机文化
  6. 利用C++逆向知识写CS辅助,轻松实现透视原理!
  7. 易中天品汉代风云人物07:韩信功过之谜
  8. @Transactional和try...catch一起使用、嵌套使用
  9. 复旦计算机考研英语,我收集的近几年复旦计算机复试笔试题
  10. 修复IE不能正常上网的工具