一、概述

当将语音识别算法接入到设备时,务必要保证设备的音频通路具有足够的质量。因此对设备进行音频测试,以评估能够影响语音识别性能的音频前端的音频参数。如下要点对语音识别至关重要:

  • 自然声音
  • 合适的增益
  • 良好的信噪比
  • 一致的响应,信号不能包括如下信息: 自动增益控制 AGC  启动响应  直流偏置过大
  • 适当的频响 (高低滚降,理想平滑,没有混跌)

二、测试设备

  • 带有录音软件的被测试设备
  • 音频测试仪器:CD机,均衡器,音箱,人工嘴和声压计
  • 带分析工具的PC机(CoolEditor、Audition、Audacity和Wavesurfer等)

三、音频文件

  • 正常音频文件:用于主观判断音频质量和增益设置以及信噪比;
  • 大增益文件:用于判定削波时的增益设置;
  • 1K-sine增益Sweep文件0~105dB:用于评估削波,决定最大数值和判定AGC存在与否;
  • 0~8K/16K扫频文件:用于测试设备的频响和混跌;

四、测试项目

1. 主观听音

用质量好的耳机去听设备的音质,从而发现一些非正常声音;比如:杂音、谐波和共振等;

音频路径上过多的信号处理可能导致声音畸变为人造声,不符合正常自然声音,会对软件识别造成很大困难。

2. 增益评估

设备在各种使用场景下,务必保持增益的设置不要使信号削波;削波会严重降低识别性能,必须禁止。

95dB的声音应该刚好填满16bit音程;

3. 信噪比

静默值作为底噪,声音波形的中部作为信号;尤其注意某些记录将具有数据实际值为零的引导/拖尾部分,不要使用这部分作为静默测量;麦克风单体的信噪比,除了本身规格书之外,在实际产品中收到电路噪声影响很大,尤其注意模拟麦克风bias电源。

信号比:S/N>30对于识别是良好的比值,大于20也是可行的;如果小于20的话,则说明音频路径上太吵了导致很难识别成功。

4. 自动增益控制AGC

AGC的存在,当音频信号的幅度增大时,它通常表现为增益逐步减小。它会影响识别效果,所以得关闭此功能,类似的有自动电平控制寄存器ALC等。

同时部分功放带有动态调节音量的功能,务必关闭此项功能,否则严重影响AEC效果;所有的动态调节都务必在AEC采样点之前进行,具体如下图示意:

5. 启动瞬态Startup transients

音频系统经常在录音命令下达后,需要一段时间才能真正启动操作,这导致了启动瞬态;如果这主要包括低频的话,将不会对识别造成影响,因为识别器中有低通滤波器。

然而试图消除瞬态的话,将信号钳位在零电平上超过几十毫秒的话,会严重影响识别。在这种情况下,最好完全跳过音频,而不是将此错误信息发送给识别器。

上图中红色框中125ms的启动瞬态,应该跳过。

6. 直流偏置过大DC offset

直流偏置可以看作是静音信号在零信号线上高于或者低于的信号;

如果偏移量为满刻度限制的百分之几或者更少,是没有问题的;

但是如果超过10%则需要纠正,很大的偏移将导致不对称削波。

7. 频响曲线Response curve

为了隔绝麦克分录音到其他杂音,麦克风需要与喇叭足够近,大致2.5cm处录音。

检查FFT大小设置为2048个采样点,采样窗口设置为Blackmann Harris;

理想的频率响应曲线在顶端220Hz和3200~3900Hz之间的几分贝内是平坦的,差值一般控制在10dB以内是可以接受的(16K采样率的为6400Hz~7400Hz)如下图所示:

频响曲线是个慢慢的渐变过程,如果个别区域出现急剧变化,应该重点关注并研究,音频可能存在其他问题。

8. 混叠Aliasing

当超过采样速率的一半(奈奎斯特极限)的信号被允许进入模数转换器(ADC)时,出现混叠现象。如下为ES7210调试初期出现的混叠现象:

混叠是影响识别的一个重大因素,必须消除混叠;

故ADC需要有抗混叠处理,例如抗混叠滤波器等。

9. 谐波失真Harmonic distortion

当录音系统增加输入信号的泛音时,会出现谐波失真;

AEC对信号失真是非常敏感的,音频通路的整体谐波失真需要控制在5%以内,故从麦克风到功放到扬声器和音腔,均需要严格控制;除了单体品质之外,尤其注意功放和扬声器的功率匹配、阻抗匹配和频率匹配;

如下图为1K-sine信号的频谱图,有奇次谐波、偶次谐波:

如下图为8K-sweep信号的频谱图,有奇次谐波、偶次谐波:

谐波失真越小越好,一般要求最好是小于3%。

补充小结项:

1-灵敏度和谐波失真
2-频响和混叠
3-失真和完整性
4-麦阵相关性
5-相对延迟、系统延迟
6-底噪

汇总补充如下:

麦克风信噪比:60~70 分近中远三场景;

麦克风灵敏度:-40(模拟)  -26(数字);

频响平坦度:2dB (100Hz~6KHz);

收音孔气密性:大于20dB;

麦克风一致性:相位小于10,幅度小于2dB;

麦克风间距:25~60mm之间; 间距小影响低频,间距大影响高频;叠加装配的误差率,体验上在常规噪音环境下影响唤醒率和打断率1个点左右;

采样信号幅度:最大幅度下不截幅;

采样信号非线性失真:低频小于10%,300Hz~2KHz小于3%;

采样信号底噪:小于-70dB;

各通道信号同步;采样波形无畸变,无混叠;

参考信号信噪比:大于40dB;

参考信号:无截幅;

智能音箱 之 音频通路质量--测试与参数相关推荐

  1. 软件测试 | 测试开发 | 智能音箱语音交互系统简介与测试初探

    随着AI技术的发展,智能语音交互技术也得到了巨大的发展和应用.由于语音是最自然的交互形态之一,有着输入效率高.门槛低.方便解放双手以及能有效进行情感交流的优势,使得智能音箱成为语音交互的典型应用产品. ...

  2. 智能音箱语音交互系统简介与测试初探

    随着AI技术的发展,智能语音交互技术也得到了巨大的发展和应用.由于语音是最自然的交互形态之一,有着输入效率高.门槛低.方便解放双手以及能有效进行情感交流的优势,使得智能音箱成为语音交互的典型应用产品. ...

  3. 智能音箱中喇叭腔体的参数测量

    最近一直忙碌于喇叭腔体的测试, 只有平衡好 喇叭 / 腔体 / 功放三者之间的关系, 才能保证好的效果. 一款好的音响,喇叭是非常关键的一个零部件,基本上可以说决定了音质的成败,其中最重要的两个因素 ...

  4. RT-Thread智能音箱音频应用实践

    国内智能音箱的问世早于国外,但由于国内对智能化概念普及程度较低,初期智能音箱并没有受到很多关注.但近几年国内智能音箱行业经历了从百花齐放到三足鼎立的发展阶段,来自RT-Thread的黄天翔将从占据主流 ...

  5. 也许是国内最全“智能音箱”评测,教你如何选 AI 音箱?

    本文授权转载自公众号声学在线(微信号:soundonline),作者木京,原标题为<视频 | 国内最全的"智能音箱"评测,教你如何选 AI 音箱?>.声学在线专注于声学 ...

  6. AI智能音箱高性价比出好音质的功放芯片

    近几年人工智能等技术的不断发展,AI智能音箱已成为炙手可热的爆款:众多企业纷纷加入其中:如我们熟知的天猫精灵.小爱同学.小度智能音箱.华为AI音箱.腾讯叮当等等智能音箱:据不完全统计,目前国内做智能音 ...

  7. AI测试|天猫精灵智能音箱测试策略与方法

    一.业务介绍 2014年11月,亚马逊推出了一款全新概念的智能音箱:Echo,这款产品最大的亮点是将智能语音交互技术植入到传统音箱中,从而赋予了音箱人工智能的属性.这个被称为"Alexa&q ...

  8. 智能音箱音频信号质量评价标准

    1. 前言 智能音箱的唤醒率和识别率除了受算法影响外,还跟音箱的音频信号质量直接相关.同样的算法库,音频信号质量越好,其唤醒率和识别率越高.根据工作经验,目前各厂家对智能音箱音频信号的判断标准,主要有 ...

  9. 2018智能音频报告:智能音箱带来的智能音频和广播媒体的机遇

    来源:199IT互联网数据中心 摘要:前中国智能音箱正热,阿里巴巴.京东.百度纷纷发布自己的智能音箱产品,大打价格战,希望以绝对底价抢占市场. 前中国智能音箱正热,阿里巴巴.京东.百度纷纷发布自己的智 ...

最新文章

  1. 王建春计算机应用基础,计算机应用基础(本)教学指南.pdf
  2. 使用 HTML5 时如何改进移动 Web 应用开发
  3. 撩课-Java面试宝典-第十二篇
  4. 移动开发:android , IOS html5
  5. Hbase Java API详解
  6. leetcood学习笔记-226- 翻转二叉树
  7. PAT1130. Infix Expression (25) 中序遍历
  8. 光纤接口怎么接 图解_视频光端机怎么连接,视频光端机接法图解
  9. 动态加载JS过程中如何判断JS加载完成
  10. 如何打开chrome中flash debug player
  11. caffe 实践程序3——caffe提取特征以及由模型test数据
  12. everything-everything使用技巧,过滤文件语法
  13. brctl tunctl 虚拟网卡 桥接
  14. LabVIEW实现模糊PID控制
  15. 数据结构例程——串的模式匹配(Brute-Force算法)
  16. 卡内基梅隆的计算机科学专业,卡内基梅隆大学计算机科学专业
  17. 谈谈创业这点事 专业的盲区
  18. 英文邮件寻求帮助的礼貌用语
  19. python3.0安卓版-python安卓版
  20. vue 使用Dialog对话框使用过程中出现灰色遮罩问题

热门文章

  1. 彻底弄懂响应式设计中的em和rem
  2. [转] 英语、计算机、互联网与全球化
  3. [摘记]数值方法04——函数求值
  4. .NET平台下WEB应用程序的部署(安装数据库和自动配置)
  5. 西门子新款A系列手机【ZZ】
  6. Vue — 第四天(components组件)
  7. OCS (错误代码: 0-1-492)
  8. leetcood学习笔记-111-二叉树的最小深度
  9. signal(SIGHUP, SIG_IGN);
  10. 【PHP】xampp配置多个监听端口和不同的网站目录(转)