简介: 对于语音信号处理来说,输入音频数据的质量很重要。而mic作为声音的采集设备,会直接影响采集到声音的质量。虽然mic选型是硬件或者声学方面的工作重点,但是对于从事语音信号处理相关人员来说,理解mic规格书中的一些技术指标也是大有裨益的。本文结合国家标准对mic规格书中的一些指标进行说明

从语音信号处理角度解读mic规格书

1 背景介绍

对于语音信号处理来说,输入音频数据的质量很重要。而mic作为声音的采集设备,会直接影响采集到声音的质量。虽然mic选型是硬件或者声学方面的工作重点,但是对于从事语音信号处理相关人员来说,理解mic规格书中的一些技术指标也是大有裨益的。本文结合国家标准对mic规格书中的一些指标进行说明。

2 参数解读

根据mic的制作工艺可以分为驻极体mic,MEMS mic等;根据mic的输出信号可以分为模拟mic和数字mic。总之,从多种角度看,mic存在差异,导致mic的规格书中的参数和指标也不尽相同。本文会结合图2.1^[1]^所示规格书截图进行说明。

如图2.1所示,规格书中给出了测试条件及指标,其中和语音信号处理相关的指标包括:灵敏度(Sensitivity),信噪比(S/N Ratio),频响曲线(Frequency),最大声压级和总谐波失真(Max Input Sound Pressure Level)。

2.1 灵敏度

灵敏度是模拟输出电压(模拟mic)或数字输出值(数字mic)与输入声压之比,对任何麦克风来说都是一项关键指标。mic灵敏度一般在94 dB的声压级(1Pa有效声压对应的声压级)下,用1 kHz正弦波进行测量。mic在该输入激励下的模拟或数字输出信号幅度即是mic灵敏度^[2]^。

图2.1中的标准灵敏度为 -41dBV,对应的是模拟mic,模拟mic灵敏度的计算公式为

式(1)中Ref为1000 mV/Pa (1 V/Pa)。根据式(1)可知,-41dBV对应的灵敏度约为8.9mv/Pa,即经过该mic后,1Pa的声压会产生8.9mv的电压。有了该信息和前置放大器的增益,则可将mic经过前置放大的输出电平匹配至后续电路系统,进而作为ADC的输入。假设前置放大的增益是4倍,ADC后输出的数字信号满量程(0 dBFs)对应的电压是1V,那么该mic的灵敏度对应的数字信号的幅值约为 -29dBFs,计算公式为

因为语音信号处理希望数字信号的有效bit位尽可能多,即dBFs的值尽可能大。有了灵敏度的信息,可以选择合适前置放大增益,和ADC的转换比例来实现该目的。至于mic输入声压的范围下一小节会讨论。

这里顺便提及一下数字mic的灵敏度。数字mic的灵敏度只取决于一个设计参数,即最大声学输入。只要将满量程数字映射到mic的最大声学输入,则灵敏度一定是该最大声学信号与94 dB SPL参考信号之差。因此,如果数字mic的最大声学输入为120 dB,则该mic的灵敏度为 -26 dBFs(94 dB - 120 dB)。

2.2 信噪比和最大声压级

最大声压级就是mic能承受的最大输入声压对应的声压级,图2.1中为104dB SPL。这个就是mic正常工作时,输入的声压上限。而mic的输入声压下限可由信噪比这个参数得到。

信噪比指的是mic的灵敏度和固有噪声的比值,计算公式为

其中Vn为mic固有噪声引起的输出电压(V),Sensitivity为mic灵敏度(V/Pa)。国标^[2]^中描述固有噪声的指标为“固有噪声引起的等效声压级”,即无外声场时,仅由mic固有噪声引起的输出电压,可以看作能产生相同有效值输出电压所对应的外部声压级。等效噪声级的计算公式为

其中SPLn为等效噪声级,Pref为参考声压2*10^-5 Pa。根据公式(3)和(4)可以推导出固有噪声引起的等效声压级与信噪比的关系为

图2.1中的信噪比为55dB,则固有噪声引起的等效声压级为39dB SPL。那么该mic的输入声压下限就是39dB SPL。综上可知该mic正常工作时,输入声压范围为39dB ~ 104dB SPL。

2.3 频响曲线和总谐波失真

频响曲线和总谐波失真都是描述mic输出电压幅度和输入声音频率之间关系的指标。

频响曲线描述的是mic的频率响应与给定用途的“理想”响应偏差不超过规定值所覆盖的频率范围^[2]^。图2.1给出的频率范围为50 ~ 16K Hz。规格书中的一种频率响应的曲线如图2.2^[1]^所示。从语音信号处理角度来看,希望频响曲线越平坦越好,平坦的频率范围越宽越好。

总谐波失真(THD)是描述mic幅度非线性的一个指标。“声系统和声系统设备中,幅度非线性会在输出端产生输入信号中不存在的信号。幅度非线性是频率,幅度和温度等因素的函数,甚至在信号幅度恒定时也是如此,因此它不是常量,有多种评价幅度非线性的方法^[3]^”。总谐波失真就是其中的一种方法。总谐波失真计算如图2.3^[3]^所示。

从语音信号处理的角度,希望总谐波失真越小越好。

3 小结

本文从语音信号处理的角度,结合国家标准对mic规格书中的一些指标进行说明,希望能够为从事语音信号处理相关人员提供一个角度,来理解mic的硬件指标。因为个人能力有限,不能就规格书中的所有参数进行说明。对其他参数指标感兴趣的读者,可以使用“规格书 + 国标”的方法来进行解读。

转载:

https://developer.aliyun.com/article/740350

从语音信号处理角度解读mic规格书相关推荐

  1. 语音信号处理_书单 | 语音研究进阶指南

    作为人类最自然的交流方式,"听"和"说"包括了人类大脑皮层从听觉感知到语言处理和理解,再到声音生成这个"神奇"的认知过程.语音领域的探索和研 ...

  2. 数字语音信号处理学习笔记——绪论(2)

    版权声明:本文为博主原创文章,未经博主允许不得转载.    https://blog.csdn.net/u013538664/article/details/25060123 1.2.2 语音编码 语 ...

  3. 微信语音麦克风静音_智能语音专题(二):语音信号处理

    <智能语音>专题第二章:语音信号处理.此篇文章不会讲解傅里叶.模数.数模变化之类的技术性原理,重点在于讲解语音的场景.语音信号处理要做的事情,相关的技术手段,能够解决的问题等等.语音信号处 ...

  4. 语音信号处理基础(二)

    语音信号处理基础(二) 1.2.2 语音编码 语音编码的目的 保证在一定语音质量的前提下,尽可能降低编码比特率,以节省频率资源. 语音编码技术的鼻祖:研究开始于1939年军事保密通信的需要,贝尔电话实 ...

  5. 语音专题第一讲,麦克风阵列的语音信号处理技术

    转载自地平线机器人大讲堂,主讲人徐荣强. 2011年11月毕业于英国爱丁堡大学通信与信号处理专业,曾任诺基亚,联想,微软高级音频工程师.现在Horizon-Robotics负责语音相关硬件系统设计,涉 ...

  6. 浅谈语音信号处理系列之二 语音信号处理的基础

    下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献. 一 语音信号的产生 一般来说,声音是通过振动产生的.同样,语音是肺里面的空气形成气流通过声道,再从口 鼻辐射而产生的.语音 ...

  7. 大牛讲堂 | 语音专题第一讲,麦克风阵列的语音信号处理技术

    雷锋网按:徐荣强(Kevin),地平线硬件音频工程师.2011年11月毕业于英国爱丁堡大学通信与信号处理专业,曾任诺基亚,联想,微软高级音频工程师.现在Horizon-Robotics负责语音相关硬件 ...

  8. 嵌入式语音信号处理入门篇

    刚接触语音信号处理,是从下面这几个概念开始的,这几个概念明白了,基本上也就明白原始的语音信号是什么,也就是知道我们要处理啥样的信号了. 等这篇文章的内容明白后,就可以开始进入正题. PCM和WAV P ...

  9. 学习笔记:《数字媒体技术概论》-4/10 数字语音信号处理技术及应用-中国大学慕课公开课

    目录 4-数字语音信号处理技术及应用 4.1-数字语音的基本概念 4.2-数字语音技术主要研究方向 4.3-语音识别 4.4-声纹识别与语音合成 声纹识别 4-数字语音信号处理技术及应用 4.1-数字 ...

最新文章

  1. 全球与中国聚硫聚合物市场发展前景与投资可行性分析报告2021年版
  2. redis连接被拒绝
  3. 教你CentOS7部署TOMCAT8
  4. shell 截取文件名及扩展名
  5. ViBe算法核心思想
  6. 计算机无法链接打印机共享,在打印机共享中无法链接打印机错误
  7. 计算机硬件故障视频,电脑提示“没有视频硬件”怎么办
  8. VR驾驶模拟器:以科技赋能加速推动驾培行业转型升级
  9. python下载小说
  10. 51nod1359 循环探求
  11. Phoenix错误信息: Malformed connection url
  12. 【Xubuntu】多种方法设置xubuntu-18.04开机启动
  13. 未来职业世界的三种人
  14. IT男的神级吐槽 || 我们IT人的心声(_)
  15. iota 的 优点与吐槽
  16. 干货分享!华为模拟器Web配置防火墙
  17. 程序员工资倒挂,IT行业薪资潜规则如何规避?
  18. GDAL添加ECW格式支持
  19. 快速提升自身思维能力的方法总结
  20. 好书整理(to be continued)

热门文章

  1. 高清壁纸wallhaven.cc下载图片
  2. 【LeetCode 1833】雪糕的最大数量
  3. H264学习笔记(1):视频压缩编码的基本原理
  4. 计算机历史博物馆观后感:阿达·洛芙莱斯生平1
  5. hfs explorer java_HFSExplorer0.23.1下载_HFS格式磁盘文件查看工具 含使用教程
  6. Scoop包管理工具
  7. 15款Java程序员必备的开发工具(转)
  8. python中strip的用法
  9. python挖矿木马_记一次阿里云被植入挖矿木马的事件
  10. 关于NIST随机数测试软件报错问题的补充