目录

引言:

一. 音频主观评价方法

MUSHRA

介绍

特点:

应用MUSHRA例子:

常用的主观评价指标:

二. 音频客观评价方法

有参考评价:

PESQ与POLQA

PESQ的算法步骤:

note:

ViSQOL :https://arxiv.org/pdf/2004.09584.pdf

无参考评价:

适用场景:

比较著名的无参考客观评价方法:

三. 小结:


引言:

音频的评价方法主要两种:

  1. 主观评价

即组织足够数量多人来听被测音频并对样本进行打分,最后依据打分的高低来评价音频质量的好坏。

优点:

主观测试是音频评价的黄金准则,最符合人的实际听感。

缺点

主观评测费时费力,不一定是最经济的方案

  1. 客观测试

通过给定数学公式计算音频质量评价指标,比如SNR、频谱差异等。 结合计算结果拟合一个主观分数。

一. 音频主观评价方法

ITU(国际电信联盟),联合国下属一个专门机构,负责电信、通话等相关标准等制定。   比较有公信力的组织包括ITU-R(无线电通信组)和ITU-T(远程通信标准化组织)。   这两个组织为了统一国际音频质量评价指标,制定了一系列的主、客观评价方法。

MUSHRA

介绍

(Multi-Stimulus Test with Hidden Reference and Anchor,多激励隐藏参考基准测试方法)属于 ITU-R BS.1534 中的推荐测试方法。  它最早被用于流媒体与通信的相关编码的主观评价,现在也被广泛应用于心理声学相关研究中的音质主观评价。

MUSHRA 的分数是 0 到 100 分,按照从高到低的听感描述,如表 1 所示:

为了保证测试的有效性,主要需要注意以下4点:

  1. 参考的标准音频和被测试音频间隔测试,连续重复 4 次; (防止误判)
  2. 音频源采用 15~20s;  (防止测试者产生听音疲劳)
  3. 一次完整的测试时间不应超过 15~20min;(防止测试者产生听音疲劳)
  4. 测试成员:专家成员最少 10 人,非专家 20 人。(使得标准不过于严苛更能符合大众的听音习惯)

特点:

其测试的特点主要是在测试语料中混入无损音源作为参考(上限),全损音源作为锚点(下限),通过双盲听测试,对待测音源和隐藏参考音源与锚点进行主观评分。

MUSHRA 方法的测试面比较广,可以用于编 / 解码器,语音合成,甚至是耳机测评。

应用MUSHRA例子:

REF是无损音频,采样位深8bit记位8bit_lal_REF,  Anchor35是锚点,其他为不同语音合成算法。

常用的主观评价指标:

  1. MUSHRA方法
  2. ITU-T P.800《语音质量的主观评价方法》,也就是我们常说的 MOS(Mean Option Scores,平均意见分)
  3. ITU-T P.830《电话和宽带数字语音编码器的主观评价方法》
  4. ITU-T P.805《对话质量的主观评价》
  5. ITU-R 主观评价标准中的 ITU-R BS.1116 《音频系统中小损伤主观评价方法》
  6. ITU-R BS.1285 《音频系统中小损伤主观评价的预选方法》

ITU官网: 国际电联:致力于连通世界

主观评价缺点:测试者太少、测试者不规范等都会带来测试误差

二. 音频客观评价方法

客观评价包括有参考评价和无参考评价。

有参考评价:

除了需要给定测试音频外,还需要同时给出参考音频做基准。通过计算测试音频和参考音频等区别来拟合音频的主观得分。

PESQ与POLQA

在 2001 年,ITU-T P.862 标准定义了有参考客观评价算法PESQ(Perceptual Evaluation of Speech Quality,语音质量感知评价),该算法主要用来评估窄带(8kHz 采样率)及宽带(16kHz 采样率)下的编、解码损伤。该算法在过去的二十年中,被广泛的应用于通信质量的评定。   已开源。

2011 年,P.863 标准定义了一套更全面、更准确的有参考客观评价POLQA。相比 PESQ,POLQA 可评估的带宽更广,对噪声信号和延时的鲁棒性更好,其语音质量评分也更接近于主观的评分。  需要购买百万元的专门设备和授权才能使用。

PESQ的算法步骤:

时间对齐:目的消除系统延迟的影响。

听觉变换:将音频信号转化为频谱信号。

差异处理:逐帧处理

取时间平均得到PESQ分数。如对齐错误可再次对齐。

PESQ 的分数范围在 0~4.5 分,一般音质比较好的编/解码器,比如 64kbps 比特率的 OPUS 编解码器,可以达到 4.5 分,而分数越低则代表音质越差。比如 OPUS 的码率降到 6kbps 那 PESQ 可能就只有不到 3 的分数。

note:

PESQ 最多只能评价 16kHz 采样率的音频。  如果要评价一个采样率比较高的音频信号,比如音乐信号,POLQA 会比较合适。POLQA 最高可以支持 48kHz 采样率的全带音频的客观质量评价。     但购买一套 POLQA 设备的价格都是百万级的,为了方便使用,你还可以考虑一下使用例如ViSQOL 等开源算法,也可以支持 48kHz 的音频采样率。

ViSQOL :https://arxiv.org/pdf/2004.09584.pdf

无参考评价:

不需要参考音频,根据音频的频谱能量分布、连续性等指标评分。

适用场景:

比如在打网络电话时,只有接收到的经过编 / 解码和网络传输的音频信号,没有远端的输入信号。这时只能采用无参考音频质量评价方法。

不需要参考信号,仅通过对输入信号本身或参数的分析即可得到一个质量评分。

比较著名的无参考客观评价方法:

  1.  ITU-T P.563

2004 年提出,主要是面向窄带语音的质量评估

  1. ANIQUE+

2006 年提出,也是面向窄带语音,其评分准确度据作者称超过了 PESQ,不过 PESQ 的测量不能反应网络的延时、丢包等,并不能完美适用于如今基于互联网传输的实时互动场景。

  1. E-model

于 2003 年提出,不同于上述两种方法,这是一个基于 VoIP 链路参数的损伤定量标准,不会直接基于信号域进行分析。

  1. ITU-T P.1201

ITU-T P.1201 系列于 2012 年提出,对于音频部分,该标准也不对音频信号直接进行分析,而是基于网络状态和信号状态对通信质量进行评分。

三. 小结:

客观测试目前只能测量音频的损伤程度,比如我们平时在选择编解码器时不知道选择什么类型、多少码率,这时不妨跑一下 PESQ 或者 VisQol 看一下分数。

而对于一些偏主观的测试类型,比如音乐听感、耳机效果等,则一般还是需要依靠主观测试。主观测试可以采用众包等方式把测试分发出去。

针对这种分发式的主观测试,最近的 ITU-T P.808 也有详细的测试流程和方法。

04|主观与客观评价音频质量相关推荐

  1. DXOMark是如何评价音频质量的

    智能大屏手机刚刚普及的时候,屏幕尺寸是消费者选购手机时最关注的因素.近年来,各大厂商走火入魔一般地在相机方向发力,于是拍照功能又成了消费者主要关注的因素之一.然而,随着自媒体与vlog的兴起,越来越多 ...

  2. 讲解视频质量,视频质量测试,主观客观评价视频质量

    1 从模拟信号到数字信号 2 客观视频质量 3 主观视频质量 4 参见 5 参考 视频质量是量化一段视频通过视频传输/处理系统时画面质量变化(通常是下降)程度的方法.由于视频处理系统可能会导致一定的视 ...

  3. 十种客观评价语音质量的方法

    目录 1. 基于SNR的语音质量评价标准 1.1 SNR和分段SNR 1.2 频域SNR 2. 基于LPC系数的语音质量评价标准 2.1 对数似然比距离 2.2 Itakura–Saito距离 2.3 ...

  4. matlab语音信号的变速_十种客观评价语音质量的方法

    语音客观评价标准一般分为语音质量评价和语音可懂度评价,这里先介绍语音质量评价.提起语音质量评价,大家第一个想到的肯定是信噪比这个十分常用的评价标准以及它的相关衍生标准,这里总结一些常用的语音质量评价标 ...

  5. 音频质量的评价方法:简单梳理

    音频质量的评价方法 1. 语音质量评估(SQA) 1.1 主观评价和客观评价 1.2 主观音频评价标准 ITU-T 评价标准 ITU-R评价标准 1.3 客观音频评价标准 3.3 一些概念 2. 主观 ...

  6. 一种基于LSTM的音频质量检测方案

    ·背景· 随着网络技术的发展,各种各样的音视频产品应接不暇,应用场景也越来越多样,使人们的生活更加丰富多彩.与此同时,人们对音频的质量也有越来越高的要求,而如何准确评估音频质量好坏成为了相关行业的研究 ...

  7. 音频质量评价体系那些事

    前言 近年来,线上音视频的产品形态和应用场景越来越丰富,疫情更加速了许多行业线下转线上的布局,音视频技术也越来越受到各大厂的重视,Zoom的股价飞升,腾讯.字节.阿里等等巨头的大力投入,令这个赛道的竞 ...

  8. 软件测试 | 测试开发 | 音频质量检测模型中标准数据集的构建方法

    背景 音频质量检测模型训练中,纯净高质量的音频数据集比较好获得,但是损伤音频的数据集比较少,而且损伤音频的质量得分也很难评估.我们采用了一种只依靠纯净高质量的语音数据集来制作低质量音频并打分的方法. ...

  9. 图像主观质量评价 评分_视频质量评价算法 之 客观评价的性能指标

    前言乱语 说完数据集,先给大家结个尾吧(误) 视频质量评估(VQA)第二期 来介绍几个 评价视频质量评价算法的性能评估指标 我发4,没有在套娃...... 简易小目录 SROCC(Spearman r ...

最新文章

  1. 以Delphi Package架构多人开发应用程序环境
  2. php5.3.*编译出现make: *** [ext/gd/libgd/gd_compat.lo] Error 1 解决方法
  3. UVA11212Editing aBook 编辑书稿
  4. 怎么关闭或者卸载ivanti_电脑软件卸载不了怎么办,教您解决电脑软件无法卸载方法技巧...
  5. 华语乐坛趋势报告(2022)
  6. 斯蒂芬金被退稿_斯蒂芬·金(Stephen King)对技术作家的实用建议
  7. python用pandas读取excel_使用Pandas或其他模块在Python中读取没有隐藏列的Excel文件...
  8. Socket 连接建立过程
  9. IR2130与MOSFET驱动电路分析
  10. 计算机网络自动分配ip地址,计算机ip地址设置 自动获取IP和静态IP
  11. mumu模拟器cpu设置_网易mc怎么提高fps
  12. 游戏安全--手游安全技术入门笔记
  13. 成都个人公司不注销有什么后果?
  14. 新职业人工智能工程师要学哪些内容?
  15. 并行:四种C+OpenMP计算π的并行程序
  16. 手动绘制R语言Logistic回归模型的外部验证校准曲线(Calibration curve)(2)
  17. 对牛乱弹琴 | Playin' with IT
  18. 小i机器人Bot开放平台如何帮企业自建“金牌客服”?
  19. Nginx 反向代理的知识再温习一下
  20. 孙青椒排版八法 和 黄金分割0.618法则和构图法

热门文章

  1. 记录我悲惨的一天(漏洞复现12小时,一个未成功)
  2. 华为手机鸿蒙系统有什么优点,未来的华为手机会用鸿蒙系统吗?| 留言有奖
  3. git 解决冲突的方法
  4. linux php mkfifo,Linux进程间通信(四):命名管道 mkfifo()、open()、read()、close() - 52php - 博客园...
  5. 华南理工金连文:数据提炼是人工智能的下一个突破口
  6. Java中的generics范型
  7. 炸裂!一晚没睡,用 AI 画了亿些小姐姐。。
  8. ssh: connect to host 192.168.169 port 22: No route to host 处理方法
  9. “淘宝大物流”深度剖析,玄机重重
  10. 基于HI3516/HI3518/HI3559内部ADC驱动实现