文章目录

  • 概念
  • codec列表
  • 支持的codec列表
  • FR普通全速率
  • HR普通半速率
  • EFR增强型全速率
  • AFS 自适应全速率编码
  • AHS 自适应半速率编码
  • AMR(AFS+AHS)
  • AMR-WB
  • AMR-WB+
  • RTP audio video profile
  • 比较

概念

音频编解码器是编码或解码音频的编解码器(能够编码或解码数字数据流的设备或计算机程序)。
在软件中,音频编解码器是实现根据给定音频文件或流媒体音频编码格式压缩和解压缩数字音频数据的算法的计算机程序。该算法的目的是以最小的比特数表示高保真音频信号,同时保持质量。这可以有效地减少存储的音频文件的传输所需的存储空间和带宽。大多数编解码器被实现为与一个或多个多媒体播放器接口的库。
在硬件中,音频编解码器指的是将模拟音频编码为数字信号并将数字解码为模拟信​​号的单个设备。换句话说,它包含一个模数转换器(ADC)和运行相同时钟信号的数模转换器(DAC)。例如,这用于支持音频输入和输出的声卡。硬件音频编解码器使用AC-Link,I²S,SPI,I²C等总线发送和接收数字数据。最常见的数字数据是线性PCM,这是大多数编解码器支持的唯一格式,但一些传统编解码器支持其他用于电话的G.711等格式。

codec列表


支持的codec列表

  Supported Codec ListElement ID: 0x40Length: 8System Identification (SysID): UMTS (0x04)Bitmap Length: 2Codec Bitmap for SysID 10... .... = TDMA EFR: False.1.. .... = UMTS AMR 2: True..1. .... = UMTS AMR: True...0 .... = HR AMR: False.... 0... = FR AMR: False.... .0.. = GSM EFR: False.... ..0. = GSM HR: False.... ...0 = GSM FR: False00.. .... = Spare bit(s): 0..0. .... = OHR AMR-WB: False...0 .... = OFR AMR-WB: False.... 0... = OHR AMR: False.... .1.. = UMTS AMR-WB: True.... ..0. = FR AMR-WB: False.... ...0 = PDC EFR: FalseSystem Identification (SysID): GSM (0x00)Bitmap Length: 2Codec Bitmap for SysID 20... .... = TDMA EFR: False.0.. .... = UMTS AMR 2: False..0. .... = UMTS AMR: False...1 .... = HR AMR: True.... 1... = FR AMR: True.... .1.. = GSM EFR: True.... ..1. = GSM HR: True.... ...1 = GSM FR: True00.. .... = Spare bit(s): 0..0. .... = OHR AMR-WB: False...0 .... = OFR AMR-WB: False.... 0... = OHR AMR: False.... .0.. = UMTS AMR-WB: False.... ..0. = FR AMR-WB: False.... ...0 = PDC EFR: False

FR普通全速率

全速率(FR或GSM-FR或GSM 06.10或有时简称GSM)是GSM数字移动电话系统中使用的第一个数字语音编码标准。 编解码器的比特率为13 kbit / s,或1.625位/音频采样(通常填充为33字节/ 20 ms或13.2 kbit / s)。 现代标准对编码语音的质量非常差,但在开发时(20世纪90年代早期),它是计算复杂性和质量之间的良好折衷,仅需要每秒一百万次加法和乘法。 编解码器仍广泛用于世界各地的网络中。 渐进式FR将被增强型全速率(EFR)和自适应多速率(AMR)标准所取代,这些标准可提供更高的语音质量和更低的比特率。

GSM-FR在ETSI 06.10(ETS 300 961)中规定,并且基于RPE-LTP(常规脉冲激励 - 长期预测)语音编码范例。与许多其他语音编解码器一样,在合成滤波器中使用线性预测。然而,与大多数现代语音编解码器不同,线性预测的顺序仅为8.在现代窄带语音编解码器中,顺序通常为10,而在宽带语音编解码器中,顺序通常为16。

语音编码器以8 kHz采样率接受13位线性PCM。这可以直接来自手机或计算机中的模数转换器,也可以通过查找表从PSTN的G.711 8位非线性A律或μ律PCM转换而来。在GSM中,编码语音被传递到GSM 05.03中规定的信道编码器。在接收方向上,进行逆运算。

该编解码器可在160个样本帧上运行,跨度为20 ms,因此即使CPU速度极快且网络延迟为零,这也是最小的代码转换器延迟。操作要求是代码转换器延迟应小于30 ms。代码转换器延迟被定义为在编码器输入处接收到160个样本的语音帧的瞬间与语音解码器以8kHz采样率输出相应的160个重构语音样本的时刻之间的时间间隔。

HR普通半速率

半速率(HR或GSM-HR或GSM 06.20)是用于GSM的语音编码系统,在20世纪90年代早期开发。

由于编解码器以5.6 kbit / s的速度运行,需要全速率编解码器的一半带宽,因此语音流量的网络容量增加了一倍,但代价是音频质量。 当电池电量不足时,建议使用此编解码器,因为它可能消耗高达30%的能量[需要引证]。 采样率为8 kHz,分辨率为13位,帧长度为160个样本(20 ms),子帧长度为40个样本(5 ms)。

GSM半速率在ETSI EN 300 969(GSM 06.20)中规定,并使用VSELP算法的形式。 以前的规范是在ETSI ETS 300 581-2中,第一版于1995年12月出版。

对于某些诺基亚手机,可以配置此编解码器的使用:

要激活HR编解码器,请输入以下代码:* 4720#
要停用HR编解码器,请输入以下代码:#4720#

EFR增强型全速率

增强的全速率或EFR或GSM-EFR或GSM 06.60是一种语音编码标准,其开发是为了改善GSM全速率(FR)编解码器的相当差的质量。 EFR以12.2 kbit / s的速度工作,可在任何无噪声和背景噪声条件下提供线状质量。 EFR 12.2 kbit / s语音编码标准与最高AMR模式兼容(均为ACELP)。 尽管增强型全速率有助于提高通话质量,但此编解码器具有更高的计算复杂度,与“旧”FR编解码器相比,在移动设备中可能导致能耗增加高达5%。

Enhanced Full Rate由诺基亚和舍布鲁克大学(加拿大)共同开发。 1995年,ETSI选择增强型全速率语音编解码器作为GSM / DCS的行业标准编解码器。

采样率为8000 sample / s,导致编码比特流的比特率为12.2 kbit / s。编码方案是所谓的代数码激励线性预测编码器(ACELP)。编码器由数据组成,数据的分辨率为13位,在16位字中左对齐。三个最低有效位设置为0.解码器以相同的格式输出数据。

增强全速率(GSM 06.60)技术规范描述了13位统一PCM格式的160个语音样本的输入块与244位的编码块之间以及从244位的编码块到160个重建语音样本的输出块之间的详细映射。它还规定了A律或μ律(PCS 1900)8位PCM和13位均匀PCM之间的转换。规范的这一部分还描述了低至比特级的编解码器,因此通过使用一组数字测试序列能够高度可靠地验证对部件的符合性。这些测试序列在GSM 06.54中有描述,可在磁盘上获得。

该标准在ETSI ETS 300 726(GSM 06.60)中定义。包装在ETSI技术规范TS 101 318中规定。[3] ETSI在1995年选择了增强型全速率语音编解码器作为GSM / DCS的行业标准编解码器。增强型全速率也被选为PCS 1900 GSM频段美国市场的行业标准。

AFS 自适应全速率编码

AHS 自适应半速率编码

AMR(AFS+AHS)

自适应多速率(AMR,AMR-NB或GSM-AMR)音频编解码器是针对语音编码而优化的音频压缩格式。 AMR语音编解码器由一个多速率窄带语音编解码器组成,该编码器以4.75到12.2 kbit / s的可变比特率编码窄带(200-3400 Hz)信号,收费质量语音从7.4 kbit / s开始。

1999年10月,3GPP采用AMR作为标准语音编解码器,现在广泛用于GSM和UMTS。它使用链路自适应来根据链路条件从八种不同的比特率中选择一种。

AMR也是使用AMR编解码器存储语音音频的文件格式。许多现代移动电话手机可以存储AMR格式的短录音,并且存在免费和专有程序(参见软件支持)以在此格式和其他格式之间进行转换,尽管AMR是一种语音格式,并且不太可能为其他格式提供理想的结果音频。常用文件扩展名为.amr。 AMR还存在另一种存储格式,适用于对存储格式有更高级要求的应用,如随机访问或与视频同步。此格式是基于ISO基础媒体文件格式的3GPP指定的3GP容器格式。

这些帧包含160个样本,长度为20毫秒。AMR使用各种技术,例如ACELP,DTX,VAD和CNG。 AMR的使用需要优化的链路自适应,其选择最佳编解码器模式以满足本地无线电信道和容量要求。 如果无线电条件差,则源编码减少并且信道编码增加。 这提高了网络连接的质量和稳健性,同时牺牲了一些语音清晰度。 在AMR的特定情况下,对于可用通信,这种改进在S / N = 4-6dB附近。 新的智能系统允许网络运营商优先考虑每个基站的容量或质量。

AMR编解码器总共有14种模式,8种可用于全速率信道(FR),6种可用于半速率信道(HR)。

AMR-WB

自适应多速率宽带(AMR-WB)是一种基于自适应多速率编码开发的专利宽带语音音频编码标准,使用与代数码激励线性预测(ACELP)类似的方法。与窄带语音编码器相比,AMR-WB提供了更高的语音质量,因为窄带语音编码器通常针对300-3400 Hz的POTS有线质量进行了优化。 AMR-WB由诺基亚和VoiceAge开发,最初由3GPP指定。

AMR-WB被编码为G.722.2,一种ITU-T标准语音编解码器,正式称为使用自适应多速率宽带(AMR-WB)的大约16 kbit / s的语音宽带编码。 G.722.2 AMR-WB与3GPP AMR-WB的编解码器相同。相应的3GPP规范是用于语音编解码器的TS 26.190和用于语音活动检测器的TS 26.194。

AMR-WB格式具有以下参数:

处理的频段 50-6400 Hz(所有模式)加6400-7000 Hz(仅限23.85 kbit / s模式)
延迟帧大小 20毫秒
向前看 5毫秒
AMR-WB编解码器采用带分裂滤波器 该滤波器的单向延迟为0.9375 ms
复杂性 38 WMOPS,RAM 5.3KWords
, 语音活动检测,不连续传输,舒适噪声发生器
固定点 比特精确C
浮点 工作中。

AMR-WB文件格式的通用文件扩展名是.awb。 AMR-WB还有另一种存储格式,适用于对存储格式有更高级要求的应用,如随机访问或与视频同步。此格式是基于ISO基础媒体文件格式的3GPP指定的3GP容器格式。3GP还允许将AMR-WB比特流用于立体声。

与AMR一样,AMR-WB具有九种不同的比特率。在干净环境中提供出色语音质量的最低比特率为12.65 kbit / s。较高的比特率在背景噪声条件和音乐中很有用。此外,较低的6.60和8.85 kbit / s比特率可提供合理的质量,尤其是与窄带编解码器相比时。

6.4 kHz至7 kHz的频率仅以最高比特率模式(23.85 kbit / s)传输,而在其余模式下,解码器通过使用较低频率数据(75-6400 Hz)以及随机噪声产生声音(为了模拟高频段)。[7]

所有模式均以16 kHz(使用14位分辨率)进行采样,并以12.8 kHz进行处理。

比特率如下:
强制性多速率配置
6.60 kbit / s(用于电路交换GSM和UMTS连接;只应在无线电连接不良时暂时使用,不被视为宽带语音)
8.85 kbit / s(用于电路交换GSM和UMTS连接;只应在不良无线电连接期间暂时使用,不被视为宽带语音;提供质量等于G.722,48 kbit / s用于干净语音)
12.65 kbit / s(主锚比特率;用于电路交换GSM和UMTS连接;在此比特率及以上时为AMR提供卓越的音质;提供等于或优于G722的56 kbit / s的干净语音质量)
在恶劣的背景噪声环境中,语音和音乐的组合以及多方会议中的语音比特率更高。
14.25 kbit / s
15.85 kbit / s
18.25 kbit / s
19.85 kbit / s
23.05 kbit / s(不针对全速率GSM频道)
23.85 kbit / s(对于干净的语音,提供的质量等于G.722,速率为64 kbit / s;不适用于全速率GSM信道)
注:“编解码器模式可以在3G WCDMA频道中每20毫秒更换一次,在GSM / GERAN频道每40毫秒更改一次。(对于与GSM / GERAN无串联操作的互操作性,模式变化率在AMR中限制在3G到40毫秒 - WB编码器。)“

在移动电话网络中使用时,有三种不同的配置(比特率组合)可用于语音信道:

配置A(配置-WB-Code 0):6.6,8.85和12.65 kbit / s(强制多速率配置)
配置B(配置-WB-Code 2):6.6,8.85,12.65和15.85kbit / s
配置C(配置-WB-Code 4):6.6,8.85,12.65和23.85kbit / s
该限制旨在简化手机和基站之间的比特率协商,从而极大地简化了实现和测试。 所有其他比特率仍然可以用于移动电话网络中的其他目的,包括多媒体消息,流式音频等。

AMR-WB+

扩展自适应多速率 - 宽带(AMR-WB +)是一种扩展AMR-WB的音频编解码器。它增加了对立体声信号和更高采样率的支持。另一个主要改进是对ACELP使用变换编码(变换编码激励-TCX)。这极大地改善了通用音频编码。变换编码和ACELP之间的自动切换以适中的比特率提供良好的语音和音频质量。

由于AMR-WB以12.8 kHz的内部采样率工作,AMR-WB +还支持12.8 kHz至38.4 kHz的各种内部采样频率范围。 AMR-WB使用16 kHz采样频率,在16位字中左对齐14位分辨率。 AMR-WB +使用16/24/32/48 kHz采样频率,16位字的分辨率为16位。[1]

3GPP最初开发了用于全球移动通信系统(GSM)和第三代(3G)蜂窝系统中的流和消息服务的AMR-WB +音频编解码器。其主要目标应用是分组交换流服务(PSS),多媒体消息服务(MMS)以及多媒体广播和多播服务(MBMS)。

AMR-WB +编码音频的文件存储在3GPP TS 26.244中定义的3GPP定义的基于ISO的多媒体文件格式的3GP容器格式中指定。[2]

AMR-WB +编解码器具有5.2-48 kbit / s的宽比特率范围。单声道速率可从5.2-36 kbit / s扩展,立体声速率可从6.2-48 kbit / s扩展,再现带宽高达20 kHz(接近CD质量)。此外,它提供与AMR宽带的后向兼容性。

RTP audio video profile

RTP音频/视频配置文件(RTP / AVP)是实时传输协议(RTP)的配置文件,用于指定音频和视频流的技术参数。 RTP指定了通用数据格式,但未指定编码数据应如何利用RTP的功能(将哪个有效负载类型值放入RTP报头,采样率和时钟速率[RTP时间戳递增的速率] ]使用等)。 RTP配置文件指定了这些详细信息。 RTP音频/视频配置文件指定特定音频和视频编解码器的映射及其采样率与RTP有效载荷类型和时钟速率,以及如何将每种数据格式编码为RTP数据有效载荷,以及指定如何使用这些映射来描述这些映射 会话描述协议(SDP)。

比较

这几种声码器,用得最多的是AFS和EFR,其语音的MOS值也是最好的。
https://zh.wikipedia.org/wiki/音频编码格式的比较
https://en.wikipedia.org/wiki/Comparison_of_audio_coding_formats

UE支持的Codec对比相关推荐

  1. MSU高清/极慢档Codec对比:AV1压缩效率第一 速度慢

    4月4日,MSU公布了2018视频编码压缩报告的补充部分--高清/极慢速度档的Codec压缩效率对比,AV1再次成为压缩效率最高的Codec.同时,报告显示AV1与其他Codec相比,编码耗时为10- ...

  2. matlab2019支持python_全方位对比:Python、Julia、MATLAB、IDL 和 Java (2019 版)

    引言 我们使用简单的测试用例来对各种高级编程语言进行比较.我们是从新手程序员的角度来实现测试用例,假设这个新手程序员不熟悉语言中可用的优化技术.我们的目的是突出每一种语言的优缺点,而不是宣称一种语言比 ...

  3. qt 支持 html5,Qt 对比 HTML5 ——正反两面

    支持的平台 HTML5的支持无处不在 Qt支持所有主流平台(而且非主流平台碰巧用它做UI) 理论上你可以用HTML5适配更多平台,但这不是大多数开发人员在现实世界里使用它的原因.HTML5开发者越 ...

  4. Oreo对A2DP codec的支持

    除了使用HIDL来区分蓝牙的公共stack和vendor lib,Oreo对蓝牙A2DP的支持也更加全面.除了A2DP profile强制支持的SBC,Oreo新增了对AAC.APTX.LDAC的编码 ...

  5. 代码对比工具,我就用这 6 个!

    在程序开发的过程中,程序员会经常对源代码以及库文件进行代码对比,在这篇文章里我们向大家介绍六款程序员常用的代码比较工具. WinMerge WinMerge是一款运行于Windows系统下的文件比较和 ...

  6. 全球及中国临床试验支持服务行业十四五规模发展及应用前景调研报告2022-2027年

    全球及中国临床试验支持服务行业十四五规模发展及应用前景调研报告2022-2027年 [搜索鸿晟信合查看官网更多内容!]  2020年,全球临床试验支持服务市场规模达到了 百万美元,预计2027年将达到 ...

  7. 支持html5特性的浏览器,HTML 5浏览器的支持情况

    我经常看到有很多人询问HTML5某个特性当前各浏览器的支持情况.的确,因为HTML5内容庞大,特性众多,而浏览器的支持情况又混杂不一,随时都有可能变化,所以了解起来比较困难.在这里,我汇总了一些常用的 ...

  8. pgsql处理文档类型数据_【干货总结】:可能是史上最全的MySQL和PGSQL对比材料

    关于SQL特性支持情况的对比,可以参考:http://www.sql-workbench.net/dbms_comparison.html 9. 主从复制安全性 PGSQL 同步流复制.强同步(rem ...

  9. ActiveMQ RabbitMQ KafKa对比

    前言: ActiveMQ和 RabbitMq 以及Kafka在之前的项目中都有陆续使用过,当然对于三者没有进行过具体的对比,以下摘抄了一些网上关于这三者的对比情况,我自己看过之后感觉还 是可以的,比较 ...

  10. 代码对比工具 Top5

    俗话说:三句不离本行,对于程序员这个可爱的群体来说也是一样,即使面对无休无止的编程工作,程序员们依旧任劳任怨的埋头苦干,梦想着用自己码下的代码改变世界. 工欲善其事,必先利其器.每一位程序员都有自己私 ...

最新文章

  1. Python实战案例,pygame模块,Python实现套路表白神器VS无套路表白神器
  2. 你知道为什么S4HANA中物料凭证要全部放在MATDOC中吗
  3. Xilinx FPGA的配置
  4. php代码在线快速生成,PHPGEN在线代码生成器
  5. Linux操作系统:12则经典运用技巧
  6. 4.18、Bootstrap V4自学之路-----内容---滚动监听
  7. 在web网页中正确使用图片格式
  8. .NET6之MiniAPI(十六):数据保护
  9. python字典items返回什么_Python 字典items返回列表,iteritems返回迭代器
  10. flask + 蓝图 用 sqlalchemy 对 mysql 进行 增删查改 的 demo
  11. python输入逗号分隔_命令行Python逗号分隔的用户输入int值
  12. linux nuc 吗 支持_在你的树莓派家庭实验室中使用 Cloudinit | Linux 中国
  13. 消防给水及消火栓系统技术规范_对于高位消防水箱《消防给水及消火栓系统技术规范》是如何规定...
  14. python获取图片大小_Python实现获取本地及远程图片大小的方法示例_python_脚本中心...
  15. FRR的ATOMIC 利用GCC的实现
  16. MPLAB X环境ICD3无法使用
  17. 网站访问统计术语和度量方法
  18. 【Android开发笔记】4.简单基站定位程序
  19. Vue指令概述,v-if与v-show的区别
  20. 5.Transformation(转换算子)

热门文章

  1. 第二章 搭建Android开发环境
  2. awb入门(2).色彩恒常
  3. 38年来,NBA最有价值球员|数据分析
  4. 【WSN通信】基于matlab A_Star改进LEACH多跳传输协议【含Matlab源码 487期】
  5. Android常用的开源库收集(持续更新中)
  6. 深度学习基本算法介绍
  7. Pettitt突变点检测
  8. 工业机器人的TCP点
  9. 软件项目估算与计划不是一般的难
  10. 清华园那沁人心脾的秋天