转自 http://blog.csdn.net/wanggp_2007/archive/2009/12/24/5070517.aspx

总结了常用的ITU Speech Codec,谨供大家学习参考:

1、G.711: Pulse code modulation (PCM) of voice frequencies

编码类型:压扩PCM
编码速率:64Kbps

理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);

音质:长途质量;
优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的 带宽较高
应用领域:voip,PSTN 电话网络
版税方式:Free
备注:

70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

G.711是最基本的一种编码方法,俗称PCM,采用μ-law(主要北美地区使用)和A-law(其它地区)两种非线性量化方法进行压缩。说它“基本” 是因为一方面PCM算法非常简单,很多ADC硬件的输入输出就直接支持PCM格式;另一方面PCM格式在通信系统中往往需要进一步压缩,因此它是其它语音 编码算法的输入源。

2、G.722.1: Low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss

编码类型:变换域Audio coding
编码速率:24Kbps、32Kbps;(其实可以实现更多码率,以8kbps递增码率,另外还 有32kHz采样的更高码率版本);

理论延时:40ms(20ms frame size + 20ms lookhead)

音质:低码率时优于MP3、WMA等音频算法,详细可参考Polycom网站;
优点:算法复杂度低,小于 5.5wMOPS,相对于MP3,WMA等算法在低码率时音质要好;

缺点:对于speech而言,音质没有CELP模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联 网流应用;
版税方式:Free
备注:

G.722.1是由Polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000Hz)和 7kHz以内的音乐进行编码,采样率为16kHz,其32kbps码率的重建语音质量相当于64 kbps G.722 SB-ADPCM。在实际的应用中,本算法在低码率时其音质要高于MP3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附 录C中提供了32kHz采样的14k带宽的音频编码方案,进一步提高了音质。

3、G.722.2: Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)

编码类型:ACELP
编码速率:6.6Kbps~23.85Kbps;

理论延时:25ms(20ms frame size + 1/4 subframe size)

音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;

缺点:复杂度太高;
应用领域:3GPP 无线通信;
版税方式:单一授权
备注:

AMR Wideband (AMR-WB) 是迄今为止唯一的针对无线 (3GPP) 和有线 (ITU-T Recommendation G.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。AMR-WB 是被 3GPP 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 kHz)支持的情况下,它还是 GSM 和 WCDMA 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (MMS)、IMS 信息和呈现服务、分组交换流媒体业务 (PSS)、多媒体广播/组播业务 (MBMS) 以及无线一键通业务 (PoC)。 其他应用包括 VoIP、会议、Wi-Fi 电话、卫星电话、视频电话、互联网流式音频,等等。

4、G.723.1: Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s

编码类型:ACELP、MP-MLQ
编码速率:5.3Kbps、6.3Kbps;

理论延时:37.5ms(30ms frame size + 1/4 subframe size)

音质:小于长途质量,MOS 3.7;
优点:码率低,带宽要求较小。并达到ITU-TG723要求的语音质量,性能稳定,避免了载波信号的 时通时断。

缺点:声音质量一般;
应用领域:VOIP;
版税方式:Free
备注:

G.723.1是一个双速率的语音编码器,是 ITU-T建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统 包括H.323、H.324等多媒体通信系统,目前该算法已成为IP电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于 G.712),再对语音信号用传统8000-Hz速率进行抽样(基于G.711),并变换成16 bit线性PCM码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(MP-MLQ),低速率编码器 使用代数码激励线性预测(ACELP)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他 音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带 宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。

5、G.726: 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

编码类型:ADPCM
编码速率:40Kbps、32Kbps、24Kbps、16Kbps;

理论延时:0.125ms(8kHz sample rate)

音质:32kbps,长途质量;
优点:计算简单,带宽是G.711的一半而音质接近;

缺点:占有带宽相对还是较高;
应用领域:VOIP,电话通信网络;
版税方式:free
备注:

G.726是G.721和G.723的联合,同时增加了16kbps ADPCM,但最为常用的方式是 32 kbit/s。G.726是G.711带宽的一半,所以可将网络的可利用空间增加了一倍。G.726具体规定了一个 64 kbpsA-law 或 µ-law PCM 信号是如何被转化为40, 32, 24或16 kbps 的 ADPCM 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(DCME)中的语音传输,而40 kbps 通道则被用于 DCME 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。

6、G.728: Coding of speech at 16 kbit/s using low-delay code excited linear prediction

编码类型:CELP
编码速率:16Kbps;

理论延时:0.625ms(8kHz sample rate)

音质:长途质量;
优点:低延时、抗误码能力非常强;

缺点:比其他的编码器都复杂;
应用领域:IP电话,数字移动通信、卫星通信;
版税方式:free
备注:

G.728 低延时码激励线性预测编码(LD-CELP)是世界上第一个标准化参数语音CODEC,以CELP算法为基础,采用后向自适应线性预测、50阶合成滤波和 短激励矢量等改进方法,达到了低延时的目的。

7、G.729: Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)

编码类型:CS-CELP
编码速率:8Kbps;

理论延时:15ms(10ms frame size + 1/2 subframe lookhead)

音质:长途质量;
优点:低码率,高音质,应用广泛;

缺点:算法复杂度较高;
应用领域:VOIP;
版税方式:free
备注:

国际电信联盟(ITU-T)于1995年11月正式通过了G.729。 ITU-T建议G.729也被称作“共轭结构代数码本激励线性预测编码方案”(CS-ACELP),它是当前较新的一种语音压缩标准。G.729是由美 国、法国、日本和加拿大的几家著名国际电信实体联合开发的。G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种 算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。G.729编码器是为低时延应用设计的, 它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为25ms,比特率为8 kbps。
96 年ITU-T又制定了G.729的简化方案G.729A,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是G.729A。

8、G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729.

编码类型:CELP、TDBWE
编码速率:8Kbps~32kbps,12个码率;

理论延时:48.9375ms;

音质:未知;
优点:多码率,可与G.729、G.729A和G.729B实现完全操作;

缺点:应用未成熟;
应用领域:VOIP;
版税方式:有专利
备注:

G.729.1是一个可与G.729,G.729A 和G.729B 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。G.729EV 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 Hz,在14-32 kbit/s 采样频率上带宽为50-7000 Hz。在8 kbit/s,G.729EV 可以与G.729、G.729 附件A 和G.729 附件B 实现完全互操作。因此可预见在现有基于G.729 的VoIP 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 kHz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段 编码结构:低频带(50-4000 Hz)嵌入式码激励线性估计(CELP)编解码,高频带(4000-7000 Hz)时域带宽扩展(TDBWE)参量编解码,以及通过被称为时域混叠消除(TDAC)的估计变换编解码技术实现的全频带增强功能。

参考资料:

1、http://wz.csdn.net/foobarren/

2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html

3、http://kware.blogbus.com/tag/Codec/

4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591

5、http://www.ctiforum.com/news/2009news/07/news07242.htm

常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.726,G.728,G.729,G.729.1)相关推荐

  1. 音频编码-G.711

    ​G.711是一种窄带音频编解码器,最初设计用于提供 64 kbit/s 的长途质量音频的电话.G.711 传递 300–3400 Hz 范围内的音频信号,并以每秒 8,000 个样本的速率对其进行采 ...

  2. speech codec (G.711, G.723, G.726, G.729, iLBC)

    各种各样的编解码在各种领域得到广泛的应用,下面就把各种codec的压缩率进行一下比较,不正确之处望各位同行指正. Speech codec:     现主要有的speech codec 有: G.71 ...

  3. 语音编码标准(G.711 G.723 G.726 G.729 iLBC) .

    各种各样的编解码在各种领域得到广泛的应用,下面就把各种codec的压缩率进行一下比较. 现主要有的speech codec 有: G.711, G.723, G.726 , G.729, ILBC, ...

  4. 语音编码标准(G.711 G.723 G.726 G.729 iLBC)

    各种各样的编解码在各种领域得到广泛的应用,下面就把各种codec的压缩率进行一下比较. 现主要有的speech codec 有: G.711, G.723, G.726 , G.729, ILBC, ...

  5. 音频编解码标准G.711与G.729

    G.711和G.729协议是两对用于语音压缩的编码方案,两者具有一些相似之处,但不同于完全自由使用的G.711,使用G.729是需要付费的,而且,对于使用G.729的情况,CPU占有时间大约为G.71 ...

  6. Android G.711音频编解码

    需求背景: 博主目前所在的公司是一家做视频通讯的公司,所以对音频,视频这一块对编码方式都有一定的要求,由于之前一直没有接触JNI这一块,突然让我去做音频的转码还是有一定的苦难的.一开始对于JNI编程我 ...

  7. G.711 音频编码

    目录 参考 概述 G.711原理 总结 1. 参考 [1] wikipedia/A-law_algorithm [2] github.com/quatanium/foscam-ios-sdk [3] ...

  8. G.711是一种由国际电信联盟(ITU-T)制定的音频编码方式

    http://zh.wikipedia.org/zh-cn/G.711 ITU-T G.711 page ITU-T G.191 software tools for speech and audio ...

  9. Css的filter常用滤波器属性及语句大全

    Css的filter常用滤波器属性及语句大全 语法:STYLE="filter:filtername(fparameter1, fparameter2...)" (Filterna ...

最新文章

  1. 【转】Eclipse的Debug调试技巧大全
  2. Renascence架构原理——最优化算法
  3. php提前用户系统时间限制,php date()比服务器时间提前一小时(DST问题)
  4. 计算机与环境科学,计算机在环境科学与工程方向的应用
  5. php里面的 n算是,用PHP中的bcmath计算第N个根
  6. Spark Streaming 技术看点!
  7. php比较两个变量的值_总结PHP不用第三个变量交换两个变量的值的几种方法
  8. 计算机办公软件知识,计算机办公软件基础知识1
  9. 连接MySql出现Client does not support authentication protocol requested by server错误
  10. Nginx缓存配置以及nginx ngx_cache_purge模块的使用
  11. 准双向口和KELL C头文件已经处理
  12. SAS9.2安装及遇到的问题。安装时提醒Sas安装数据SID文件无效
  13. 计算机网络校园网建设设计摘要,计算机网络专业毕业论文校园网建设设计.doc...
  14. 存储数据恢复案例_磁盘阵列数据恢复_raid5磁盘掉线数据恢复方法
  15. Activiti工作流表结构详解
  16. 论文阅读——Efficient and Robust Feature Selection via Joint L2,1-Norms Minimization
  17. web前端总结---day01
  18. 2021查询高考成绩提前批分数线,快看看!2021高考部分省市“预测分数线”出炉!两点需要注意...
  19. Python 保留小数位
  20. 根据火车的出发时间和到达时间,编写程序计算整个旅途所用的时间。

热门文章

  1. 考上这6所大学,毕业后就当公务员,堪称“公务员的摇篮”
  2. 什么是域名劫持和域名污染
  3. iReport-3.7.6实现动态图片切换
  4. php smarty变量调节器,Smarty模板变量与调节器实例详解
  5. Sybase SQL查询字段类型
  6. 设备巡检管理系统,为企业降本增效
  7. 百分制转换为等级制(Centesimal-grade to Letter-grade)利⽤switch语句编写⼀个程序,把⽤数字表示的成绩转化为字⺟表示的等级。
  8. 用 Python 进行 Curses 编程
  9. 安装:logstash后,爆出:ModuleNotFoundError: No module named ‘event‘,解决方法。
  10. 全力护航!广西移动圆满完成区运会通信保障任务