TU G.729(CS-ACELP共扼结构-代数码激励线性预测)语音算法
ITU规定的G.729标准语音处理算法(标准见附),编码速率是8kbps,采样率8KHz,编码延时一帧10ms。其编码语音质量与传统电话接近,是VoIP系统中常用的基础算法。附录A和附录B称作G.729A和G.729B。
G.729现在经进一步的研究和实践将其工作范围扩展至 6.4~11.8kb/s,话音质量也在此范围内有一定的变化,但即使是6.4kb/s,话音质量也还不错,因而很适合在VoIP系统中使用。

ITU G.723.1(ACELP代数码激励线性预测)语音算法
ITU规定的G.723.1标准语音处理算法(标准见附),编码速率有是5.3和6.3kbps两种,采样率8KHz,编码延时一帧30ms。其编码语音质量与G.729接近,是VoIP和数字录音系统中常用的基础算法。附录A称作G.723.1A。

AMR(Adaptive Multi Rate)自适应多速率语音算法
AMR 是ETSI和3GPP等组织规定的GSM,3G,W-CDMA等无线通信系统必须支持的一种标准语音处理算法(标准见附),它的编码速率范围是从4.75 -12.2kbps,采样率8KHz,编码延时一帧20ms。可以根据网络条件在不同的速率之间切换。手机彩铃,彩信,录音,3GP格式等一般都是使用这 种算法,与MP3格式可以互相转换。

AMR Wideband(Adaptive Multi Rate)宽带自适应多速率语音算法
AMR Wideband是3GPP规定的宽带AMR算法(标准见附),在ITU标准中规定为G.722.2,其采样率为16KHz,编码速率范围为6.6-23.85kbps,编码延时一帧20ms,主要应用在3G通信系统。

G.722 (SB-ADPCM)

ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms,这已经很小,不致造成电信网络中的回声问题。此外,该编解码器传输位误差率仅为 10-3,其性能可以接受。即使遇到最差的网络传输条件,上述要求也可确保性能只是稍稍下降。

G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s。

G.722.1(转换 (Transform) 编码器)

ITU G.722.1 于 20 世纪 90 年代末开发,可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发,使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。

G.722.2 (AMR-WB)

AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器,但最近扩展为包括有线系统。由于其计算强度很大,因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上,音频带宽为 50-7000 HZ,在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。

AMR-WB 于 2001 年标准化,用于 GSM 与 WCDMA 网络。2002 年底,ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。


1 几种话音编解码方法的性能对比

      编码方法     G.723.1    G.729    G.729A

              比特率    5.3/6.3kb/s   8kb/s    8kb/s

              帧长度    30ms      10ms     10ms

      处理时延   30ms      10ms     10ms

              观看时延   7.5ms      5ms     5ms

              帧字节数   20/24      10      10

      DSP MIP   16       20      10.5

              RAM     2200      3000     2000

相关的话音技术还包括静音检测技术和回声消除技术。有研究结果表明,人们在打电话时约有50%为聆听对方讲话的静默时间,10%为讲话时短暂停顿的静 默时间。静音检测技术可以有效剔除静默信号,从而使话音信号占用的带宽要求进一步降低到3.5kb/s左右;回声消除技术利用数字滤波器技术来消除对通话 质量影响很大回声干扰,保证通话质量。这点在时延相对较大的分组网络环境中尤为重要。

表2 多媒体会议中常使用的音频编码模式

标准

比特率

音频带宽

复杂性(定点)

帧大小

延迟

G.711(1977)

48,56,64kbps

3kbps

接近0

125μs

《1ms

G.728(1992)

16kbps

3kbps

约35~40MIPS

625μs

<2ms

G.723.1(1995)

5.3,6.4kbps

3kbps

约18~20MIPS

30ms

97.5ms

G.729(1995)

8kbps

3kbps

约18MIPS

10ms

35ms

G.729A(1996)

8kbps

3kbps

约11MIPS

10ms

35ms

G.722(1988)

48,56,64kbps

7kbps

约10MIPS

125μs

<2ms

G.16K

16,24,32kbps

7kbps

约<15MIPS

≤20ms

≤60ms

技术规范
标准编解码软件符合ITU和3GPP有关标准,通过所有标准测试数据,与标准算法完全兼容。相关标准如下。
(1) ITU-T Recommendation G.729, Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP).
(2) G729 Annex A, Reduced complexity 8 kbit/s CS-ACELP speech codec
(3) G729 Annex B, A silence compression scheme for G.729 terminals
(4) ITU-T Recommendation G.723.1, Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s.
(5) G.723.1 AnnexA, silence compression scheme.
(6) GSM 06.90, Digital cellular telecommunication system (Phase 2+); Adaptive Multi-Rate (AMR) speech transcoding.
(7) GSM 06.91, Substitution and muting of lost frame for AMR speech traffic channels.
(8) GSM 06.92, Comfort noise aspects for AMR speech traffic channels.
(9) GSM 06.93, Discontinuous transmission (DTX) for AMR speech traffic channels.
(10) GSM 06.94, Voice Activity Detector (VAD) for AMR.
(11) GSM 06.74, Test sequences for the AMR speech codec.
(12) 3GPP TS26.190, AMR Wideband speech codec; Transcoding functions(Release 5).
(13) 3GPP TS 26.194, Voice Activity Detection (VAD).
(14) 3GPP TS 26.174, AMR wideband speech codec; Test sequences.
(15) 3GPP TS 26.194, Frame Structure.

Voip中的音频Codec技术相关推荐

  1. 技术干货 | 网易云信音视频通话产品中的音频效果功能

    导读:音频效果器一般是指某些通过改变声音信号来实现某些特殊效果的设备或者算法模块.随着直播.短视频等应用的爆发,娱乐应用中对音频效果器的需求也受到越来越多的关注. 文|陈耀斌 网易智企云信音视频开发专 ...

  2. Cisco WebEx:企业协作服务中的音频需求

    在LiveVideoStack线上交流分享中,Cisco资深音频算法工程师高华基于思科的企业协作服务产品实践,分析整理了协作服务中遇到的音频需求,详细介绍了思科WebEx meeting 中的音频方案 ...

  3. 最近在ST公司的STxp70的dsp平台上开发音频codec模块.

    公司最近和ST公司有个DAB的项目, 需要将AACplus,BSAC,MPEG-lay2以及lay3的算法在该dsp平台上 进行优化.这个dsp平台比较的奇怪和TI的以及arm的core不太一样,它有 ...

  4. 智能型手机中的音频设计方案

    当手机不断地整合包括照相.游戏.数据.视频等各种功能于一身时,它已摇身变成一个多媒体应用的播放平台,可说是朝细致而微的随身型迷你计算机发展. 在定位上,这样的手机有别于既有的纯粹语音的手机(Voice ...

  5. 智能型手机中的音频设计(转)

    当手机不断地整合包括照相.游戏.数据.视频等各种功能于一身时,它已摇身变成一个多媒体应用的播放平台,可说是朝细致而微的随身型迷你计算机发展.在定位上,这样的手机有别于既有的纯粹语音的手机(Voice ...

  6. 音频Codec标准组织

    国内音频Codec相关产品之前一直使用国外的IP技术,需要给国外标准制定的公司交专利费.中美贸易战之后,也就是从2019年开始,国内的音频标准不断加速,到2022年我们已经有自主研发的音频编解码标准了 ...

  7. java做直播需要哪些技术_直播APP开发中需要解决哪些技术难点?千联信息

    泛娱乐发展的火热,网红经济不断发酵的今天,不少企业靠着开发直播APP狠狠的赚了一波,导致很多人眼红,也想投入其中. 那么开发一款直播APP开发中需要解决哪些技术难点?小编在这里就来为大家解答: 视频直 ...

  8. Windows上的音频采集技术

    在制作发布端的时候,需要采集到声卡的输出信号,以便与麦克风的输入信号进行混音,对于音频处理的技术,主要有如下几种: 采集麦克风输入 采集声卡输出 将音频数据送入声卡进行播放 对多路音频输入进行混音处理 ...

  9. 网易云信亮相LiveVideoStackCon2020,分享RTC中AI音频算法产品化经验

    10月31日-11月1日,LiveVideoStackCon2020音视频技术大会在北京隆重举办.本次大会以"多媒体开启新视界"为主题,聚焦在音频.视频.图像等技术的最新探索与应用 ...

  10. p2p网络中的NAT穿透技术----常见NAT穿越解决方案

    p2p网络中的NAT穿透技术----常见NAT穿越解决方案 常见NA丁穿越解决方案 NAT技术在缓解IPv4地址紧缺问题.构建防火墙.保证网络安全等方面都发挥了重要 作用.然而,NAT设备的广一泛存在 ...

最新文章

  1. 如何优化你的网站快速提高流量
  2. 熟悉常用的Linux命令操作
  3. Eclipse的JQuery提示插件-Spket(别试了,没什么效果,且安装设置麻烦)
  4. python后端服务器_毕设里配合Python后端使用的所谓”CGI服务器“
  5. Mysql数据类型之浮点与二进制型数据使用案例总结
  6. 张似玫计算机系,计算机系举办“音律飞扬”卡拉OK大赛决赛
  7. centos安装Python2.7
  8. Http 请求处理流程[转]
  9. 知网搜索论文:如何在知网上查找期刊论文
  10. Xilinx IP核 之DDS
  11. 21种网页在线客服代码实例演示
  12. 码栈——让一切变得自动化
  13. java日历数据_JAVA 常用数据类型 之日历类
  14. silvaco-mobility models(1)
  15. Roslyn 如何获得一个类的引用
  16. oracle数据库的关于建表的sql语句练习
  17. 【推理引擎】ONNXRuntime 的架构设计
  18. 小程序弹框wx.showModal、wx.showActionSheet、wx.showToast
  19. 基于python Moviepy的视频字幕识别和合成!
  20. 自然语言处理(九)——数据平滑

热门文章

  1. 爱尔兰圣三一大学计算机专业硕士,爱尔兰圣三一学院研究生申请要求
  2. 机器人 知乎碧桂园_杨国强森林城市与机器人跃进后的“梦醒时分”
  3. python异常类父类_python【第五篇】异常处理
  4. [NOIp2017 DG Day 2 T1] 奶酪
  5. window下环境变量立即生效
  6. Intellij IDEA问题解决合集
  7. 利用openmp实现矩阵相乘_矩阵快速幂
  8. java spark命令行执行参数
  9. 两组基下有相同坐标的向量_特征向量与线性变换
  10. mysql多张表join_Mysql 多表连接查询 inner join 和 outer join 的使用