本文目的:

1、熟悉G711a/u两种格式的基本原理

2、熟悉两种压缩算法的实现步骤及提供源码实现

它是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-code modulation)抽样标准,主要用于电话。它主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。 起压缩率为1:2, 即把16位数据压缩成8位。G.711是主流的波形声音编解码器。
G.711 标准下主要有两种压缩算法。一种是u-law algorithm (又称often u-law, ulaw, mu-law),主要运用于北美和日本;另一种是A-law algorithm,主要运用于欧洲和世界其他地区。其中,后者是特别设计用来方便计算机处理的

G711的内容是将14bit(uLaw)或者13bit(aLaw)采样的PCM数据编码成8bit的数据流,播放的时候在将此8bit的数据还原成14bit或者13bit进行播放,不同于MPEG这种对于整体或者一段数据进行考虑再进行编解码的做法,G711是波形编解码算法,就是一个sample对应一个编码,所以压缩比固定为:

8/14 = 57%  (uLaw)

8/13 = 62%  (aLaw)

G.711就是语音模拟信号的一种非线性量化, bitrate 是64kbps. 详细的资料可以在ITU 上下到相关的spec,下面主要列出一些性能参数:
G.711(PCM方式)
• 采样率:8kHz
• 信息量:64kbps/channel
• 理论延迟:0.125msec
• 品质:MOS值4.10

算法原理:

A-law的公式如下,一般采用A=87.6

画出图来则是如下图,用x表示输入的采样值,F(x)表示通过A-law变换后的采样值,y是对F(x)进行量化后的采样值。

由此可见在输入的x为高值的时候,F(x)的变化是缓慢的,有较大范围的x对应的F(x)最终被量化为同一个y,精度较低。相反在低声强区域,也就是x为低值的时候,F(x)的变化很剧烈,有较少的不同x对应的F(x)被量化为同一个y。意思就是说在声音比较小的区域,精度较高,便于区分,而声音比较大的区域,精度不是那么高。

对应解码公式(即上面函数的反函数):

G711A(A-LAW)压缩十三折线法

g711a输入的是13位(S16的高13位),这种格式是经过特别设计的,便于数字设备进行快速运算。

1、取符号位并取反得到s
2、获取强度位eee,获取方法如图所示
3、获取高位样本位wxyz
4、组合为seeewxyz,将seeewxyz逢偶数为取补数,编码完毕

A-law如下表计算,第一列是采样点,共13bit,最高位为符号位。对于前两行,折线斜率均为1/2,跟负半段的相应区域位于同一段折线上,对于3到8行,斜率分别是1/4到1/128,共6段折线,加上负半段对应的6段折线,总共13段折线,这就是所谓的A-law十三段折线法。

示例:

输入pcm数据为1234,二进制对应为(0000 0100 1101 0010)
      二进制变换下排列组合方式(0 00001 0011 010010)
    1、获取符号位最高位为0,取反,s=1
    2、获取强度位00001,查表,编码制应该是eee=011
    3、获取高位样本wxyz=0011
    4、组合为10110011,逢偶数为取反为11100110,得到E6

#define   SIGN_BIT    (0x80)      /* Sign bit for a A-law byte. */
#define QUANT_MASK  (0xf)       /* Quantization field mask. */
#define NSEGS       (8)     /* Number of A-law segments. */
#define SEG_SHIFT   (4)     /* Left shift for segment number. */
#define SEG_MASK    (0x70)      /* Segment field mask. */
static int seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF,0x1FF, 0x3FF, 0x7FF, 0xFFF};
static int seg_uend[8] = {0x3F, 0x7F, 0xFF, 0x1FF,0x3FF, 0x7FF, 0xFFF, 0x1FFF};static int search(int val,  /* changed from "short" *drago* */int *   table,int size) /* changed from "short" *drago* */
{int i;     /* changed from "short" *drago* */for (i = 0; i < size; i++) {if (val <= *table++)return (i);}return (size);
}int linear2alaw(int    pcm_val)        /* 2's complement (16-bit range) *//* changed from "short" *drago* */
{int        mask;   /* changed from "short" *drago* */int     seg;    /* changed from "short" *drago* */int     aval;pcm_val = pcm_val >> 3;//这里右移3位,因为采样值是16bit,而A-law是13bit,存储在高13位上,低3位被舍弃if (pcm_val >= 0) {mask = 0xD5;        /* sign (7th) bit = 1 二进制的11010101*/} else {mask = 0x55;      /* sign bit = 0  二进制的01010101*/pcm_val = -pcm_val - 1; //负数转换为正数计算}/* Convert the scaled magnitude to segment number. */seg = search(pcm_val, seg_aend, 8); //查找采样值对应哪一段折线/* Combine the sign, segment, and quantization bits. */if (seg >= 8)       /* out of range, return maximum value. */return (0x7F ^ mask);else {
//以下按照表格第一二列进行处理,低4位是数据,5~7位是指数,最高位是符号aval = seg << SEG_SHIFT;if (seg < 2)aval |= (pcm_val >> 1) & QUANT_MASK;elseaval |= (pcm_val >> seg) & QUANT_MASK;return (aval ^ mask);}
}

int alaw2linear(int  a_val)
{int        t;      /* changed from "short" *drago* */int     seg;    /* changed from "short" *drago* */a_val ^= 0x55; //异或操作把mask还原t = (a_val & QUANT_MASK) << 4;//取低4位,即表中的abcd值,然后左移4位变成abcd0000seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT; //取中间3位,指数部分switch (seg) {case 0: //表中第一行,abcd0000 -> abcd1000t += 8;break;case 1: //表中第二行,abcd0000 -> 1abcd1000t += 0x108;break;default://表中其他行,abcd0000 -> 1abcd1000 的基础上继续左移(按照表格第二三列进行处理)t += 0x108;t <<= seg - 1;}return ((a_val & SIGN_BIT) ? t : -t);
}

u-law也叫g711u,使用在北美和日本,输入的是14位,编码算法就是查表,计算出:基础值+平均偏移值没啥复杂算法,就是基础值+平均偏移值,

μ-law的公式如下,μ取值一般为255

相应的μ-law的计算方法如下表

示例:

输入pcm数据为1234
    1、取得范围值,查表得 +2014 to +991 in 16 intervals of 64
    2、得到基础值为0xA0
    3、得到间隔数为64
    4、得到区间基本值2014
    5、当前值1234和区间基本值差异2014-1234=780
    6、偏移值=780/间隔数=780/64,取整得到12
    7、输出为0xA0+12=0xAC

#define BIAS        (0x84)      /* Bias for linear code. 线性码偏移值*/
#define CLIP            8159    //最大量化级数量int linear2ulaw( int   pcm_val)    /* 2's complement (16-bit range) */
{int        mask;int        seg;int     uval;/* Get the sign and the magnitude of the value. */pcm_val = pcm_val >> 2;if (pcm_val < 0) {pcm_val = -pcm_val;mask = 0x7F;} else {mask = 0xFF;}if ( pcm_val > CLIP ) pcm_val = CLIP;      /* clip the magnitude 削波*/pcm_val += (BIAS >> 2);/* Convert the scaled magnitude to segment number. */seg = search(pcm_val, seg_uend, 8);/** Combine the sign, segment, quantization bits;* and complement the code word.*/if (seg >= 8)       /* out of range, return maximum value. */return (0x7F ^ mask);else {uval = (seg << 4) | ((pcm_val >> (seg + 1)) & 0xF);return (uval ^ mask);}}int ulaw2linear( int    u_val)
{int t;/* Complement to obtain normal u-law value. */u_val = ~u_val;/** Extract and bias the quantization bits. Then* shift up by the segment number and subtract out the bias.*/t = ((u_val & QUANT_MASK) << 3) + BIAS;t <<= (u_val & SEG_MASK) >> SEG_SHIFT;return ((u_val & SIGN_BIT) ? (BIAS - t) : (t - BIAS));
}

和A-law画在同一个坐标轴中就能发现A-law在低强度信号下,精度要稍微高一些。

以上是两种算法的连续条件下的计算公式,实际应用中,我们确实可以用浮点数计算的方式把F(x)结果计算出来,然后进行量化,但是这样一来计算量会比较大,实际上对于A-law(A=87.6时),是采用13折线近似的方式来计算的,而μ-law(μ=255时)则是15段折线近似的方式。

参考:

https://en.wikipedia.org/wiki/A-law_algorithm

https://github.com/quatanium/foscam-ios-sdk/blob/master/g726lib/g711.c

https://www.cnblogs.com/charybdis/p/8848457.html

http://www.21ic.com/evm/audio/201705/721797.htm

【音频】G711编码原理相关推荐

  1. G711编码原理及代码

    G711编码的声音清晰度好,语音自然度高,但压缩效率低,数据量大常在32Kbps以上.常用于电话语音(推荐使用64Kbps),sampling rate为8K,压缩率为2,即把S16格式的数据压缩为8 ...

  2. 【Android音视频开发】音频编码原理

    文章变更表 文章版本号 变更内容 变更日期 备注 0.0.1 创建 2022/9/29 初版 0.0.2 补充编码原理和音频格式等内容 2022/9/30 1. 前言 在[Android音视频开发] ...

  3. 数据压缩(十三)——MPEG音频编码原理及编码器调试

    文章目录 一.MPEG音频编码原理 1.1 基本思想 1.2 心理声学模型(Psychoacoustic model) 1.2.1 听觉阈值 1.2.2 频域掩蔽 1.3 临界频带(Critical ...

  4. 即时通讯音视频开发(七):音频基础及编码原理入门

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  5. G711(G711a+g711u)编码原理及代码

    G711编码的声音清晰度好,语音自然度高,但压缩效率低,数据量大常在32Kbps以上.常用于电话语音(推荐使用64Kbps),sampling rate为8K,压缩率为2,即把S16格式的数据压缩为8 ...

  6. 利用FFmpeg编码器将JPG图片进行H.264编码原理

    利用FFmpeg编码器将JPG图片进行H.264编码原理 文章目录 利用FFmpeg编码器将JPG图片进行H.264编码原理 整体的编码流程 将JPG或BMP编码为YUV 利用FFmpeg将YUV格式 ...

  7. 看完就懂的《H264编码原理及框图》

    H264编码原理及框图 ------------ 分析H264原理: H264是新一代的编码标准,以高压缩高质量和支持多重网络的流媒体著称,在编码上,主要是以下理解:参照一段时间内图像的统计结果表明, ...

  8. 深入讲解音视频编码原理,H264码流详解——手写H264编码器

    音视频高手课08-H264 I帧 P帧 B帧及手写H264编码器 1 三种帧的说明 1.I 帧:帧内编码帧,帧表示关键帧,你可以理解为这一帧画面的完整保留:解码时只需要本帧数据就可以完成(因为包含完整 ...

  9. 拉卡拉手机刷卡器音频通讯技术原理初步分析

    拉卡拉手机刷卡器音频通讯技术原理初步分析  kimmking@163.com http://blog.csdn.net/kimmking/article/details/8712161 1.      ...

  10. MP3文件格式与编码原理解码流程详解

    1 文件格式 MP3文件格式四部分,按顺序排列如下: ID3V2  包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量 Frame  音频帧序列 APEV2  包含了作者,作曲,专辑等 ...

最新文章

  1. 【opencv】8.获取鼠标动作(滑轮滚动,左键按下,右键按下,鼠标移动)并进行相应处理
  2. 为jupyter_notebook增加目录
  3. 牛客2020年愚人节比赛
  4. gzip压缩文件解压文件(gz文件)
  5. python交易_Python实现银行账户资金交易管理系统
  6. 百家与g对比oogle_如何在Java Web应用程序中集成G​​oogle reCAPTCHA
  7. mc用什么版本的java_我的世界网易 Java 版哪个版本比较好?
  8. Spiceworks数据统计:Win10发布半年使用情况
  9. 让win10系统不进行自动更新的方法
  10. 物联网周刊(第 5 期):智能家居入口之争
  11. cmake出错:Building inplace are not allowed. You should create a separate directory for Building.
  12. 通信算法之九:4FSK调制解调仿真链路
  13. DELPHI Webbrowser 响应回车键(EWB响应正常,无需额外代码)
  14. 【Excle数据透视表】如何快速选定数据透视表的汇总行并添加绿色底纹
  15. TeamTalk服务器
  16. python中stringvar的用法_Python tkinter.StringVar方法代码示例
  17. 宝塔php socket,宝塔开启websocket 小程序聊天功能开发
  18. 【马蜂窝游记自动上传】马蜂窝游记采集发布-多账号循环数量发布
  19. 图像处理与计算机视觉的经典书籍
  20. R语言经验累积分布函数计算和绘制实战

热门文章

  1. CentOS8-linux安装 tailf命令
  2. java —— int和byte的相互转化工具方法
  3. 推荐一个在Windows下可以查看文件夹大小的工具TreeSize Free
  4. EMC信号完整性落地实测1---走出玄学
  5. Delphi6.0的那些
  6. 自定义浏览器UA标识
  7. 图像处理之前景检测(三)之码本(codebook)(主要为代码升级)
  8. virtualbox vm 虚拟机 迁移
  9. 南方CASS工程应用--道路断面土方计算实例教程
  10. 百度SEO站群超简约实惠的个人简历模板源码