目录

  1. 参考
  2. 概述
  3. G.711原理
  4. 总结

1. 参考

  • [1] wikipedia/A-law_algorithm
  • [2] github.com/quatanium/foscam-ios-sdk
  • [3] charybdis/G711算法学习

2. 概述

本文目的:
1、熟悉G711a/u两种格式的基本原理
2、熟悉两种压缩算法的实现步骤及提供源码实现

G.711是国际电信联盟ITU-T定制出来的一套语音压缩标准,它代表了对数PCM(logarithmic pulse-code modulation)抽样标准,是主流的波形声音编解码标准,主要用于电话。

  1. 主要用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。
  2. 压缩率为1:2, 即把16位成8位。

G.711 标准下主要有两种压缩算法。

  1. u-law algorithm (又称u-law, ulaw, mu-law),主要运用于北美和日本。
  2. A-law algorithm,主要运用于欧洲和世界其他地区。特别设计用来方便计算机处理的。

G.711将14bit(uLaw)或者13bit(aLaw)采样的PCM数据编码成8bit的数据流,播放的时候在将此8bit的数据还原成14bit或者13bit进行播放,不同于MPEG这种对于整体或者一段数据进行考虑再进行编解码的做法,G711是波形编解码算法,就是一个sample对应一个编码,所以压缩比固定为:

  • 8/14 = 57% (uLaw)
  • 8/13 = 62% (aLaw)

3. G.711原理

G.711是将语音模拟信号进行一种非线性量化, 详细的资料可以在ITU 上下到相关的spec 。下面主要列出一些性能参数:
G.711(PCM方式)

  • 采样率:8kHz
  • 信息量:64kbps/channel
  • 理论延迟:0.125msec
  • 品质:MOS值4.10

算法原理:
A-law的公式如下,一般采用A=87.6

画出图来则是如下图,用x表示输入的采样值,F(x)表示通过A-law变换后的采样值,y是对F(x)进行量化后的采样值。

由此可见

  • 在输入的x为高值的时候,F(x)的变化是缓慢的,有较大范围的x对应的F(x)最终被量化为同一个y,精度较低。
  • 相反在低声强区域,也就是x为低值的时候,F(x)的变化很剧烈,有较少的不同x对应的F(x)被量化为同一个y。意思就是说在声音比较小的区域,精度较高。

对应反量化公式(即上面函数的反函数):

3.1 G.711A(A-LAW)压缩十三折线法

G.711A输入的是13位(S16的高13位),这种格式是经过特别设计的,便于数字设备进行快速运算。

  1. 取符号位并取反得到s。
  2. 获取强度位eee,获取方法如下图所示
  3. 获取高位样本位wxyz
  4. 组合为seeewxyz,将seeewxyz逢偶数为取补数。

A-law如下表计算。

  • 第一列是采样点,共13bit,最高位为符号位。
  • 对于前两行,折线斜率均为1/2,跟负半段的相应区域位于同一段折线上。
  • 对于3到8行,斜率分别是1/4到1/128,共6段折线。
  • 总共13段折线,这就是所谓的A-law十三段折线法。

示例:

输入pcm数据为1234,二进制对应为(0000 0100 1101 0010)
二进制变换下排列组合方式(0 00001 0011 010010)
1、获取符号位最高位为0,取反,s=1
2、获取强度位00001,查表,编码制应该是eee=011
3、获取高位样本wxyz=0011
4、组合为10110011,逢偶数为取反为11100110,得到E6

#define SIGN_BIT    (0x80)      /* Sign bit for a A-law byte. */
#define QUANT_MASK  (0xf)       /* Quantization field mask. */
#define NSEGS       (8)     /* Number of A-law segments. */
#define SEG_SHIFT   (4)     /* Left shift for segment number. */
#define SEG_MASK    (0x70)      /* Segment field mask. */
static int seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF,0x1FF, 0x3FF, 0x7FF, 0xFFF};
static int seg_uend[8] = {0x3F, 0x7F, 0xFF, 0x1FF,0x3FF, 0x7FF, 0xFFF, 0x1FFF};static int search(int val,    /* changed from "short" *drago* */int *   table,int size)   /* changed from "short" *drago* */
{int i;      /* changed from "short" *drago* */for (i = 0; i < size; i++) {if (val <= *table++)return (i);}return (size);
}int linear2alaw(int pcm_val)        /* 2's complement (16-bit range) *//* changed from "short" *drago* */
{int     mask;   /* changed from "short" *drago* */int     seg;    /* changed from "short" *drago* */int     aval;pcm_val = pcm_val >> 3;//这里右移3位,因为采样值是16bit,而A-law是13bit,存储在高13位上,低3位被舍弃if (pcm_val >= 0) {mask = 0xD5;        /* sign (7th) bit = 1 二进制的11010101*/} else {mask = 0x55;        /* sign bit = 0  二进制的01010101*/pcm_val = -pcm_val - 1; //负数转换为正数计算}/* Convert the scaled magnitude to segment number. */seg = search(pcm_val, seg_aend, 8); //查找采样值对应哪一段折线/* Combine the sign, segment, and quantization bits. */if (seg >= 8)       /* out of range, return maximum value. */return (0x7F ^ mask);else {
//以下按照表格第一二列进行处理,低4位是数据,5~7位是指数,最高位是符号aval = seg << SEG_SHIFT;if (seg < 2)aval |= (pcm_val >> 1) & QUANT_MASK;elseaval |= (pcm_val >> seg) & QUANT_MASK;return (aval ^ mask);}
}int alaw2linear(int a_val)
{int     t;      /* changed from "short" *drago* */int     seg;    /* changed from "short" *drago* */a_val ^= 0x55; //异或操作把mask还原t = (a_val & QUANT_MASK) << 4;//取低4位,即表中的abcd值,然后左移4位变成abcd0000seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT; //取中间3位,指数部分switch (seg) {case 0: //表中第一行,abcd0000 -> abcd1000t += 8;break;case 1: //表中第二行,abcd0000 -> 1abcd1000t += 0x108;break;default://表中其他行,abcd0000 -> 1abcd1000 的基础上继续左移(按照表格第二三列进行处理)t += 0x108;t <<= seg - 1;}return ((a_val & SIGN_BIT) ? t : -t);
}

3.2 G.711u(u-law)

使用在北美和日本,输入的是14位,编码算法就是查表,计算出:基础值+平均偏移值

μ-law的公式如下,μ取值一般为255

相应的μ-law的计算方法如下表

示例:
输入pcm数据为1234
1、取得范围值,查表得 +2014 to +991 in 16 intervals of 64
2、得到基础值为0xA0
3、得到间隔数为64
4、得到区间基本值2014
5、当前值1234和区间基本值差异2014-1234=780
6、偏移值=780/间隔数=780/64,取整得到12
7、输出为0xA0+12=0xAC

#define BIAS        (0x84)      /* Bias for linear code. 线性码偏移值*/
#define CLIP            8159    //最大量化级数量int linear2ulaw( int    pcm_val)    /* 2's complement (16-bit range) */
{int     mask;int     seg;int     uval;/* Get the sign and the magnitude of the value. */pcm_val = pcm_val >> 2;if (pcm_val < 0) {pcm_val = -pcm_val;mask = 0x7F;} else {mask = 0xFF;}if ( pcm_val > CLIP ) pcm_val = CLIP;       /* clip the magnitude 削波*/pcm_val += (BIAS >> 2);/* Convert the scaled magnitude to segment number. */seg = search(pcm_val, seg_uend, 8);/** Combine the sign, segment, quantization bits;* and complement the code word.*/if (seg >= 8)       /* out of range, return maximum value. */return (0x7F ^ mask);else {uval = (seg << 4) | ((pcm_val >> (seg + 1)) & 0xF);return (uval ^ mask);}}int ulaw2linear( int    u_val)
{int t;/* Complement to obtain normal u-law value. */u_val = ~u_val;/** Extract and bias the quantization bits. Then* shift up by the segment number and subtract out the bias.*/t = ((u_val & QUANT_MASK) << 3) + BIAS;t <<= (u_val & SEG_MASK) >> SEG_SHIFT;return ((u_val & SIGN_BIT) ? (BIAS - t) : (t - BIAS));
}

3.2 A-law和u-law对比

A-law和u-law画在同一个坐标轴中就能发现A-law在低强度信号下,精度要稍微高一些。

实际应用中,我们确实可以用浮点数计算的方式把F(x)结果计算出来,然后进行量化,但是这样一来计算量会比较大,实际上对于A-law(A=87.6时),是采用13折线近似的方式来计算的,而μ-law(μ=255时)则是15段折线近似的方式。

4. 总结

G711尽管是一种非常古老的话音编码算法,原理和计算也比较简单,但是其中用到的一些基本原理同样在其他编码算法中得到了应用,对其进行深入的了解有助于更好的理解其他的算法。

链接:https://www.jianshu.com/p/512ce6566f8a



G711和PCM 的互转

//http://www.easydarwin.org/article/Streaming/38.html               参考文章
//https://github.com/EasyDarwin/EasyAACEncoder/blob/master/g711.cpp
//http://www.oschina.net/code/snippet_1173523_38946
//http://blog.csdn.net/rightorwrong/article/details/4209467  PCM 2 G711  G711 2 PCM unsigned char encode(short pcm);
short decode(unsigned char alaw);/** 个人理解* bitsize 应该为16, pBuffer(pcm数据) 两个char 合成一个 short ,长度自然就是原来的一半(nBufferSize/2),* 通过编码后short类型的数据变为char类型,让后复制给pCodecBits*/
int g711_encode(unsigned char* pCodecBits, const char* pBuffer, int nBufferSize)
{short* buffer = (short*)pBuffer;int i;for(i=0; i<nBufferSize/2; i++){pCodecBits[i] = encode(buffer[i]);}return nBufferSize/2;
}
/** 个人理解* bitsize 应该为16, pcm 数组的宽度变为原来两倍(short *out_data = (short*)pRawData;),* 通过对pBuffer(g711数据)中char解码转为两个字节的short ,后复制给out_data数组, 在使用的时候又转为char类型, 则 解码后的数据就是原来的两倍(nBufferSize*2)*/
int g711_decode(char* pRawData, const unsigned char* pBuffer, int nBufferSize)
{short *out_data = (short*)pRawData;int i;for(i=0; i<nBufferSize; i++){out_data[i] = decode(pBuffer[i]);}return nBufferSize*2;
}
#define MAX 32635
unsigned char encode(short pcm)
{int sign = (pcm & 0x8000) >> 8;if (sign != 0)pcm = -pcm;if (pcm > MAX) pcm = MAX;int exponent = 7;int expMask;for (expMask = 0x4000; (pcm & expMask) == 0&& exponent>0; exponent--, expMask >>= 1) { }int mantissa = (pcm >> ((exponent == 0) ? 4 : (exponent + 3))) & 0x0f;unsigned char alaw = (unsigned char)(sign | exponent << 4 | mantissa);return (unsigned char)(alaw^0xD5);
}
short decode(unsigned char alaw)
{alaw ^= 0xD5;int sign = alaw & 0x80;int exponent = (alaw & 0x70) >> 4;int data = alaw & 0x0f;data <<= 4;data += 8;if (exponent != 0)data += 0x100;if (exponent > 1)data <<= (exponent - 1);return (short)(sign == 0 ? data : -data);
}

G711 -> PCM

JNIEXPORT void JNICALL Java_com_ff_aacdemo_jni_G711Coder_g711Topcm(JNIEnv *env, jobject obj){FILE* fpOut = fopen("/storage/emulated/0/t/pcm_to_g711.pcm", "wb");FILE* fpIn = fopen("/storage/emulated/0/t/pcm_to_g711.g711", "rb");//g711格式文件在最后会给出连接int g711_BufferSize = 1024;char g711_Buffer[g711_BufferSize];int len;while((len = fread(g711_Buffer, 1, g711_BufferSize, fpIn)) > 0){LOGD("g711topcm length = %d", len);char pcmBuffer[len];int pcmbufsize = g711_decode(pcmBuffer, g711_Buffer, len);fwrite(pcmBuffer, 1, pcmbufsize, fpOut);}LOGD("g711topcm end");fclose(fpIn);fclose(fpOut);
}

PCM -> G711

JNIEXPORT void JNICALL Java_com_ff_aacdemo_jni_G711Coder_pcmTog711(JNIEnv *env, jobject obj){FILE* fpIn = fopen("/storage/emulated/0/t/pcm_to_g711.pcm", "rb");FILE* fpOut = fopen("/storage/emulated/0/t/pcm_to_g711.g711", "wb");LOGD("pcmTog711 1");int pcm_BufferSize = 1024;char pcm_Buffer[pcm_BufferSize];int len;while((len = fread(pcm_Buffer, 1, pcm_BufferSize, fpIn)) > 0){LOGD("pcmTog711 length = %d", len);char g711Buffer[len];int  g711BufSize = g711_encode(g711Buffer, pcm_Buffer, len);fwrite(g711Buffer, 1, g711BufSize, fpOut);}LOGD("pcmTog711 end");fclose(fpIn);fclose(fpOut);
}

虽然能够实现他们的相互转换, 可是,不怎么好找到播放器播放, 效果始终没有验证, 在下一章中, 将总结将 G711 转换为 AAC , AAC这种格式将能够使用常规的播放器进行播放

原文链接:https://blog.csdn.net/qq_24551315/article/details/51134689


 G711 -> PCMpublic static byte[] convertG711ToPcm(byte[] g711Buffer, int length, byte[] pcmBuffer){if (pcmBuffer == null){pcmBuffer = new byte[length*2];}for (int i=0; i<length; i++){byte alaw = g711Buffer[i];alaw ^= 0xD5;int sign     =  alaw & 0x80;int exponent = (alaw & 0x70) >> 4;// 这个移位多此一举?结果应该一直是8int value    = (alaw & 0x0F) >> 4 + 8;if (exponent != 0){value += 0x0100;}if (exponent > 1){value <<= (exponent - 1);}value = (char)((sign == 0 ? value : -value) & 0xFFFF);pcmBuffer[i*2+0] = (byte) (value      & 0xFF);pcmBuffer[i*2+1] = (byte) (value >> 8 & 0xFF);}return pcmBuffer;}

G.711 音频编码相关推荐

  1. Android G.711音频编解码

    需求背景: 博主目前所在的公司是一家做视频通讯的公司,所以对音频,视频这一块对编码方式都有一定的要求,由于之前一直没有接触JNI这一块,突然让我去做音频的转码还是有一定的苦难的.一开始对于JNI编程我 ...

  2. 音频编码-G.711

    ​G.711是一种窄带音频编解码器,最初设计用于提供 64 kbit/s 的长途质量音频的电话.G.711 传递 300–3400 Hz 范围内的音频信号,并以每秒 8,000 个样本的速率对其进行采 ...

  3. G.711是一种由国际电信联盟(ITU-T)制定的音频编码方式

    http://zh.wikipedia.org/zh-cn/G.711 ITU-T G.711 page ITU-T G.191 software tools for speech and audio ...

  4. G.7xx的音频编码方式与带宽计算

    本文转之"weixin_30527551"作者的[WebRTC]术语 G.711  G.722 G.711  G.722是G系列的语音编码中宽带的编码方式. G.711 由国际电信 ...

  5. 音频编解码标准G.711与G.729

    G.711和G.729协议是两对用于语音压缩的编码方案,两者具有一些相似之处,但不同于完全自由使用的G.711,使用G.729是需要付费的,而且,对于使用G.729的情况,CPU占有时间大约为G.71 ...

  6. 音频编解码G.711 G.729 G.723带宽问题

    1.分包发送,G.711每20ms打包一次,G.729每20ms,G.723每30ms 2.每个包由包头和有效载荷组成,有效载荷即音频数据 3.包头由以下组成,共66 Byte,528 bit Eth ...

  7. 音频编码标准发展现状

    一.概述 音频信号数字化之后所面临的一个问题是巨大的数据量,这为存储和传输带来了压力.例如,对于CD音质的数字音频,所用的采样频率为44.1 kHz,量化精度为16bit:采用双声道立体声时,其数码率 ...

  8. G.726音频编解码原理介绍

    一.PCM 脉冲编码调制(Pulse-code modulation,PCM)是一种模拟信号的数码化方法.PCM将信号的强度依照同样的间距分成数段,然后用独特的数码记号(通常是二进制)来量化.PCM常 ...

  9. G.7xx 音频压缩标准

    G.7xx 是一组 ITU-T 标准,用于音频压缩和解压缩.它主要用于电话方面.在电话技术中,有两个主要的算法标准,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使 ...

最新文章

  1. Spring+SpringMVC+Mybatis整合
  2. python numpy 奇数偶数行互换_python 列表推导式(经典代码)(21)
  3. IT十八掌作业_java基础第十六天_GUI/socket
  4. 原创跑酷小游戏《Cube Duck Run》 - - 方块鸭快跑
  5. 独立成分分析 ( ICA ) 与主成分分析 ( PCA ) 的区别
  6. sharepoint简单说明
  7. 48 SD配置-定价配置-定义条件表
  8. python代码大全和用法用量_python零基础入门命令方式汇总大全,快速恶补你的Python基础...
  9. LaTeX中巨算符下面输入两行内容的方法
  10. kbhit linux windows通用,linux模拟windows的kbhit
  11. springmvc源码阅读3--dispatcherServlet reqeust的执行流程
  12. Hibernate 对c3p0配置不支持导致的错误
  13. html中展开的小箭头,HTML5 移动网页应用中的展开式标签(带上下指示箭头)
  14. LitePal(版本1.5.0,写此博客时是最新版本)
  15. maven 构建spring boot + mysql 的基础项目
  16. Linux GCC make文件的写法4--清晰版
  17. android获取悬浮窗权限,Android 悬浮窗权限校验
  18. Multi-level learning based memetic algorithm for community detection笔记
  19. 2021最全最新java学习指南(第1-5节),干货必须分享!
  20. 常用英语前缀和全部英语前缀——138个

热门文章

  1. python3爬取微博评论并存为xlsx
  2. 为什么越来越多的企业使用106短信平台?
  3. 字节流、字符流(精细讲解)
  4. 未能找到任何适合于指定的区域性或非特定区域性的资源
  5. python深度学习--将一维数字标签映射为二维独热码
  6. java计算机毕业设计基于springboo+vue的汉服文化宣传活动交流网站(汉服社团)
  7. Starling Button
  8. 基于NPOI用C#开发的Excel以及表格设置
  9. oracle rdbms包括,Oracle RDBMS的封锁类型有哪些?
  10. Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion