speex的基本编码和解码流程

最近在研究speex的编码和解码流程

之前在IM上用到的都是发语音片段，这个很简单，只需要找到googlecode上gauss的代码，然后套一下就可以用了。

不过googlecode要关闭，有人将他导入到了github，地址在这里 https://github.com/cczufish/OggSpeex-android

我也导入了，但是没成功，不知道什么问题，可能级别不够吧，哈哈 https://github.com/dongweiq/android-recorder

现在我们的需求是要求将语音片段拼接合成，而且要在UI中显示出正在播放的时间，看了gauss的代码后发现，他的代码是边解码边播放的，按照的是short[160]的片段一个个播放的

 1 /* decode each segment, writing output to wav */
 2                 for (curseg = 0; curseg < segments; curseg++) {
 3
 4                     if (Thread.interrupted()) {
 5                         dis.close();
 6                         track.stop();
 7                         track.release();
 8                         return;
 9                     }
10
11                     while (this.isPaused()) {
12                         track.stop();
13                         track.release();
14                         // Thread.sleep(100);
15                     }
16
17                     /* get the number of bytes in the segment */
18                     bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF;
19                     if (bodybytes == 255) {
20                         System.err.println("sorry, don't handle 255 sizes!");
21                         return;
22                     }
23                     dis.readFully(payload, 0, bodybytes);
24                     chksum = OggCrc.checksum(chksum, payload, 0, bodybytes);
25
26                     /* decode the segment */
27                     /* if first packet, read the Speex header */
28                     if (packetNo == 0) {
29                         if (readSpeexHeader(payload, 0, bodybytes, true)) {
30                             packetNo++;
31                         } else {
32                             packetNo = 0;
33                         }
34                     } else if (packetNo == 1) { // Ogg Comment packet
35                         packetNo++;
36                     } else {
37
38                         /* get the amount of decoded data */
39                         short[] decoded = new short[160];
40                         if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) {
41                             track.write(decoded, 0, decsize);
42                             float maxVol = AudioTrack.getMaxVolume();
43                             track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小
44                             track.play();
45                         }
46                         packetNo++;
47                     }
48                 }

而且他还有一个包序号，pacetNo为0则是speex的文件头，占80字节，packetNo为1则查找包序号2，2中就按照160short解码音频，然后播放解码后的wav。

后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/

相当于是对整个speex编码和解码的过程的总结吧

一：编码流程

使用Speex的API函数对音频数据进行压缩编码要经过如下步骤：

1、定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。

2、调用speex_bits_init(&bits)初始化bits。

3、调用speex_encoder_init(&speex_nb_mode)来初始化enc_state。其中speex_nb_mode是SpeexMode类型的变量，表示的是窄带模式。还有speex_wb_mode表示宽带模式、speex_uwb_mode表示超宽带模式。

4、调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数，其中参数state表示编码器的状态；参数request表示要定义的参数类型，如SPEEX_ GET_ FRAME_SIZE表示设置帧大小，SPEEX_ SET_QUALITY表示量化大小，这决定了编码的质量；参数ptr表示要设定的值。

可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。

5、初始化完毕后，对每一帧声音作如下处理：调用函数 speex_bits_reset(&bits)再次设定SpeexBits，然后调用函数speex_encode(enc_state, input_frame, &bits)，参数bits中保存编码后的数据流。

6、编码结束后，调用函数speex_bits_destroy (&bits)， speex_encoder_destroy (enc_state)来

二：解码流程

同样，对已经编码过的音频数据进行解码要经过以下步骤：

1、定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。

2、调用speex_bits_init(&bits)初始化bits。

3、调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。

4、调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。

5、调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码，参数out中保存解码后的数据流。

6、调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。

下面是一段实例代码：

#include <speex.h>
#include <stdio.h>
/*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
#define FRAME_SIZE 160
int main(int argc, char **argv)
{
1. char *inFile;
2. FILE *fin;
3. short in[FRAME_SIZE];
4. float input[FRAME_SIZE];
5. char cbits[200];
6. int nbBytes;
7. /*保存编码的状态*/
8. void *state;
9. /*保存字节因此他们可以被speex常规读写*/
10. SpeexBits bits;
11. int i, tmp;
12. //新建一个新的编码状态在窄宽(narrowband)模式下
13. state = speex_encoder_init(&speex_nb_mode);
14. //设置质量为8(15kbps)
15. tmp=8;
16. speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
17. inFile = argv[1];
18. fin = fopen(inFile, "r");
19. //初始化结构使他们保存数据
20. speex_bits_init(&bits);
21. while (1)
22. {
  1. //读入一帧16bits的声音
  2. fread(in, sizeof(short), FRAME_SIZE, fin);
  3. if (feof(fin))
    1. break;
  4. //把16bits的值转化为float,以便speex库可以在上面工作
  5. for (i=0;i<FRAME_SIZE;i++)
    1. input[i]=in[i];
  6. //清空这个结构体里所有的字节,以便我们可以编码一个新的帧
  7. speex_bits_reset(&bits);
  8. //对帧进行编码
  9. speex_encode(state, input, &bits);
  10. //把bits拷贝到一个利用写出的char型数组
  11. nbBytes = speex_bits_write(&bits, cbits, 200);
  12. //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
  13. fwrite(&nbBytes, sizeof(int), 1, stdout);
  14. //写出压缩后的数组
  15. fwrite(cbits, 1, nbBytes, stdout);
23. }
24. //释放编码器状态量
25. speex_encoder_destroy(state);
26. //释放bit_packing结构
27. speex_bits_destroy(&bits);
28. fclose(fin);
29. return 0;
}

speex的基本编码和解码流程相关推荐

MP3文件格式与编码原理解码流程详解
1 文件格式 MP3文件格式四部分,按顺序排列如下: ID3V2 包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量 Frame 音频帧序列 APEV2 包含了作者,作曲,专辑等 ...
MP3文件结构及编解码流程
http://blog.csdn.net/wlsfling/article/details/5875959 AGENDA * MP3简介 * MP3文件结构 --Tag_v2 ...
MP3文件格式及编解码流程
一.MP3简介: MP3全称MPEG 1 audio layer 3,其中MPEG(Moving Picture Experts Group)标准包括视频和音频标准,其中音频标准已制定出 MPEG- ...
264编码基本概念 FFMpeg的解码流程
下面转自http://topic.csdn.net/u/20081020/16/7156e0b2-dbfb-4b4f-af59-2be04cf9a420.html 的8楼 1.NAL.Slice与fr ...
ffmpeg解码流程 turorial5详解
From: http://www.360doc.com/content/11/1117/09/8050095_165108638.shtml FFMPEG解码流程 1. 注册所有容器格式和CODEC: ...
I帧、B帧和P帧的特点和编码的基本流程
I帧.B帧和P帧的特点: I帧:帧内编码帧 I帧特点: 1.它是一个全帧压缩编码帧.它将全帧图像信息进行JPEG压缩编码及传输; 2.解码时仅用I帧的数据就可重构完整图像; 3.I帧描述了图像背景和运 ...
H.264编解码流程
编码: 蓝色的前向编码流程: 以宏块为输入单位介绍优于以帧为单位介绍. Fn为即将进行编码的宏块,由原始图像中16*16像素构成.每个宏块要么采用帧内模式编码,要么采用帧间模式编码.不管是哪种编码模式 ...
java 编码解码_深入解析Java中的编码转换以及编码和解码操作
一.Java编码转换过程我们总是用一个java类文件和用户进行最直接的交互(输入.输出),这些交互内容包含的文字可能会包含中文.无论这些java类是与数据库交互,还是与前端页面交互,他们的生命周期总 ...
H.264的编解码流程
H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation).变换(Transform)和反变换.量化(Quantization)和反量化. ...
视频编解码（十二）：播放器编解码流程source、demux、decoder、output
一.播放器编解码流程source.demux.decoder.output 说白了播放器大致分为4大部分:source.demux.decoder.output. 1.source: 数据源,数据的来 ...

speex的基本编码和解码流程

speex的基本编码和解码流程相关推荐

最新文章

热门文章