speex的基本编码和解码流程
最近在研究speex的编码和解码流程
之前在IM上用到的都是发语音片段,这个很简单,只需要找到googlecode上gauss的代码,然后套一下就可以用了。
不过googlecode要关闭,有人将他导入到了github,地址在这里 https://github.com/cczufish/OggSpeex-android
我也导入了,但是没成功,不知道什么问题,可能级别不够吧,哈哈 https://github.com/dongweiq/android-recorder
现在我们的需求是要求将语音片段拼接合成,而且要在UI中显示出正在播放的时间,看了gauss的代码后发现,他的代码是边解码边播放的,按照的是short[160]的片段一个个播放的
1 /* decode each segment, writing output to wav */ 2 for (curseg = 0; curseg < segments; curseg++) { 3 4 if (Thread.interrupted()) { 5 dis.close(); 6 track.stop(); 7 track.release(); 8 return; 9 } 10 11 while (this.isPaused()) { 12 track.stop(); 13 track.release(); 14 // Thread.sleep(100); 15 } 16 17 /* get the number of bytes in the segment */ 18 bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF; 19 if (bodybytes == 255) { 20 System.err.println("sorry, don't handle 255 sizes!"); 21 return; 22 } 23 dis.readFully(payload, 0, bodybytes); 24 chksum = OggCrc.checksum(chksum, payload, 0, bodybytes); 25 26 /* decode the segment */ 27 /* if first packet, read the Speex header */ 28 if (packetNo == 0) { 29 if (readSpeexHeader(payload, 0, bodybytes, true)) { 30 packetNo++; 31 } else { 32 packetNo = 0; 33 } 34 } else if (packetNo == 1) { // Ogg Comment packet 35 packetNo++; 36 } else { 37 38 /* get the amount of decoded data */ 39 short[] decoded = new short[160]; 40 if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) { 41 track.write(decoded, 0, decsize); 42 float maxVol = AudioTrack.getMaxVolume(); 43 track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小 44 track.play(); 45 } 46 packetNo++; 47 } 48 }
而且他还有一个包序号,pacetNo为0则是speex的文件头,占80字节,packetNo为1则查找包序号2,2中就按照160short解码音频,然后播放解码后的wav。
后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/
相当于是对整个speex编码和解码的过程的总结吧
- #include <speex.h>
- #include <stdio.h>
- /*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
- #define FRAME_SIZE 160
- int main(int argc, char **argv)
- {
- char *inFile;
- FILE *fin;
- short in[FRAME_SIZE];
- float input[FRAME_SIZE];
- char cbits[200];
- int nbBytes;
- /*保存编码的状态*/
- void *state;
- /*保存字节因此他们可以被speex常规读写*/
- SpeexBits bits;
- int i, tmp;
- //新建一个新的编码状态在窄宽(narrowband)模式下
- state = speex_encoder_init(&speex_nb_mode);
- //设置质量为8(15kbps)
- tmp=8;
- speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
- inFile = argv[1];
- fin = fopen(inFile, "r");
- //初始化结构使他们保存数据
- speex_bits_init(&bits);
- while (1)
- {
- //读入一帧16bits的声音
- fread(in, sizeof(short), FRAME_SIZE, fin);
- if (feof(fin))
- break;
- //把16bits的值转化为float,以便speex库可以在上面工作
- for (i=0;i<FRAME_SIZE;i++)
- input[i]=in[i];
- //清空这个结构体里所有的字节,以便我们可以编码一个新的帧
- speex_bits_reset(&bits);
- //对帧进行编码
- speex_encode(state, input, &bits);
- //把bits拷贝到一个利用写出的char型数组
- nbBytes = speex_bits_write(&bits, cbits, 200);
- //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
- fwrite(&nbBytes, sizeof(int), 1, stdout);
- //写出压缩后的数组
- fwrite(cbits, 1, nbBytes, stdout);
- }
- //释放编码器状态量
- speex_encoder_destroy(state);
- //释放bit_packing结构
- speex_bits_destroy(&bits);
- fclose(fin);
- return 0;
- }
speex的基本编码和解码流程相关推荐
- MP3文件格式与编码原理解码流程详解
1 文件格式 MP3文件格式四部分,按顺序排列如下: ID3V2 包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量 Frame 音频帧序列 APEV2 包含了作者,作曲,专辑等 ...
- MP3文件结构及编解码流程
http://blog.csdn.net/wlsfling/article/details/5875959 AGENDA * MP3简介 * MP3文件结构 --Tag_v2 ...
- MP3文件格式及编解码流程
一.MP3简介: MP3全称MPEG 1 audio layer 3,其中MPEG(Moving Picture Experts Group)标准包括视频和音频 标准,其中音频标准已制定出 MPEG- ...
- 264编码基本概念 FFMpeg的解码流程
下面转自http://topic.csdn.net/u/20081020/16/7156e0b2-dbfb-4b4f-af59-2be04cf9a420.html 的8楼 1.NAL.Slice与fr ...
- ffmpeg解码流程 turorial5详解
From: http://www.360doc.com/content/11/1117/09/8050095_165108638.shtml FFMPEG解码流程 1. 注册所有容器格式和CODEC: ...
- I帧、B帧和P帧的特点和编码的基本流程
I帧.B帧和P帧的特点: I帧:帧内编码帧 I帧特点: 1.它是一个全帧压缩编码帧.它将全帧图像信息进行JPEG压缩编码及传输; 2.解码时仅用I帧的数据就可重构完整图像; 3.I帧描述了图像背景和运 ...
- H.264编解码流程
编码: 蓝色的前向编码流程: 以宏块为输入单位介绍优于以帧为单位介绍. Fn为即将进行编码的宏块,由原始图像中16*16像素构成.每个宏块要么采用帧内模式编码,要么采用帧间模式编码.不管是哪种编码模式 ...
- java 编码解码_深入解析Java中的编码转换以及编码和解码操作
一.Java编码转换过程 我们总是用一个java类文件和用户进行最直接的交互(输入.输出),这些交互内容包含的文字可能会包含中文.无论这些java类是与数据库交互,还是与前端页面交互,他们的生命周期总 ...
- H.264的编解码流程
H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation).变换(Transform)和反变换.量化(Quantization)和反量化. ...
- 视频编解码(十二):播放器编解码流程source、demux、decoder、output
一.播放器编解码流程source.demux.decoder.output 说白了播放器大致分为4大部分:source.demux.decoder.output. 1.source: 数据源,数据的来 ...
最新文章
- Roadsend PHP-开源的PHP代码编译器
- csh shell_shell编程(一):初始shell
- 关于unity 中使用AssetBundle加载资源,shader偶尔会丢失的问题解决办法
- 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机
- SIFT四部曲之——构建关键点特征描述符
- 新建和发布Windows服务的几个常见问题
- 交换机工作原理_交换机的作用是什么?
- 李猛:从MongoDB迁移到ES后,我们减少了80%的服务器
- tocmat linux搭建测试环境,Apache+Tomcat 环境搭建(JK部署过程)
- mysql多表联合查询事例_MySQL——多表查询详细介绍以及实例
- 深入学习理解UNIX网络编程
- 读文献、写论文时,有什么好用的软件或网站推荐?
- Unity如何将fbx格式模型的材质拆分、编辑模型
- 苹果无线耳机使用方法_苹果手机11新手使用方法
- 2022国庆头像制作iAPP安卓源码+附APP成品
- 嵌入式应用开发在线图书网址
- 高精度结构光工业3D相机Mech-Eye PRO全面升级:可选蓝光/白光版本,适合中距离应用...
- 形式逻辑三大基本要素-推理的本质
- 针对大众点评网上商铺评论字体替换反爬的反反爬
- 微信小程序php get_PHP后台实现微信小程序登录
热门文章
- linux innode节点读取,混沌工程之注入磁盘innode耗尽
- 串口命令自动发送_WIFI模块开发教程之W600基础篇3:串口通讯
- 让计算机工作起来教学反思,计算机教学反思
- python百度关键词爬虫_python批量获取百度关键词相关结果数
- vc调用matlab引擎实时绘图,怎么在vc++里调用matlab绘制spline插值曲线
- android 禁用剪切板_如何阻止应用程序阅读Android剪贴板以保护您的隐私
- 京东方班单片机和c语言,pic单片机c语言程序设计14.pdf
- 结构化和面向对象语言的区别
- MapReduce 的架构
- centos无法启动,修复grub.conf文件