=====================================================
视音频编解码学习工程系列文章列表:

视音频编解码学习工程:H.264分析器

视音频编解码学习工程:AAC格式分析器

视音频编解码学习工程:FLV封装格式分析器

视音频编解码学习工程:TS封装格式分析器

视音频编解码学习工程:JPEG分析器

=====================================================

本文介绍一个自己的开源小项目:FLV封装格式分析器。FLV全称是Flash Video,是互联网上使用极为广泛的视频封装格式。像Youtube,优酷这类视频网站,都使用FLV封装视频。我这个项目规模不大,主要可以用来学习FLV封装格式结构。此外它还支持分离FLV中的视频流和音频流。使用VC 2010的MFC开发完成。在对FLV进行视音频分离的过程中,用到了一个Github开源小工程:flvparse。在此插一句:我发现Github上优秀的东西真的还是挺多的,许多零散的小工程,效果都很不错。这个flvparse做的就不错。

软件的exe以及源代码已经上传到了SourceForge上。和之前的H.264码流分析器一样,增加了一个英文界面,紧跟国际潮流~

项目地址:https://sourceforge.net/projects/flvformatanalysis/

CSDN下载地址(程序+源代码):http://download.csdn.net/detail/leixiaohua1020/6838805

更新记录==============================

1.1版(2014.7.8)

* 更换了界面

* 原工程支持Unicode编码

* 支持中英文切换

CSDN源代码:http://download.csdn.net/detail/leixiaohua1020/7767613

PUDN源代码:http://www.pudn.com/downloads644/sourcecode/multimedia/detail2605189.html

软件使用介绍

软件的使用相当简单。

软件运行后,首先打开一个FLV文件。单击“开始”,可以解析出一系列Tag,列表显示在软件右侧,不同种类的Tag被标记成了不同的颜色。软件的左侧,显示了FLV文件头信息,以及Tag头信息。

英文界面

注:如果勾选上“输出视频”,“输出音频”的话,可以输出分离后的视频流和音频流。在这里要注意的是音频支持MP3格式,AAC格式貌似有点问题。

软件源代码简析

源代码方面和普通的MFC程序差不太多,懂得MFC的人应该很快就能看懂。唯一比较特殊的地方,就在于对开源项目flvparse进行了一些改动,在此就不细说了。注释方面还是很充分的。

如果有什么使用问题,可以反馈给我,以后有时间进行修改升级。

更新(2014.8.12)================================

FLV封装原理

FLV格式的封装原理,贴上来辅助学习之用。

FLV(Flash Video)是Adobe公司设计开发的一种流行的流媒体格式,由于其视频文件体积轻巧、封装简单等特点,使其很适合在互联网上进行应用。此外,FLV可以使用Flash Player进行播放,而Flash Player插件已经安装在全世界绝大部分浏览器上,这使得通过网页播放FLV视频十分容易。目前主流的视频网站如优酷网,土豆网,乐视网等网站无一例外地使用了FLV格式。FLV封装格式的文件后缀通常为“.flv”。

总体上看,FLV包括文件头(File Header)和文件体(File Body)两部分,其中文件体由一系列的Tag组成。因此一个FLV文件是如图1结构。

图1.文件结构(简图)

其中,每个Tag前面还包含了Previous Tag Size字段,表示前面一个Tag的大小。Tag的类型可以是视频、音频和Script,每个Tag只能包含以上三种类型的数据中的一种。图2展示了FLV文件的详细结构。

图2.FLV文件结构(详图)

下面详细介绍一下三种Tag的Tag Data部分的结构。

(a)Audio Tag Data结构(音频Tag)

音频Tag开始的第1个字节包含了音频数据的参数信息,从第2个字节开始为音频流数据。结构如图3所示。

图3.Audio Tag Data结构

第1个字节的前4位的数值表示了音频编码类型。如表1所示。

表1.音频编码类型

含义

0

Linear PCM,platform endian

1

ADPCM

2

MP3

3

Linear PCM,little endian

4

Nellymoser 16-kHz mono

5

Nellymoser 8-kHz mono

6

Nellymoser

7

G.711 A-law logarithmic PCM

8

G.711 mu-law logarithmic PCM

9

reserved

10

AAC

14

MP3 8-Khz

15

Device-specific sound

第1个字节的第5-6位的数值表示音频采样率。如表2所示。

表2.音频采样率

含义

0

5.5kHz

1

11KHz

2

22 kHz

3

44 kHz

PS:从上表可以发现,FLV封装格式并不支持48KHz的采样率。

第1个字节的第7位表示音频采样精度。如表3所示。

表3.音频采样精度

含义

0

8bits

1

16bits

第1个字节的第8位表示音频类型。

表4. 音频类型

含义

0

sndMono

1

sndStereo

(b)Video Tag Data结构(视频Tag)

视频Tag也用开始的第1个字节包含视频数据的参数信息,从第2个字节为视频流数据。结构如图4所示。

图4.Video Tag Data结构

第1个字节的前4位的数值表示帧类型。如表5所示。

表5.帧类型

含义

1

keyframe (for AVC,a seekable frame)

2

inter frame (for AVC,a nonseekable frame)

3

disposable inter frame (H.263 only)

4

generated keyframe (reserved for server use)

5

video info/command frame

第1个字节的后4位的数值表示视频编码类型。如表6所示。

表6.视频编码类型

含义

1

JPEG (currently unused)

2

Sorenson H.263

3

Screen video

4

On2 VP6

5

On2 VP6 with alpha channel

6

Screen video version 2

7

AVC

(c)Script Tag Data结构(控制帧)

该类型Tag又通常被称为Metadata Tag,会放一些关于FLV视频和音频的元数据信息如:duration、width、height等。通常该类型Tag会跟在File Header后面作为第一个Tag出现,而且只有一个。结构如图5所示。

图5.Script Tag Data结构

第一个AMF包:

第1个字节表示AMF包类型,一般总是0x02,表示字符串。第2-3个字节为UI16类型值,标识字符串的长度,一般总是0x000A(“onMetaData”长度)。后面字节为具体的字符串,一般总为“onMetaData”(6F,6E,4D,65,74,61,44,61,74,61)。

第二个AMF包:

第1个字节表示AMF包类型,一般总是0x08,表示数组。第2-5个字节为UI32类型值,表示数组元素的个数。后面即为各数组元素的封装,数组元素为元素名称和值组成的对。常见的数组元素如表7所示。

表7.常见MetaData

含义

duration

时长

width

视频宽度

height

视频高度

videodatarate

视频码率

framerate

视频帧率

videocodecid

视频编码方式

audiosamplerate

音频采样率

audiosamplesize

音频采样精度

stereo

是否为立体声

audiocodecid

音频编码方式

filesize

文件大小

FLV封装格式分析器相关推荐

  1. 视音频编解码学习工程:FLV封装格式分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  2. 我的开源项目:FLV封装格式分析器

    本文介绍一个自己的开源小项目:FLV封装格式分析器.FLV全称是Flash Video,是互联网上使用极为广泛的视频封装格式.像Youtube,优酷这类视频网站,都使用FLV封装视频.我这个项目规模不 ...

  3. 视音频编解码学习工程:TS封装格式分析器

    ===================================================== 视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习 ...

  4. 视音频数据处理入门:FLV封装格式解析

    ===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB.YUV像素数据处理 视音频数据处理 ...

  5. FLV 封装格式解析

    本文为作者原创,转载请注明出处:https://www.cnblogs.com/leisure_chn/p/10662941.html FLV (Flash Video) 是由 Adobe 公司推出的 ...

  6. FLV封装格式介绍及解析

    FLV(Flash Video)是Adobe公司推出的一种流媒体格式,由于其封装后的音视频文件体积小.封装简单等特点,非常适合于互联网上使用.目前主流的视频网站基本都支持FLV.采用FLV格式封装的文 ...

  7. FLV封装格式的分析

    FLV封装格式的分析,各种详细的参数比较多没有详细解释,这是总体的格式分布.详细的参数说明可以参照文档. 以flv格式内封装的音频流是aac.视频流是h264分析: flv文件tag部分截图:可以看到 ...

  8. 我的开源项目:TS封装格式分析器

    本文介绍一个自己的开源小项目:TS封装格式分析器.TS全称是 MPEG 2 Transport Stream(MPEG2 传输流),广泛用于广播电视系统,比如说数字电视,以及IPTV.我这个项目规模不 ...

  9. C++实现flv封装格式解析(音视频学习笔记三)

    这篇博文使用C++解析一个flv文件信息,对其中一些重要的信息进行log输出,对flv的数据封装格式信息不清楚的可以去看这篇博文-FLV 封装格式解析,里面详细说明了flv文件的结构信息.这篇博文参考 ...

最新文章

  1. java字节流6_JavaIO流之字节流
  2. java设计模式---单例模式
  3. 4.14Python数据处理篇之Matplotlib系列(十四)---动态图的绘制
  4. linux用户空间注册按键事件,linux下获取按键响应事件
  5. const修饰指针的情况分析
  6. mysql 中将汉字(中文)按照拼音首字母排序
  7. 今日直播预告 | 漏洞审计介绍
  8. 视频截帧 php,php截取视频指定帧为图片_PHP
  9. react-hooks/exhaustive-deps警告
  10. 分布式光伏运维服务器,户用分布式光伏电站运维指导手册——运维及安全
  11. YOLOv5目标检测全流程:从标注数据到检测模型
  12. STM32任意IO模拟8080时序驱动TFTLCD屏
  13. XDL: An Industrial Deep Learning Framework for High-dimensional Sparse Data 论文笔记
  14. 7-55 Keven裂了
  15. 国内首家电子废物回收超市开业
  16. 大牛_博客Java方面链接总结
  17. Java基础语法——运算符与表达式
  18. 48. DDR2内存初始化代码分析-11
  19. 阿里云人脸识别新版SDK对接(java)
  20. 爬取天气网城市气温变化

热门文章

  1. vi常用命令与设置(不断修改中)
  2. (转)Objective-C Autorelease Pools(自动释放池)详解
  3. Silverlight BUG
  4. CodeForces - 1323D Present(思维+数学)
  5. 蓝桥杯 - 翻硬币(贪心)
  6. 2019ICPC(上海) - Light bulbs(离散化+差分)
  7. 中石油训练赛 - Perfect Tree(dfs)
  8. 逆向工程核心原理学习笔记(十):IA-32寄存器基本讲解
  9. boost使用split分割字符串
  10. sscanf函数用法详解