上一篇中,我们站在句法元素(或称语法元素)的角度,介绍了H.264的句法和语义,和句法元素的分层结构。在这篇中,我们更进一步,从比特的角度出发,来探索h264码流的组成。通过这篇的学习,我们会初步具备解析h264码流的能力,从码流中分离出NAL单元,并识别NAL类型。

1. H264码流格式

不过大道始于脚下,我们还是先从头介绍一下,h264的两种码流格式,它们分别为:字节流格式和RTP包格式。

(1)字节流格式:这是在h264官方协议文档中规定的格式,处于文档附录B(Annex-B Byte stream format)中。所以它也成为了大多数编码器,默认的输出格式。它的基本数据单位为NAL单元,也即NALU。为了从字节流中提取出NALU,协议规定,在每个NALU的前面加上起始码:0x000001或0x00000001(0x代表十六进制) 。

(2)RTP包格式:这种格式并没有在h264中规定,那为什么还要介绍它呢?是因为在h264的官方参考软件JM里,有这种封装格式的实现。在这种格式中,NALU并不需要起始码Start_Code来进行识别,而是在NALU开始的若干字节(1,2,4字节),代表NALU的长度。

显而易见,我们通常所指,以及接下来要研究的,是h264的字节流格式。由于它没有经过传输协议封装,所以也可以称之为裸流。比如我们打开一个,经编码器编码存于本地后缀为.h264文件,里面的数据即为h264裸流。

而我们接下来的研究方向,就从已经打开了一个本地的.h264文件,然后对里面的h264裸流,按照字节流格式进行分析开始。所以拿到码流的第一刻,我们需要知道,如何从中提取出NALU。

2. 起始码与NALU

通过上面我们已经知道:

H264比特流 = Start_Code_Prefix + NALU + Start_Code_Prefix + NALU + …

只要我们从码流中,找到一个一个的起始码,那么位于起始码之间的数据,即为NALU。所以拿到码流,我们需要先从头开始,找到起始码0x000001或0x00000001,找到Start_Code_Prefix之后,从它之后的下一个字节开始,就是NALU的部分。

这部分的实现过程描述在H264官方文档附录B中,已经下载的同学可以查看B.1.1节:

B.1.1 字节流NAL单元语法

3. NALU

看到这一小节时,我们已经有能力根据附录B的内容,从h264码流中找出NALU,所以是时候来看一下,h264码流结构的组成了:

NALU构成H264码流结构

这就是NALU在H264码流中的构成了,由上图我们也知道:

NALU = NALU Header + RBSP

这就是接下来我们要干的,分析NALU Header 和 RBSP,为了对NALU有个宏观的认识,我们先来看一下,NALU有哪些句法元素构成,这位于h264文档的7.3.1节:

7.3.1节 NALU句法元素构成

可以看到,整个NALU语法元素分为三部分:(1)NALU Header、(3)RBSP、(2)1和3之间的部分。

其中第2部分,是近期的h264文档才更新的,所以我特意查看了JM、x264、FFmpeg等主流编解码器,这部分是还没有实现的,所以我们可以不必理睬。而且细心的同学会发现,只有当nal_unit_type等于14、20、21时,才会进入第二部分。

所以接下来呢,我们就重点介绍NALU Header和RBSP。

3.1 NALU Header

通过上面我们也可以看到,NALU Header由三个句法元素组成,分别为:forbidden_zero_bit、nal_ref_idc和nal_unit_type,它们总共占据一个字节,也就是说,NALU Header,在整个NALU中,占据一个字节。

而且forbidden_zero_bit的值对应1个bit,nal_ref_idc的值对应2个bit,nal_unit_type的值对应5个bit,加起来刚好一个字节。

正如在上一篇(链接)中所介绍的,知道了句法元素,我们就来分别看看它的语义:

3.1.1 forbidden_zero_bit

h264文档规定,这个值应该为0,当它不为0时,表示网络传输过程中,当前NALU中可能存在错误,解码器可以考虑不对这个NALU进行解码。

3.1.2 nal_ref_idc

取值0~3,代表当前这个NALU的重要性,取值越大,代表当前NALU越重要,就需要优先被保护。尤其是当前NALU为图像参数集、序列参数集或IDR图像时,或者为参考图像条带(片/Slice),或者为参考图像的条带数据分割时,nal_ref_idc值肯定不为0。

而当NALU 类型,nal_unit_type为6、9、10、11、或12时,nal_ref_idc都为0。

【注】IDR帧,即:即时解码刷新图像,它是一个序列的第一个图像,H.264引入IDR图像是为了解码的重新同步。当解码器解码到IDR图像时,立即将参考帧队列清空,将已解码的数据全部输出或抛弃,重新查找参数集,开始一个新的序列。这样一来,如果前一个序列发生重大错误,在这里就可以获得重新同步。

所以IDR图像之后的图像,永远不会引用IDR图像之前的图像来解码。并且IDR图像一定是I图像,而I图像不一定是IDR图像(H264里没有图像层,图像可以理解为帧、片或宏块)。

3.1.3 nal_unit_type

顾名思义,这个应该是最好理解的了,它表示NALU Header后面的RBSP的数据结构的类型。下图为nal_unit_type所有可能的取值,和对应的语义,它处于h264文档7.4.1节:

nal_unit_type 语义

可以看到,nal_unit_type的值为1-5时,表示RBSP里面包含的数据为条带(片/Slice)数据,所以值为1-5的NALU统称为VCL(视像编码层)单元,其他的NALU则称为非VCL NAL单元。

当nal_unit_type为7时,代表当前NALU为序列参数集,为8时为图像参数集。这也是我们打开.h264文件后,遇到的前两个NALU,它们位于码流的最前面。

而且当nal_unit_type为14-31时,我们可以不用理睬,目前几乎用不到。

解析完NALU Header之后,下面就开始解析RBSP了,它包含了NALU数据的主体部分,我们放在下一篇详细介绍。

4. 关于H.264的协议文档

有的同学可能还没下载H.264的官方文档,这里我再贴一下下载地址:

全部版本,下载2017最新版:

H.264 : Advanced video coding for generic audiovisual services

最新版为英文版,05年3月份有中文版:

H.264 : Advanced video coding for generic audiovisual services

出在:【H264/AVC 句法和语义详解】(二):h264码流格式与NALU详解一 - 简书

【H264/AVC 句法和语义详解】(二):h264码流格式与NALU详解一相关推荐

  1. 【H264/AVC 句法和语义详解】(五):Exp-Golomb指数哥伦布编码(理论篇)

    版权声明:本文为博主原创文章,未经博主允许不得转载.    https://blog.csdn.net/u011399342/article/details/80472399 本篇隶属于文集:< ...

  2. 音视频压缩:H264码流层次结构和NALU详解

    问题背景: 前面在讲封装格式过程中,都有一个章节讲解如何将H.264的NALU单元如何打包到TS.FLV.RTP中,解装刚好相反,怎么从这些封装格式里面解析出一个个NALU单元.NALU即是编码器的输 ...

  3. H264码流RTP封装方式详解

    H264码流RTP封装方式详解 文章目录 H264码流RTP封装方式详解 1 H264基本概念 2 NALU Header介绍 3 RTP封装H264码流 3.1 单一NALU模式 3.2 组合帧封装 ...

  4. 码流格式: Annex-B, AVCC(H.264)与HVCC(H.265), extradata详解

    1.前言 介绍H.264结构的文章铺天盖地,无责任翻译.无责任转载以及部分经验之谈(目前搜索最靠前的一篇实际是对stackoverflow上答案的翻译..链接后面给出了),所以缺的不是资料,是叙述准确 ...

  5. H265码流RTP封装方式详解

    文章目录 H265码流RTP封装方式详解 1 H265编码方式介绍 2 H265码流RTP封装方式 2.1 单一帧封装模式 2.2 组合帧封装方式 2.3 分片封装模式 2.4 代码片段解析 H265 ...

  6. H264视频码流格式浅析

    原文地址 https://blog.csdn.net/h514434485/article/details/52064945 针对H264码流格式说明,网上已经有很多介绍了,最近也在看这个,这里根据自 ...

  7. 干货详解|二维码防伪溯源系统在白酒行业的应用

    根据爱码物联在白酒行业的二维码质量溯源经验 爱码物联从白酒行业的赋码方式和一物一码营销 深度解读白酒市场的一体化解决方案 质量溯源系统是通过QR二维码为载体 以激光赋码或自动贴标等方式 实现白酒的防伪 ...

  8. H264/H265码流的编码码率详解

    1.视频码率概念 视频码率是视频数据(视频色彩量.亮度量.像素量)每秒输出的位数,即单位时间传送的数据位数.一般用的单位是kbps(千位每秒).通俗一点来讲就是采样率,单位时间的采样率越大,精度就越高 ...

  9. sps和pps一篇好的解释 H264码流中SPS PPS详解<转>

    https://blog.csdn.net/luzubodfgs/article/details/86775940 H264码流中NALU sps pps IDR帧的理解 https://blog.c ...

最新文章

  1. 阿里巴巴一年投三家AR公司,AR购物或是最终目标
  2. 用Servlet获取表单数据
  3. 结对编程-队友代码欣赏
  4. 让机器学会看图说话:Image Caption任务最新综述
  5. 剑指offer之题解目录(全)
  6. P2519-[HAOI2011]problem a【dp】
  7. Linux 小知识翻译 - 「/proc 文件夹」
  8. ajax中xmlhttp.readyState==4 xmlhttp.status==200 是什么意思
  9. 论文笔记_S2D.19_2018-PR_基于膨胀卷积神经网络与软加权和推理的分层融合单目深度估计
  10. 【播放器】播放器对比
  11. java 字节码 机器码_Java 执行引擎(从字节码到机器码)
  12. Milton 1.5.1发布,开源服务器端类库
  13. php java扩展模块_php扩展模块装安装
  14. 北冥乘海生:996其实没什么卵用
  15. 电脑上删除的文件怎么恢复?
  16. 黑科技丨电脑必备的chrome插件(一)
  17. Bootstrap ——排版、表格、表单、图片、button 学习博客(二)
  18. 视频监控存储特点分析
  19. 大数据算法_看过来!2019“神气”大数据算法与应用赛决赛在即
  20. Navicat Premium v12 破解教程(转)

热门文章

  1. uniapp项目多端正常 唯独ios白屏
  2. 基于Java毕业设计沧州雄狮足球俱乐部管理系统源码+系统+mysql+lw文档+部署软件
  3. 关于模型融合Stacking的一些改进思路
  4. ffmpeg php裁剪上传视频教程,经验秘籍:ffmpeg超快速简单的视频批量剪切裁剪工具教程...
  5. 差异表达基因热图怎么看_学徒作业我想看为什么这几个基因的表达量相关性非常高...
  6. 第五届蓝桥杯 java 地宫取宝
  7. oracle如何查询权限,Oracle 权限查询
  8. [车联网安全自学篇] Android安全之ADB命令总结「收藏版」
  9. 内核文件系统API之get_empty_filp
  10. Activity的启动模式