前言

即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙。原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的。

系列文章

  • 《即时通讯音视频开发(一):视频编解码之理论概述》
  • 《即时通讯音视频开发(二):视频编解码之数字视频介绍》

1. 如何理解压缩码流?

可按2部分进行理解:

  • 语法:码流中各个元素的位置关系。
    如:01001001…,表示图像编码类型(01),宏块类型(00),编码系数1001等。
  • 语义:每个语法元素所表达的意义。
    例如:图像编码类型。

2. 编码层次的组成

编码层次由如下部分组成:

  • 序列(Sequence)
  • 图像组(Group of Pictures,GOP)
  • 图像(Picture)
  • 条带(Slice)
  • 宏块(Macroblock,MB)
  • 块(Block)

3. 具体的码流结构

4. PB帧编码

5. IBBP序列编码对象

  • 序列是指一段连续编码的并具有相同参数的视频图像。
  • 序列起始码是指专有的一段比特串,标识一个序列的压缩数据的开始。如MPEG-2的序列起始码为十六进制数000001(B3)。
  • 序列头是指记录序列信息,包含档次(Profile),级别(Level),宽度,高度,是否是逐行序列,帧率等内容。
  • 序列结束码是指专有的一段比特串,标识该序列的压缩数据的结束。如MPEG-2的序列结束码为十六进制数000001(B7)。

6. 图像组编码对象

7. 图像编码结构

包括:

  • 图像。
  • 图像起始码:专有的一段比特串,标识一个图像的压缩数据的开始。
    如MPEG-2的图像起始码为十六进制数000001(00)。
  • 图像头:记录图像信息。
    包含图像编码类型,图像距离,图像编码结构,图像是否为逐行扫描。

8. 图像分块编码

9. 条带编码结构

  • 条带:多个宏块的组合。
  • 条带起始码:专有的一段比特串,标识一个条带的压缩数据的开始。如MPEG-2的条带起始码为十六进制数000001(0~AF)。
  • 条带头:记录当前图像的相关信息。含条带位置,条带量化参数,宏块编码技术标识等。

10. 条带编码对象

11. 宏块编码结构

  • 宏块:16x16的像素块(对亮度而言)。
  • 宏块内容:宏块编码类型,编码模式,参考帧索引,运动矢量信息,宏块编码系数等。

12. 宏块编码对象

13. 块编码结构

  • 8x8或4x4块的变换量化系数的熵编码数据。
  • CBP (Coded Block Patten):用来指示块的变换量化系数是否全为零。
    对于YUV(4:2:0)编码,CBP通常6比特长,每个比特对应一个块,当某一块的变换量化系数全为零时,其对应比特位值为0,否则为1。
  • 每个块的变换量化系数的最后用一个EOB (End of Block)符号来标识。

14. 视频编解码关键技术

  • 预测:通过帧内预测和帧间预测降低视频图像的空间冗余和时间冗余。
  • 变换:通过从时域到频域的变换,去除相邻数据之间的相关性,即去除空间冗余。
  • 量化:通过用更粗糙的数据表示精细的数据来降低编码的数据量,或者通过去除人眼不敏感的信息来降低编码数据量。
  • 扫描:将二维变换量化数据重新组织成一维的数据序列。
  • 熵编码:根据待编码数据的概率特性减少编码冗余。

15. 预测

空间预测:利用图像空间相邻像素的相关性来预测的方法

  • 帧内预测技术:利用当前编码块周围已经重构出来的像素预测当前块
  • Intra图像编码(I帧)

时间预测:利用时间上相邻图像的相关性来预测的方法

  • 帧间预测:运动估计(Motion Estimation,ME),运动补偿(Motion Compensation,MC)
  • Inter图像编码:前向预测编码图像(P帧),双向预测编码图像(B帧)

16. 帧内预测

  • I帧图像的每个宏块都采用帧内(Intra)预测编码模式。
  • 宏块分成8x8或者4x4块,对每个块采用帧内预测编码,称作Intra8x8或者Intra4x4。
  • 帧内预测有多个预测方向:水平,垂直,左下,右上。
  • 帧内预测还有直流(DC)预测。
  • 色度块预测还有平面预测。

17. 量化

1量化原理

将含有大量的数据集合映射到含有少量的数据集合中。

一般情况下量化后高频部分包含大量的零系数

量化对主观质量的影响

18. 码率控制

受到缓冲区,带宽的限制,编码码率不能无限制的增长,因此需要通过码率控制来将编码码流控制在目标码率范围内。

一般通过调整量化参数的手段控制码率:

  • 帧级控制
  • 条带级控制
  • 宏块级控制

码率控制考虑的问题:

  • 防止码流有较大的波动,导致缓冲区发生溢出,
  • 同时保持缓冲区尽可能的充满,让图像质量尽可能的好而且稳定

CBR(Constant Bit Rate):比特率稳定,但图像质量变化大。VBR(Variable Bit Rate):比特率波动大,但图像质量稳定。

码率控制算法:

  • 码率分配
  • 码率控制

码率控制属于非标准技术,编码端有,解码端没有。

网易云信,你身边的即时通讯和音视频技术专家,了解我们,请戳网易云信官网

想要行业洞察和技术干货,请关注网易云信博客

本文转载自52im,作者:JackJiang

即时通讯音视频开发(三):视频编解码之编码基础相关推荐

  1. 音视频开发入门(3):视频编解码之编码基础

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的.有关实时 ...

  2. 音视频开发系列--H264编解码总结

    一.概述 H264,通常也被称之为H264/AVC(或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC) 对摄像头采集的每一帧视频需要进行编码,由于视频中存在空间和时间的冗余,需要 ...

  3. 即时通讯音视频开发(二):视频编解码之数字视频介绍

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  4. 即时通讯音视频开发(一):视频编解码之理论概述

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  5. 即时通讯音视频开发(十八):详解音频编解码的原理、演进和应用选型

    1.引言 大家好,我是刘华平,从毕业到现在我一直在从事音视频领域相关工作,也有一些自己的创业项目,曾为早期Google Android SDK多媒体架构的构建作出贡献. 就音频而言,无论是算法多样性, ...

  6. 即时通讯音视频开发(五):认识主流视频编码技术H.264

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  7. 即时通讯音视频开发(0):零基础,史上最通俗视频编码技术入门

    [来源申明]本文引用了微信公众号"鲜枣课堂"的<视频编码零基础入门>文章内容.为了更好的内容呈现,即时通讯网在引用和收录时内容有改动,转载时请注明原文来源信息,尊重原作 ...

  8. 即时通讯音视频开发(十):实时语音通讯的回音消除技术详解

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的.有关实时 ...

  9. 即时通讯音视频开发(十四):实时音视频数据传输协议介绍

    概述 随着移动互联网的快速发展以及智能终端性能的逐步提高,智能终端间进行实时音视频通讯成为移动互联网发展的一个重要方向.那么如何保证智能终端之间实时音视频数据通讯成为一个很现实的问题. 实际上,实时音 ...

最新文章

  1. HttpClient的连接池||HttpClient的请求参数
  2. python3 socketserver_Python3中的SocketServer
  3. GE 携手哈电国际开启国际合作新篇章
  4. java是解释型编程语言_程序设计语言可以分为两类:编译型语言和解释型语言...
  5. RT-Thread中自定义MSH命令传入的参数是字符串,需用户自行检查和解析
  6. xml转svg_C# Excel 转PDF/图片/HTML/TXT/XML/XPS/CSV/ODS/SVG/EMF
  7. JavaScript之判断用户登录信息
  8. 数据库实验5 数据库的嵌套查询实验
  9. Spring AOP(七)之定义切入点
  10. Kali下TheFatRat工具的安装教程
  11. Hexo + GitHub搭建个人博客 --- Standard Edition
  12. 灵格斯 Lingoes 2.8 去广告 禁止新词锐词弹窗
  13. 架构师技术精华文章汇总
  14. SPSS实现线性回归
  15. 一年级下册计算机教学计划,一年级下册教学计划
  16. access 数据更新update
  17. 详解@Resource解析过程
  18. 2020IT从业者如何找到高薪工作
  19. 黑马头条从登陆页到个人中心页
  20. 信安专业学生-必考认证证书( 2023.1-6月 CISP/NISP考试安排)

热门文章

  1. 王爽《汇编语言第三版》实验10-1代码实现
  2. iOS编程——经过UUID和KeyChain来代替Mac地址实现iOS设备的唯一标示(OC版)
  3. uibot和按键精灵区别_uibot和按键精灵哪个强大
  4. 流行病学数据分析基础:识别和控制混杂
  5. centos7修改系统语言为简体中文
  6. 人工智能-机器学习=深度学习-其他
  7. 视觉SLAM学习--相机成像模型及标定
  8. VS2010MFC - TeeChart经验总结(零基础入门到动态创建)
  9. 简述控制反转ioc_深度理解Spring IOC(控制反转)
  10. java 微信证书文件_JAVA微信企业付款如何使用证书、证书调用实例