视音频编解码基本术语及解释
整理了一些基本视音频术语,用于入门和查询使用。
H264:
H264是视频的标准,是MPEG4-10,基于内容的高效编码方式.
============================================================================================
Gop:
============================================================================================
I/P/B-frame:
I帧,一个编码后的图像,I帧的图像编码不依赖于前向和后向编码.
P帧,是这一帧跟之前的一个关键帧(或P帧)的差别,解码时需要用之前缓存的画面叠加上本帧定义的差别,生成最终画面。
============================================================================================
Fps:
============================================================================================
ES/PS/TS/PES:
ES: elementary stream, 用于某些硬盘播或编辑系统,如m2v.
m2v:
PS: program stream, 用于播放或编辑系统,如m2p (MPEG-2 Program Stream File).
m2p:
为支持MPEG-2音频和视频压缩的视频容器格式,类似于MPEG-1文件,而且还支持隔行扫描视频和更多的音频通道,通常用于数字视频流。
TS: transition stream, 主要用于数据传输,如HDV(High-definition video)机器内部记录的m2t.
TS--Transport Stream(传输流)由定长的TS包组成(188字节),而TS包是对PES包的一个重新封装(到这里,ES也经过了两层的封装)。PES包的包头信息依然存在于TS包中。
m2t:
HDV Video File扩展名为.m2t的文件是一个视频文件。
被许多高清摄像机采用的高清视频录制格式,通常被称为HDV,采用MPEG-2压缩存储在DV或MiniDV的录像带高清视频数据,支持720p的分辨率和1080i.
PES:
TS流与PS流的区别:
在数字电视系统中,模拟视音频信号按照MPEG-2的标准,经过抽样、量化及压缩编码形成基本码流ES,基本码流ES是不分段的连续码流。
把基本码流分割成段,并加上相应的头文件打包形成的打包基本码流PES,PES包和包之间可以是不连续的。
在传输时将PES包再分段打成有固定长度188B 的传送码流TS或可变长度的节目流包(PS包)。
PES只是PS转换为TS或TS转换为PS的中间步骤或桥梁时,MPEG-2数据流互换的逻辑结构。
TS 和PS这两种码流分别适应于不同的场合应用,节目流PS适合在相对出错较少的环境下使用,其长度是变化的,而传送流TS能够把多个节目在基于一个或多个时间标识的基础上构成一个流,传送流适合于出错较多的场合下使用。
用数据包传输的优点是:网络中信息可占用不同的连接线路和简单暂存。通过数据包交织把多个数据流复用成一个新的数据流,便于解码器按照相应顺序对数据包进行灵活的整理,从而,为数据流同步和复用奠定了基础。MPEG-2的结构可分为压缩层和系统层,其中ES属于压缩层,PES和TS/PS属于系统层。 在PES层,主要是在PES包头信息中加入PTS(显示时间标签)和DTS(解码时间标签)用于视频、音频同步。
而在TS流中,TS包头加入了PCR(节目时钟参考),用于解码器的系统时钟恢复。
在节目流PS包头中加入SCR,它的作用与PCR域相似。
例子:
而对于I帧和P帧,由于经过复用后数据包的顺序会发生变化,显示前一定要存储于视频解码器的从新排序缓存器中,经过从新排序后再显示,所以一定要同时插入 PTS和DTS作为从新排序的依据。
在没有B帧的情况下,I帧和P帧在编码和解码端的顺序是一致的。
TS单一码流、混合码流:
混合性:TS流由多种数据组合而成,一个TS包中的数据可以是视频数据,音频数据,填充数据,PSI/SI表格数据等(唯一的PID对应)。
MPEG2编码端流程:
PS/TS组成:
PS/TS及标准关系:
为什么奇艺要把 iPad 客户端上的 MP4 流改为 TS 流呢?TS 相对于 MP4 有什么优势呢?
众说风云
MPEG2 Program Stream结构简单介绍:
PS流格式介绍:
将具有共同时间基准的一个或多个PES组合(复合)而成的单一的数据流称为节目流(Program Stream)。
ES是直接从编码器出来的数据流,可以是编码过的视频数据流,音频数据流,或其他编码数据流的统称。ES流经过PES打包器之后,被转换成PES包。
============================================================================================
dts/cts/pts/scr/stc
pts/dts是ES流转化成为PES流时,加入PES流头部的信息。主要是为了解决编码和呈现时的数据顺序不同所导致的问题,这个可以见ES/PS/TS章节中的例子部分。
从上面这段注释看,cts只用于B帧,用于告诉解码端所有B帧倚赖的I,P帧都已收到。
Mpeg-2的同步及时间恢复--STC,PCR,DTS,PTS:
|---------------------------------------------------------------|
| |-------------------------------------------------------
| | PES: Packetized Elementary Stream
| | |-----------------------------------------------
| | | |------------------------------------
| | | |------------------------------------
| | |------------------------------------------------
| |--------------------------------------------------------
|----------------------------------------------------------------|
============================================================================================
Resolution:
============================================================================================
AAC:
============================================================================================
Audiosample rate:
============================================================================================
Audio channels:
============================================================================================
Audio bit per sample:
============================================================================================
5.1channels:
============================================================================================
ABR/CBR/VBR
============================================================================================
Bitrate:
在通信和计算机领域,比特率(Bit rate,变量Rbit)是单位时间内传输或处理的比特的数量。比特率经常在通信领域用作连接速度、传输速度、信道容量、最大吞吐量和数字带宽容量的同义词。
============================================================================================
音频帧
============================================================================================
Ffmpeg/X264/GPAC:
Ffmpeg为开源库,集合了各种音频,视频编解码协议。在FFmpeg中没有实现264解码,调用了X264解码。
X264是对H264编码标准的一种具体实现,是一个优秀的h264视频文件格式的编码器。
============================================================================================
MP4:
============================================================================================
Deinterlace:
去交错亦称“反交错”(deinterlacing)是将交错式(即隔行扫描)(interlace)影像讯号转换为渐进式(逐行扫描)(progressive)影像讯号的一种方法。
============================================================================================
RTMP:
RTMP协议是被Flash用于对象,视频,音频的传输.该协议建立在TCP协议或者轮询HTTP协议之上.
RTMP协议就像一个用来装数据包的容器,这些数据可以是AMF格式的数据,也可以是FLV中的视/音频数据.
一个单一的连接可以通过不同的通道传输多路网络流.这些通道中的包都是按照固定大小的包传输的.
FMS3(Flash Media Server)中RTMP有5种类型
RTMP,标准类型,非加密实时消息协议。默认端口1935,如果端口没有设定,FMS将尝试用以下端口连接:443,80(RTMP),80(RTMPT)
RTMPT,借用HTTP通道的RTMP。RTMP数据通过HTTP封装,默认端口80
RTMPS,在SSL之上的RTMP。FMS支持基于SSL的RTMP数据输入和输出,默认端口443
RTMPE,加密版本RTMP。RTMPE比RTMPS更快,但是不需要认证管理,只需要在Adaptor.xml中打开。打开后,RTMPE通过以下端口尝试通讯:935,443,80(RTMPE),80(RTMPTE)
RTMPTE,基于HTTP通道传输加密的RTMPE
<Flash Media Server 4.5 的安装和使用>
<Flash Media Server 入门教程>
============================================================================================
RTSP:
============================================================================================
MMS:
===========================================================================================
XML:
TinyXml
============================================================================================
HTTP:
============================================================================================
HLS:
HLS只请求基本的HTTP报文,与实时传输协议(RTP)不同,HLS可以穿过任何允许HTTP数据通过的防火墙或者代理服务器。它也很容易使用内容分发网络来传输媒体流。
苹果公司把HLS协议作为一个互联网草案(逐步提交),在第一阶段中已作为一个非正式的标准提交到IETF。但是,即使苹果偶尔地提交一些小的更新,IETF却没有关于制定此标准的有关进一步的动作。
============================================================================================
MSS:
基于IIS Live Smooth Streaming技术流媒体直播系统
Live Smooth Streaming的那些事儿
============================================================================================
JPG/PNG:
PNG另一个非正式的名称来源为递归缩写:“PNGis Not GIF”
============================================================================================
H263/Mpeg4/Vp8:
H263:
Annex A - Inverse transform accuracyspecification
Annex B - Hypothetical Reference Decoder
Annex C - Considerations for Multipoint
Annex D - Unrestricted Motion Vector mode
Annex E - Syntax-based Arithmetic Codingmode
Annex F - Advanced Prediction mode
Annex H - Forward Error Correction forcoded video signal
MPEG-4:
VP8:
目前支持VP8的网页浏览器有Opera、Firefox和Chrome。
H.264是目前使用最多的网络图像编码格式,因此最常拿来和VP8做比较。
根据MSU Graphics & Media Lab在2011年5月的测试,VP8需要约213%的数据量,才能达到和H.264相同的图像质量 [42]。
x264的开发者之一:JasonGarrett-Glaser,给了一些针对VP8的评论,他认为VP8目前并没有实现真正的比特流规范,而且在一些编码的技术上有所欠缺[43][44]。
============================================================================================
PSNR/SNR:
PSNR :Peak Signal to Noise Ratio,峰值信噪比
============================================================================================
MP3/MP2:
MP3:
MP3是一个数据压缩格式。它舍弃脉冲编码调制(PCM)音频数据中,对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩),从而达到了压缩成小得多的文件大小。
在MP3中使用了许多技术,其中包括心理声学,以确定音频的哪一部分可以丢弃。MP3音频可以按照不同的比特率进行压缩,提供了权衡数据大小和音质之间的依据。
36或者12 tap 改良离散余弦滤波器(MDCT);每个子波段大小可以在0...1和2...31之间独立选择
MP2:
============================================================================================
M3U/M3U8
分析优酷/土豆/pptv/乐视 HTML5、m3u8地址
M3U8格式讲解及实际应用分析
============================================================================================
FAAC/FAAD:
FAAC(FreewareAdvanced Audio Coder):FAAC is an MPEG-4 and MPEG-2 AAC encoder。
FAAD(Freeware Advanced Audio Decoder):an AAC audio decoder, superseded by new version: FAAD2
============================================================================================
GAPC:
YUV420/422:
============================================================================================
RGB565/888:
============================================================================================
RGBA:
============================================================================================
PCM:
============================================================================================
Logo:
============================================================================================
Subtitle:
============================================================================================
Closed caption:
============================================================================================
High/Main/Baseline profiles:
============================================================================================
WMV/WMA/FLV:
WMV:
WMV(WindowsMedia Video)是微软公司开发的一组数字视频编解码格式的通称,它是Windows Media架构下的一部分。
当使用ASF文件格式封装的时候,WMV能够支持用于保护知识产权的数字版权管理(DRM)工具。
WMA:
WMA(WindowsMedia Audio)是微软公司开发的一种数字音频压缩格式。一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。
WMA格式最初为微软公司私有,但是随着苹果公司的iTunes对它的支持,这个格式正在成为MP3格式的竞争对手之一。它兼容MP3的ID3元数据标签,同时支持额外的标签。
FLV:
Flash Video(简称FLV),是一种流行的网络视频格式。随着视频网站的丰富,这个格式已经非常普及。
FLV流媒体格式是一种新的视频格式,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上有效使用等缺点。
一般FLV文件包在SWF PLAYER 的壳里,并且FLV可以很好的保护原始地址,不容易被下载到,从而起到保护版权的作用。但还是有些视频格式转换软件将FLV转成一般的视频格式,如中国的软件格式工厂。
目前YouTube、NICONICO动画、Google Video、Yahoo! Video、MySpace,以及中国的优酷、酷6等大部分视频分享网站均采用这个格式。
============================================================================================
AVI/ASF:
AVI:
尽管AVI已经属于老旧的技术,但是由于Windows的通用性,和简单易懂的开发API,还在被广泛使用。
AVI的文件结构、分为“头部”,“主体”和“索引”三部分。主体中图像数据和声音数据是交互存放的。从尾部的索引可以索引跳到自己想放的位置。
AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编码形式。但是由于索引放在了文件尾部,所以在播放internet流媒体时已属力不从心。
ASF:
======================================================================================
CDS网络
CDN的全称是Content Delivery Network,即内容分发网络。其目的是通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络"边缘",使用户可以就近取得所需的内容,解决Internet网络拥塞状况,提高用户访问网站的响应速度。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,解决用户访问网站的响应速度慢的根本原因。
狭义地讲,内容分发布网络(CDN)是一种新型的网络构建方式,它是为能在传统的IP网发布宽带丰富媒体而特别优化的网络覆盖层;而从广义的角度,CDN代表了一种基于质量与秩序的网络服务模式。简单地说,内容发布网络(CDN)是一个经策略性部署的整体系统,包括分布式存储、负载均衡、网络请求的重定向和内容管理4个要件,而内容管理和全局的网络流量管理(Traffic Management)是CDN的核心所在。通过用户就近性和服务器负载的判断,CDN确保内容以一种极为高效的方式为用户的请求提供服务。总的来说,内容服务基于缓存服务器,也称作代理缓存(Surrogate),它位于网络的边缘,距用户仅有"一跳"(Single Hop)之遥。同时,代理缓存是内容提供商源服务器(通常位于CDN服务提供商的数据中心)的一个透明镜像。这样的架构使得CDN服务提供商能够代表他们客户,即内容供应商,向最终用户提供尽可能好的体验,而这些用户是不能容忍请求响应时间有任何延迟的。据统计,采用CDN技术,能处理整个网站页面的70%~95%的内容访问量,减轻服务器的压力,提升了网站的性能和可扩展性。
与目前现有的内容发布模式相比较,CDN强调了网络在内容发布中的重要性。通过引入主动的内容管理层的和全局负载均衡,CDN从根本上区别于传统的内容发布模式。在传统的内容发布模式中,内容的发布由ICP的应用服务器完成,而网络只表现为一个透明的数据传输通道,这种透明性表现在网络的质量保证仅仅停留在数据包的层面,而不能根据内容对象的不同区分服务质量。此外,由于IP网的"尽力而为"的特性使得其质量保证是依靠在用户和应用服务器之间端到端地提供充分的、远大于实际所需的带宽通量来实现的。在这样的内容发布模式下,不仅大量宝贵的骨干带宽被占用,同时ICP的应用服务器的负载也变得非常重,而且不可预计。当发生一些热点事件和出现浪涌流量时,会产生局部热点效应,从而使应用服务器过载退出服务。这种基于中心的应用服务器的内容发布模式的另外一个缺陷在于个性化服务的缺失和对宽带服务价值链的扭曲,内容提供商承担了他们不该干也干不好的内容发布服务。
======================================================================================
DTV
======================================================================================
FFMEG:
东哥的博文 《FFMPEG SDK 开发介绍》
FFMepg转项
ffmpeg 新老接口问题及对照集锦
[总结]FFMPEG视音频编解码零基础学习方法
windows下编译ffmpeg2.5——使用VS2013,ARMLINUX,ANDORID编译ffmpeg
使用MingGW编译ffmpeg
FFmpeg/ffplay for VC 编译错误总结
======================================================================================
视音频同步
MPEG2-TS音视频同步原理
音视频同步原理
ffmpeg转码MPEG2-TS的音视频同步机制分析
======================================================================================
视频质量
======================================================================================
其他
Video Conversion done right: Codecs and Software
=====================================================================================
缩写:
IDR: instantaneous decoding refresh
IRAP:intra random access point
视音频编解码基本术语及解释相关推荐
- 视音频编解码基本术语及解释MediaInfo
MEDIA INFO 下载: https://mediaarea.net/en/MediaInfo/Download/Windows 摘要: 整理了一些基本视音频术语,用于入门和查询 ...
- [总结]FFMPEG视音频编解码零基础学习方法--转
ffmpeg编解码学习 目录(?)[-] ffmpeg程序的使用ffmpegexeffplayexeffprobeexe 1 ffmpegexe 2 ffplayexe 3 ffprobeexe ff ...
- FFMPEG视音频编解码零基础学习方法
总结]FFMPEG视音频编解码零基础学习方法 在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚 ...
- 音视频开发(5)---FFMPEG视音频编解码零基础学习方法
FFMPEG视音频编解码零基础学习方法 版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/leixiaohua1020/article/details/ ...
- [总结]FFMPEG视音频编解码零基础学习方法
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然 ...
- [总结]FFMPEG视音频编解码零基础学习方法【转】
本文转载自:http://blog.csdn.net/leixiaohua1020/article/details/15811977 在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFM ...
- FFMPEG视音频编解码
转自:http://blog.csdn.net/leixiaohua1020/article/details/15811977 [总结]FFMPEG视音频编解码零基础学习方法 标签: ffmpeg编解 ...
- 学习ffmpeg视音频编解码
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然 ...
- FFMPEG视音频编解码学习(1)
###开篇 看过了FFMPEG视音频编解码的基础知识,接着还有许多比如制作一个基于FFMPEG的视频播放器等,但是好像比较抽象,而且在公司的mac上很多软件也没有(重点是看的一头雾水), 还是老老实实 ...
最新文章
- plt.hist绘制直方图参数density 为True和False分别代表是否归一化 参数orientation决定了是采用纵轴代表频率还是横轴代表频率的展现形式
- 谁扛起张一鸣的游戏野心?
- 解决“QGtkStyle could not resolve GTK……”问题
- LeetCode374 猜数字大小 (二分法)
- RH5.4下安装samba服务器(1)
- java web 图书管理系统_图书管理系统,源代码 Java初级小项目
- Python 考试练习
- SAP UI5 应用开发教程之二十七 - SAP UI5 应用的单元测试工具 QUnit 介绍
- 「镁客·请讲」南京布塔:用动作捕捉世界的精彩
- 玩游戏用什么轴的机械键盘好_机械键盘选什么轴?全方面分析各轴手感和区别...
- python 极速后台开发框架_基于FastAdmin快速搭建后台管理系统
- 团队编程项目作业4-开发文档
- ac自动机 匹配最长前缀_傻傻分不清吗?——Trie Tree,字典树、前缀树概述
- 关于中值滤波算法,以及C语言实现
- 测试质量保障体系的建立
- 无刷直流电机控制MATLAB仿真,使用Simulink进行无刷直流电机控制仿真
- 阿里品牌数据银行:最全数据银行介绍
- 什么是安迪比尔定理?
- Python算法教程第三章知识点:求和式、递归式、侏儒排序法和并归排序法
- 小米电视ec、小米电视es、小米电视ea2022款的区别