1、基础概念

本节音视频的基础概念摘自书籍《FFmpeg入门详解 音视频原理及应用》。

1.1音频

声音的三要素为频率、振幅和波形,即声音的音调、声波的响度和声音的音色。

音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩和播放的技术,相关概念包括采样、量化、编码、采样率、声道数和比特率等。

采样是指只在时间轴上对信号进行数字化。

量化是指在幅度轴上对信号进行数字化。

每个量化都是一个采样,将这么多采样进行存储就叫做编码。

声道数是指所支持的能发不同声音的音响个数,常见的有单声道、立体声道等。

比特率,也叫码率(b/s)指一个数据流中每秒能通过的信息量。

WebRTC 对音频的噪声抑制和回声消除做了很好的处理。

音频格式是指要在计算机内播放或处理的音频文件的格式,是对声音文件进行数、模转换的过程,常见的有 MP3、WAV、AAC 等。

音频信号能压缩的依据包括声音信号中存在大量的冗余度,以及人的听觉具有强音能抑制同时存在的弱音现象。

压缩编码原理是在压缩掉冗余的信号,冗余信号是指不能被人耳感知到的信息,包括听觉范围之外以及被掩蔽掉的音频信号,压缩编码分为 2 类。

  1. 无损压缩:熵编码,包括哈夫曼、算术和行程等编码。

  2. 有损压缩:波形、参数、混合等编码,波形编码包括 PCM、DPCM、ADPCM、子带编码、矢量量化等。

1.2 视频

视频泛指将一系列静态影像以电信号的方式加以捕捉、记录、处理、存储、传送与重现的各种技术。

帧(Frame)是视频的一个基本概念,表示一副画面,一段视频由许多帧组成。

视频帧又分为 I 帧、P 帧和 B 帧:

  1. I 帧是帧内编码帧,是一个完整都关键帧,无需辅助就能完整显示画面;

  2. P 帧是前向预测编码帧,是一个非完整帧,需要参考前面的 I 帧或 P帧生成画面;

  3. B 帧是双向预测编码帧,需要参考前后图像帧编码生成。

帧率(f/s 或 Hz)是单位时间内帧的数量,电视一般 1 秒 24 帧,帧率越高,画面越流畅、逼真。

码率即比特率(b/s),指单位时间内播放连续媒体(如压缩后的音频或视频)的比特数量,码率越高带宽消耗得就越多。

视频格式非常多,包括视频文件格式、视频封装格式和视频编码格式等。

视频文件格式有 MP4、RMVB、MKV、FLV、TS、M3U8 等。FLV 是一种流媒体格式,TS 广泛应用于数字广播系统。

M3U8 是使用 HLS 协议格式的基础,文件内容是一个播放列表(Playlist),采用 UTF-8 编码,记录了一些列媒体片段资源,顺序播放片段即可完整展示资源,如下所示。

#EXTM3U
#EXT-X-STREAM-INF:BANDWIDTH=150000,RESOLUTION=416x234,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/low/index.m3u8
#EXT-X-STREAM-INF:BANDWIDTH=240000,RESOLUTION=416x234,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/lo_mid/index.m3u8
#EXTINF:15.169000
94256c7244451f8fd_20221020113637199.ts
#EXT-X-ENDLIST

其中 codecs 参数提供解码特定流所需的编解码器的完整信息。之所以使用 ts 格式的片段是为了可以无缝拼接,让视频连续。

HLS(HTTP Live Steaming,HTTP 直播流协议)的工作原理是把整个流分成一个一个的基于 HTTP 的文件来下载,每次只下载部分。

视频封装格式也叫容器,可以将已经编码并压缩好的视频轨和音频轨按照一定的格式放到一个文件中。

视频编码格式能够对数字视频进行压缩或解压缩的程序或设备,也可以指通过特定的压缩技术,将某种视频格式转换成另一种视频格式。

常见的视频编码格式有几个大系列,包括 MPEG-X、H.26X 和 VPX 等。

H.264(H.264/MPEG-4 或 AVC)是一种被广泛使用的高精度视频的录制、压缩和发布格式,H.265 是它的继任者。

一个原始视频,若没有编码,则体积会非常大。假设图的分辨率是 1920*1080,帧率为 30,每像素占 24b,那没张图占 6.22MB左右,1 秒的视频大小是 186.6MB左右,1 分钟就是 11G了。

对原始视频进行压缩的目的是去除冗余信息,这些信息包括:

  1. 空间冗余,在图像数据中,像素间在行、列方向上都有很大的相关性,相邻像素的值比较接近或者完全相同。

  2. 时间冗余,在视频图像序列中,相邻两帧又许多共同的地方,可采用运动补偿算法来去掉冗余。

  3. 视觉冗余,相对于人眼的视觉特性而言,人类视觉系统对图像的敏感性是非均匀和非线性的,并不是所有变化都能被观察到。

  4. 结构冗余,在图像的纹理区,以及图像的像素值存在明显的分布模式。

  5. 知识冗余,对许多图像的理解与某些先验知识有相当大的相关性,这类规律可由先验知识和背景知识得到。

视频播放器播放本地视频文件或互联网上的流媒体文件大概需要解协议、解封装、解码、音视频同步、渲染等几个步骤,如下图所示。

2、Web中的音视频

HTML5 标准推出后,提供了播放视频的 video 元素,以及播放音频的 audio 元素。

为了能更精准的控制时间、容器格式转换、媒体质量和内存释放等复杂的媒体处理,W3C 推出了MSE(Media Source Extensions)媒体源扩展标准。

若要访问浏览器中已有的编解码器,可以试试WebCodecs,它可以访问原始视频帧、音频数据块、图像解码器、音频和视频编码器和解码器。

在浏览器中主流的视频编码格式是 H.264/MPEG-4,不过需要支付专利费。

而 Google 推出的开源编码格式:VP8,除了 IE 之外,其他浏览器的高版本都能支持。

最新的 H.265 和 VP9 在浏览器的兼容性上都不理想,有些第三方库会自己写一个 H.265 的解码器脚本,然后来播放视频。

2.1 播放器

直播使用 video 元素播放视频很多功能都无法满足,因此很多时候都会引入一个播放器,例如video.js、react-player等。

这些播放器都能支持多种格式的视频,例如 flv、m3u8、mp4 等;并且有完整的控制键,例如音量、缩放、倍速等,覆盖移动和 PC 两个平台,以及可引入插件等。

下图是一种播放器的整体架构图,来源于《Web端H.265播放器研发解密》。

除了常规的使用 video 元素播放视频之外,还可以用 canvas 播放,具体实现可以参考JSMpeg。

2.2 MSE

在 MSE 规范中,提供了MediaSource对象,它可以附着在 HTMLMediaElement 中,即 video 元素的 src 的属性值可以是它。

一个 MediaSource 包含一个或多个 SourceBuffer 实例(下图来源于W3C官网),SourceBuffer 表示通过 MediaSource 传递到 HTMLMediaElement 并播放的媒体片段。

下面是一个使用 MSE 的完整示例,修改了 MDN 中的代码首先是声明视频路径和 MIME 参数,注意,要正确指定 codecs 参数,否则视频无法播放。

const video = document.getElementById('video');
const assetURL = 'demo.mp4';
const mime = 'video/mp4; codecs="avc1.42E01E, mp4a.40.2"';

然后实例化 MediaSource 类,并将其与 video 元素关联,注册 sourceopen 事件。

const mediaSource = new MediaSource();
video.src = URL.createObjectURL(mediaSource);
mediaSource.addEventListener('sourceopen', sourceOpen);

最后实现 sourceOpen 函数,通过 fetch() 请求视频资源,将读取到的 ArrayBuffer 数据附加到 sourceBuffer 中。

function sourceOpen(e) {URL.revokeObjectURL(video.src);const mediaSource = e.target;// 创建指定 MIME 类型的 SourceBuffer 并添加到 MediaSource 的 SourceBuffers 列表const sourceBuffer = mediaSource.addSourceBuffer(mime);// 请求资源fetch(assetURL).then(function(response) {return response.arrayBuffer();    // 转换成 ArrayBuffer}).then(function(buf) {sourceBuffer.addEventListener('updateend', function() {if (!sourceBuffer.updating && mediaSource.readyState === 'open') {mediaSource.endOfStream();    // 视频流传输完成后关闭流video.play();}});sourceBuffer.appendBuffer(buf); // 添加已转换成 ArrayBuffer 的视频流数据});
}

为 sourceBuffer 注册 updateend 事件,并在视频流传输完成后关闭流。

注意,要想看到视频的播放,不能直接静态 HTML 文件,需要将文件附加到 HTTP 服务器中。

本文借助 Node.js,搭建了一个极简的 HTTP 服务器,当然也可以将 HTML 文件挂载到 Nginx 或 IIS 服务器中。

const http = require('http');
const fs = require('fs');
// HTTP服务器
const server = http.createServer((req, res) => {// 实例化 URL 类const url = new URL(req.url, 'http://localhost:1000');const { pathname } = url;// 路由if(pathname === '/') {res.writeHead(200, { 'Content-Type': 'text/html' });res.end(fs.readFileSync('./index.html'));}else if(pathname === '/demo.mp4') {res.writeHead(200, { 'Content-Type': 'video/mp4' });res.end(fs.readFileSync('./demo.mp4'));}else if(pathname === '/client.js') {res.writeHead(200, { 'Content-Type': 'application/javascript' });res.end(fs.readFileSync('./client.js'));}
});
server.listen(1000);

B站的flv.js播放器是依赖 MSE,可自动解析 flv 格式的文件并在 video 元素中播放,完全抛弃了 Flash。

顺便说一句,flv 格式的数据传输一般采用 RTMP(Real Time Messaging Protocol)直播协议,这是由 Adobe 公司提出的私有协议,工作在 TCP 协议之上。

原文HTML躬行记(4)——Web音视频基础 - 知乎

★文末名片可以免费领取音视频开发学习资料,内容包括(FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)以及音视频学习路线图等等。

见下方!↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

HTML躬行记(4)——Web音视频基础相关推荐

  1. Web音视频入门系列——音视频基础知识

    前言 21世纪以来,随着网络基础设施的不断完善,3G.4G.乃至现今5G网络的普及,互联网彻底改变了我们的生活.以前在家里看一部电影需要买DVD和播放机,现在直接打开浏览器,进各大视频网站就可以看了, ...

  2. 视频编码(3):H.266 编码性能比 H.265 再提升 49% 的关键丨音视频基础

    ​ 我们在前文视频编码(2):H.265 如何比 H.264 提升 40% 编码效率丨音视频基础_音视频开发老马的博客-CSDN博客中探讨了 H.264 视频编码的基本概念.编码工具.编码流程及码流结 ...

  3. 《音视频开发进阶指南》读书笔记(一) —— 音视频基础概念

    前言 最近要学音视频,在图书馆借到这本<音视频开发进阶指南>,读了一段时间觉得挺好就在某宝买了. 以后一段时间应该都会沉浸在研究音视频中,开个专题记录哈每一章的读书笔记吧(以iOS开发的角 ...

  4. 音视频流媒体高级开发进阶:从音视频基础知识到技术实践

    站在音视频行业风口 站在风口,猪也能飞".在已经到来的2022年,音视频行业依旧是怎么也绕不过去的风口. 一方面,随着各项5G政策的落实,音视频+5G风口,将会深入挖掘音视频产业的无限潜力, ...

  5. 【Android FFMPEG 开发】音视频基础 和 FFMPEG 编译 ( 音视频基础 | MPEG-4 标准 | Android 开发环境 | FFMPEG 交叉编译 | 安卓项目导入配置 )

    本篇博客代码及资源下载 : https://download.csdn.net/download/han1202012/10382762 文章目录 一. 音视频基础 1. 音频基础 (1) 声音要素 ...

  6. 音视频基础——视频基础知识

    感情中特能折腾的人,很多都是之前恋情里受过创伤的人.人总有一种"补偿情结",希望把之前吃过的亏在日后一股脑儿地补回来.那些陈年旧帐就这样算到了新人头上.殊不知,成熟的爱,是伤口处开 ...

  7. ffmpeg音视频基础知识

    ffmpeg音视频基础知识 前言 一.图像的基础知识 二.视频编码基础知识 1.视频和图片之间的关系 2.为什么要编码? 3.什么是编码? 视频相关专业术语 提示:文章写完后,目录可以自动生成,如何生 ...

  8. 【音视频基础】视频基础理论

    [音视频基础]视频基础理论 图像基本概念 图像 屏幕 图像码流如何计算? 分辨率 帧率 码流计算 图像显示 YUV YUV格式 RGB与YUV的转换 YUV存储 YUV查看工具 参考资料 个人简介

  9. 音视频基础学习之【01.基于ffmpeg的简单播放器demo实现】

    目录 1.项目配置 2.显示界面设计 3.视频解码显示 流程描述 4.演示 最近在学习音视频基础知识,在这里感谢雷神留下的一系列指引新手入门的宝贵资源,虽然他英年早逝,但他的硕果永存.不由感慨真是天妒 ...

最新文章

  1. 大受褒扬,BCH中国开发者走向世界!
  2. centos7离线安装metasploit
  3. Linux基础命令介绍十:文本流编辑 sed
  4. Java使用Future设置方法超时
  5. volatile修饰的变量_看了这篇volatile详细介绍,面试你会害怕?
  6. Linux中最受欢迎的邮件传输代理(MTA)
  7. 用html5交换两个变量的值,Python判断两个对象相等的原理 python交换两个变量的值为什么不用中间变量...
  8. SQL Server (MSSQLSERVER) 启动又停止
  9. 追加画面文言时注意【×硬换行】与【○软换行】
  10. Docker系列教程27-在生产环境中使用Docker Compose
  11. go channel
  12. 深度干货!一文读懂人脸识别技术(建议收藏)
  13. 离散数学-欧拉图和哈密顿图
  14. Firefox插件的安装及使用方法(持续更新中)
  15. 双偶幻方的c语言算法,任意阶幻方的c++实现----奇阶幻方、双偶幻方、单偶幻方。...
  16. arcengine Icommond 自定义工具
  17. cloud-utils
  18. GD32开发资料汇总下载软件硬件工具
  19. 计算机转魔方最快多少,最快的转魔方的算法?
  20. 一个测试工程师的成长复盘

热门文章

  1. 《循序渐进学docker》书摘
  2. 计算机音乐弹出我管你,抖音关掉了手机管他谁是谁是什么歌
  3. Ubuntu 18.04 ———(Intel RealSense D435i)安装kalibr + 双目视觉与IMU标定(2022年)
  4. androidui图形化,Kotlin可能带来的一个深坑,终局之战
  5. java sleep原理_Java线程休眠(sleep)示例
  6. Facebook的「真实」社交VR
  7. 蓝桥杯上Excel地址c语言,2017蓝桥杯Excel地址(C++C组)
  8. 2021年高教社杯全国大学生数学建模竞赛赛题B题乙醇偶合制备 C4 烯烃 赛题 及 参考资料大集合!!
  9. vscode 调试 js
  10. linux单盘raid0更换,MegaCli修复单盘RAID0