FFmpeg 视频处理入门教程(阮一峰)

FFmpeg 是视频处理最常用的开源软件。

它功能强大,用途广泛,大量用于视频网站和商业软件(比如 Youtube 和 iTunes),也是许多音频和视频格式的标准编码/解码实现。

FFmpeg 本身是一个庞大的项目,包含许多组件和库文件,最常用的是它的命令行工具。本文介绍 FFmpeg 命令行如何处理视频,比桌面视频处理软件更简洁高效。

如果你还没安装,可以根据官方文档 先完成安装。

一、概念

介绍 FFmpeg 用法之前,需要了解一些视频处理的基本概念。

1.1 容器
视频文件本身其实是一个容器(container),里面包括了视频和音频,也可能有字幕等其他内容。

常见的容器格式有以下几种。一般来说,视频文件的后缀名反映了它的容器格式。

  • MP4
  • MKV
  • WebM
  • AVI

下面的命令查看 FFmpeg 支持的容器。

$ ffmpeg -formats

1.2 编码格式

视频和音频都需要经过编码,才能保存成文件。不同的编码格式(CODEC),有不同的压缩率,会导致文件大小和清晰度的差异。

常用的视频编码格式如下。

  • H.262
  • H.264
  • H.265

上面的编码格式都是有版权的,但是可以免费使用。此外,还有几种无版权的视频编码格式。

  • VP8
  • VP9
  • AV1

常用的音频编码格式如下。

  • MP3
  • AAC

上面所有这些都是有损的编码格式,编码后会损失一些细节,以换取压缩后较小的文件体积。无损的编码格式压缩出来的文件体积较大,这里就不介绍了。

下面的命令可以查看 FFmpeg 支持的编码格式,视频编码和音频编码都在内。

$ ffmpeg -codecs

1.3 编码器

编码器(encoders)是实现某种编码格式的库文件。只有安装了某种格式的编码器,才能实现该格式视频/音频的编码和解码。

以下是一些 FFmpeg 内置的视频编码器。

  • libx264:最流行的开源 H.264 编码器
  • NVENC:基于 NVIDIA GPU 的 H.264 编码器
  • libx265:开源的 HEVC 编码器
  • libvpx:谷歌的 VP8 和 VP9 编码器
  • libaom:AV1 编码器

音频编码器如下。

  • libfdk-aac
  • aac

下面的命令可以查看 FFmpeg 已安装的编码器。

$ ffmpeg -encoders

二、FFmpeg 的使用格式

FFmpeg 的命令行参数非常多,可以分成五个部分。

$ ffmpeg {1} {2} -i {3} {4} {5}

上面命令中,五个部分的参数依次如下。

  1. 全局参数
  2. 输入文件参数
  3. 输入文件
  4. 输出文件参数
  5. 输出文件

参数太多的时候,为了便于查看,ffmpeg 命令可以写成多行。

$ ffmpeg
[全局参数]
[输入文件参数]
-i [输入文件]
[输出文件参数]
[输出文件]

下面是一个例子。

$ ffmpeg
-y \ # 全局参数
-c:a libfdk_aac -c:v libx264 \ # 输入文件参数
-i input.mp4 \ # 输入文件
-c:v libvpx-vp9 -c:a libvorbis \ # 输出文件参数
output.webm # 输出文件

上面的命令将 mp4 文件转成 webm 文件,这两个都是容器格式。输入的 mp4 文件的音频编码格式是 aac,视频编码格式是 H.264;输出的 webm 文件的视频编码格式是 VP9,音频格式是 Vorbis。

如果不指明编码格式,FFmpeg 会自己判断输入文件的编码。因此,上面的命令可以简单写成下面的样子。

$ ffmpeg -i input.avi output.mp4

三、常用命令行参数

FFmpeg 常用的命令行参数如下。

  • -c:指定编码器
  • -c copy:直接复制,不经过重新编码(这样比较快)
  • -c:v:指定视频编码器
  • -c:a:指定音频编码器
  • -i:指定输入文件
  • -an:去除音频流
  • -vn: 去除视频流
  • -preset:指定输出的视频质量,会影响文件的生成速度,有以下几个可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。
  • -y:不经过确认,输出时直接覆盖同名文件。

四、常见用法

下面介绍 FFmpeg 几种常见用法。

4.1 查看文件信息

查看视频文件的元信息,比如编码格式和比特率,可以只使用**-i**参数。

$ ffmpeg -i input.mp4

上面命令会输出很多冗余信息,加上**-hide_banner**参数,可以只显示元信息。

$ ffmpeg -i input.mp4 -hide_banner

4.2 转换编码格式

转换编码格式(transcoding)指的是, 将视频文件从一种编码转成另一种编码。比如转成 H.264 编码,一般使用编码器libx264,所以只需指定输出文件的视频编码器即可。

$ ffmpeg -i [input.file] -c:v libx264 output.mp4

下面是转成 H.265 编码的写法。

$ ffmpeg -i [input.file] -c:v libx265 output.mp4

4.3 转换容器格式

转换容器格式(transmuxing)指的是,将视频文件从一种容器转到另一种容器。下面是 mp4 转 webm 的写法。

$ ffmpeg -i input.mp4 -c copy output.webm

上面例子中,只是转一下容器,内部的编码格式不变,所以使用**-c copy**指定直接拷贝,不经过转码,这样比较快。

4.4 调整码率

调整码率(transrating)指的是,改变编码的比特率,一般用来将视频文件的体积变小。下面的例子指定码率最小为964K,最大为3856K,缓冲区大小为 2000K。

ffmpeg
-i input.mp4
-minrate 964K -maxrate 3856K -bufsize 2000K
output.mp4

4.5 改变分辨率(transsizing)

下面是改变视频分辨率(transsizing)的例子,从 1080p 转为 480p 。

ffmpeg
-i input.mp4
-vf scale=480:-1
output.mp4

4.6 提取音频

有时,需要从视频里面提取音频(demuxing),可以像下面这样写。

ffmpeg
-i input.mp4
-vn -c:a copy
output.aac

上面例子中,-vn表示去掉视频,-c:a copy表示不改变音频编码,直接拷贝。

4.7 添加音轨

添加音轨(muxing)指的是,将外部音频加入视频,比如添加背景音乐或旁白。

ffmpeg
-i input.aac -i input.mp4
output.mp4

上面例子中,有音频和视频两个输入文件,FFmpeg 会将它们合成为一个文件。

4.8 截图

下面的例子是从指定时间开始,连续对1秒钟的视频进行截图。

ffmpeg
-y
-i input.mp4
-ss 00:01:24 -t 00:00:01
output_%3d.jpg

如果只需要截一张图,可以指定只截取一帧。

ffmpeg
-ss 01:23:45
-i input
-vframes 1 -q:v 2
output.jpg

上面例子中,-vframes 1指定只截取一帧,-q:v 2表示输出的图片质量,一般是1到5之间(1 为质量最高)。

4.9 裁剪

裁剪(cutting)指的是,截取原始视频里面的一个片段,输出为一个新视频。可以指定开始时间(start)和持续时间(duration),也可以指定结束时间(end)。

$ ffmpeg -ss [start] -i [input] -t [duration] -c copy [output]
$ ffmpeg -ss [start] -i [input] -to [end] -c copy [output]

下面是实际的例子。

ffmpeg -ss 00:01:50 -i [input] -t 10.5 -c copy [output]
ffmpeg -ss 2.5 -i [input] -to 10 -c copy [output]

上面例子中,-c copy表示不改变音频和视频的编码格式,直接拷贝,这样会快很多。

4.10 为音频添加封面

有些视频网站只允许上传视频文件。如果要上传音频文件,必须为音频添加封面,将其转为视频,然后上传。

下面命令可以将音频文件,转为带封面的视频文件。

ffmpeg
-loop 1
-i cover.jpg -i input.mp3
-c:v libx264 -c:a aac -b:a 192k -shortest
output.mp4

上面命令中,有两个输入文件,一个是封面图片cover.jpg,另一个是音频文件input.mp3-loop 1参数表示图片无限循环,-shortest参数表示音频文件结束,输出视频就结束。

4.11 多个视频合成一个视频

ffmpeg -i “concat:1.ts|2ts|” -c copy output.mp4

使用concat参数将多个视频合成 一个视频,视频文件名称 直接使用“|” 分割。

4.12 裁剪视频

有时需要对视频进行裁剪时,这时可以对视频进行裁剪(crop),比如有一个竖向的视频 1280 x 720,如果指向保留中间 640×720 部分,可以使用下面的命令:

$ ffmpeg -i a.mov -strict -2 -vf crop=640:720:0:460 out.mp4

其中的 crop=640:720:0:460 才裁剪参数,具体含义是 crop=width:height❌y,其中 width 和 height 表示裁剪后的尺寸,x:y 表示裁剪区域的左上角坐标。比如当前这个示例,我们只需要保留竖向视频的中间部分,所以 x 不用偏移,故传入0,而 y 则需要向下偏移:(1280 – 640) / 2 = 420

4.12 裁剪旋转
  1. 视频画面上下翻转:
ffmpeg -i 0.mp4 -vf vflip a.mp4
  1. 左右翻转:
ffmpeg -i 0.mp4 -vf hflip b.mp4
  1. 画面顺时针旋转90度:
ffmpeg -i 0.mp4 -vf transpose=1 c.mp4
  1. 画面逆时针旋转90°
ffmpeg -i 0.mp4 -vf transpose=2 d.mp4
4.12 按比例缩放

ffmpeg进行缩放时,可以按比例进行缩放,使用scale filter

ffmpeg -i 1.mp4 -vf "scale='750:-1" out.mp4

按照宽度750,等比例 缩放

4.12 裁剪+缩放+旋转

多个filter 一起使用时,使用-vf ,双引号内使用“,”号连接。

ffmpeg -y -i 06.mp4 -vf "crop=1928:964:428:201,transpose=2,scale=750:-1" -c:v libx264 -c:a aac -b:v 1000k -r 25  vid_6.mp4 -threads 5 -preset ultrafast
4.13 flac转mp3
ffmpeg -i input.flac -acodec libmp3lame -ar 44100 -ab 320k -ac 2 out.mp3
4.14 获取单独的视频流,去除音频
ffmpeg -i input.mp4 -vcodec copy -an v.mp4
4.15 合并分离的音频和视频
ffmpeg -i out.m4a -i v.mp4 -c copy out.mp4
4.16 截取(GIf)
//截取前10s
ffmpeg -i in.mp3 -ss 00:01:00 -to 00:01:10 -acodec copy out.mp3
ffmpeg -i in.mp3 -ss 00:01:00 -t 10 -acodec copy out.mp3//截图第5s这一帧画面
ffmpeg -i in.mp4 -ss 5 -vframes 1 img.jpg//7.5到8.5截取成GIF
ffmpeg -i in.mp4 -ss 7.5 -to 8.5 -s 640x320 -r 15 out.gif//截取片段
ffmpeg -y -i 'out.ts' -ss 00:01:00 -to 00:10:00 -vcodec copy -acodec copy '1.ts'
4.17 gif | 图片 转为 mp4
//图片转视频
cat imgs/* |ffmpeg -framerate 1 -i - out.mp4//gif 转为 mp4
ffmpeg -f gif -i origin.gif output.mp4
4.18 加水印
ffmpeg -i in.mp4 -i logo.png -filter_complex "overlay=20:20" out.mp4

五、参考链接

FFmpeg libav tutorial
Digital video introduction
FFmpeg encoding and editing course
Making Slideshows w/FFMpeg
The Complete Guide for Using ffmpeg in Linux
Adding subtitles to your videos the easy way

FFmpeg 视频处理入门教程(转)相关推荐

  1. FFmpeg视频处理入门教程(新手必看)

    本文主要介绍了FFmpeg视频处理入门教程,它功能强大,用途广泛,是许多音频和视频格式的标准编码/解码实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 FFmpeg 是视频处理最常用的开源软件. ...

  2. FFmpeg视频处理入门教程----从安装到使用(Linux版)

    ffmpeg是一个开源的音视频转码工具,它提供了录制.转换以及流化音视频的完整解决方案,可以转码.压制.提取.截取.合并.录屏等.它功能强大,用途广泛,大量用于视频网站和商业软件(比如 Youtube ...

  3. FFmpeg视频工具简洁教程

    简介 FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.采用LGPL或GPL许可证.它提供了录制.转换以及流化音视频的完整解决方案.它包含了非常先进的音频/视频编解 ...

  4. python使用教程视频-Python入门教程视频分享

    北京天丰利校区(总部)地址:北京市海淀区宝盛北里西区28号天丰利商城4层 北京沙河校区:北京市昌平区沙阳路18号北京科技职业技术学院广场服务楼2.3层 咨询电话:400-811-9990 面授课程:H ...

  5. ffmpeg入门教程

    文章目录 首先推荐几本必参考的书 视频播放器原理 博客 我的博客 欢迎联系.指正.批评 首先推荐几本必参考的书 <FFmpeg从入门到精通>,命令行居多 <FFmpeg基础库编程开发 ...

  6. Python+Opencv图像处理新手入门教程(四):视频内容的读取与导出

    一步一步来吧 上一节: Python+Opencv图像处理新手入门教程(三):阈值与二值化 1.Intro 今天这节我们主要看怎么利用opencv读取并处理视频中的内容. 2.VideoCapture ...

  7. c语言程序设计入门教程视频教学

    c语言教程视频讲座简介: 沉睡者IT:c语言程序设计入门教程视频教学培训课程内容介绍: 程序设计是一门基础课程.对于计算机相关专业而言,程序设计是专业基础知识,是进一步学习其他专业知识的第一步阶梯:对 ...

  8. 音视频基本概念和FFmpeg的简单入门(新手友好+FFmpeg资料分享)

    音视频基本概念和FFmpeg的简单入门 基本概念 容器/文件(Conainer/File): 即特定格式的多媒体文件,一般来说一个视频文件是由视频,音频,字幕等按特定的格式/规则组合到一起的,常见如: ...

  9. UI设计(PS+AI)入门教程【视频+素材】

    最近几天很多粉丝私信问我,有没有UI设计教程可以分享一些UI设计教程吗,于是小编就整理了一整套的UI设计入门教程. 今天免费分享给大家,希望对大家学习UI设计过程中有所帮助 PS.AI是UI设计师必不 ...

最新文章

  1. 量子计算机就要来了,它真的能改变世界吗?
  2. python3入门书籍-零基础自学python3 好用的入门书籍推荐
  3. GeoServer 数据导出
  4. 启动文件需要做的工作
  5. numpy matlab 索引不同,与Numpy相似的MATLAB数组索引
  6. JSON解析的几种方式
  7. java按条件查询结果为空_mybatis中查询结果为空时不同返回类型对应返回值问题...
  8. 前端学习(3117):react-hello-react的类中的方法
  9. ps图案叠加如何导入?Photoshop添加图案叠加的详细操作
  10. android学习笔记---asm.jar的使用方法--手机真机屏幕同步抓取软件
  11. 树莓派命令行连接蓝牙音箱及不出声问题
  12. nginx ssl加密_如何通过让我们加密SSL证书来保护Nginx
  13. 远程Redis服务器 JedisConnectionException: Failed connecting to host localhost:6379 解决方案
  14. 【Linux】腾讯云服务器搭建环境
  15. 【groovy #1】groovy的相关知识
  16. 【codeforces】【比赛题解】#960 CF Round #474 (Div. 1 + Div. 2, combined)
  17. 现实中的项目范围变更
  18. 基于JAVA体育用品购物系统计算机毕业设计源码+系统+mysql数据库+lw文档+部署
  19. 基于学术研究于NASA官网GPM卫星数据下载详细教程
  20. 【Linux/Unix】csh中的循环方法

热门文章

  1. 笨方法学Python 练习16
  2. vue中纯前端实现滑动图片验证的方式
  3. postsql——存储(TableSpace)
  4. 自己动手写一个操作系统——loader(1)
  5. Editplus配置
  6. 图像视频滤镜算法---几何滤镜
  7. 看程序员奶爸是如何通过代码给宝宝起名的~
  8. java计算机毕业设计Web企业差旅在线管理系统(附源码、数据库)
  9. Java选择语句练习
  10. 【计算机视觉基础】MATLAB程序实现图像中两个像素点的8-邻域、欧几里得距离与出租车距离、互换两像素点的罗森菲尔德8-邻域像素值