ffmpeg学习——音频源
一、abuffer
缓冲音频帧,作为滤镜链图中有效的组成(起点)
它主要编程使用,特别是通过中的接口进行调用。
接受如下参数:
- time_base:用于提交帧的时间戳时基。是浮点数或者分数形式。
- sample_rate:进入音频缓冲的采样率。
- sample_fmt:进入音频缓冲的采样格式。下枚举值中的一个格式名称或者对应的整数
- channel_layout:进入音频缓冲的通道布局。为中的定义的布局名称或者中 类宏(对应的整数表示)
- channels:进入缓冲的通道数。如果 和 同时被设置,则二者必须一致。
示例
abuffer=sample_rate=44100:sample_fmt=s16p:channel_layout=stereo
源接受信号立体声(采样率44100HZ)。
采样格式:s16p即6
通道布局:stereo,即0x3
abuffer=sample_rate=44100:sample_fmt=6:channel_layout=0x3
二、aevalsrc
按表达式生成一个音频信号(信号发生器)
它接受一个或者多个表达式(每个对应一个通道),根据表达式计算产生相应的音频信号。
接受如下的选项:
- exprs:由’|’分隔的表达式列表,每个表达式对应一个通道。以防没有指定选项,选中的通道布局取决于提供的数量表达式。否则最后指定表达式应用于剩下的输出通道。
- channel_layout, c:设置通道布局。这里的通道数必须等于表达式数量。
- duration, d:设置源音频持续时间。参考内容以了解语法。注意由此生成的音频持续时间可能会超过这里指定的时间,因为生成的音频最少是一个完整的帧内容。如果不指定,或者指定一个非负数,表面会持续生成音频信号。
- nb_samples, n:设置每个输出帧中每个通道的样例数量,默认1024。
- sample_rate, s:指定采样频率,默认44100.
每个表达式可以包含下面的常量:
- n:评估样本的数量,从0开始计数
- t:样本时间表示,从0开始计时
- s:样本采样率
示例
生成静音(无声)
ffmpeg -f lavfi -i aevalsrc=0 -t 10 1.mp3
生成频率为440Hz的正弦波,采样频率8000Hz:
ffmpeg -f lavfi -i aevalsrc="sin(440*2*PI*t):s=8000" -t 10 1.mp3
生成双路信号,这里指定为(中前和中后),表达式为:
ffmpeg -f lavfi -i aevalsrc="sin(420*2*PI*t)|cos(430*2*PI*t):c=FC|BC" -t 10 1.mp3
生成白噪声:
ffmpeg -f lavfi -i aevalsrc="-2+random(0)" -t 10 1.mp3
生成一个振幅调制信号:
ffmpeg -f lavfi -i aevalsrc="sin(10*2*PI*t)*sin(880*2*PI*t)" -t 10 1.mp3
生成2.5赫兹双耳节拍在360赫兹的载体:
ffmpeg -f lavfi -i aevalsrc="0.1*sin(2*PI*(360-2.5/2)*t) | 0.1*sin(2*PI*(360+2.5/2)*t)" -t 10 1.mp3
三、afirsrc
使用频率采样方法生成 FIR 系数。
生成的流可以与过滤器一起用于过滤音频信号。
过滤器接受以下选项:
- taps, t:在输出音频流中设置过滤器系数的数量。默认值为 1025。
- frequency, f:设置频率点,从中设置幅度和相位。这必须是非降序,第一个元素必须为 0,最后一个元素必须为 1。元素之间用空格分隔。
- magnitude, m:为每个频率点设置幅度值频率. 值的数量必须与频点的数量相同。值由空格分隔。
- phase, p:为每个频率点设置相位值频率. 值的数量必须与频点的数量相同。值由空格分隔。
- sample_rate, r:设置采样率,默认为 44100。
- nb_samples, n:设置每帧的样本数。默认值为 1024。
- win_func, w:设置窗口功能。默认为blackman。
四、anullsrc
null(空)音频源会产生未处理的音频帧。它一般用于分析/调试,或作为滤镜可忽略的输入源(例如合成滤镜)
这个源接受下面选项:
- channel_layout, cl:指定通道布局,可以是整数或对应的短语,默认为。定义channel_layout1
- sample_rate, r:采样率,默认 44100。
- nb_samples, n:每帧的样本数。
- duration, d:设置源音频持续时间。参考内容以了解语法。注意由此生成的音频持续时间可能会超过这里指定的时间,因为生成的音频最少是一个完整的帧内容。如果不指定,或者指定一个非负数,表面会持续生成音频信号。
示例
以采样率48000 Hz ,单声道().
ffmpeg -f lavfi -i anullsrc=r=44100:cl=4 -t 10 1.mp3
等价于
ffmpeg -f lavfi -i anullsrc=r=44100:cl=mono -t 10 1.mp3
五、flite
使用libflite库合成声音话语。
编译选项是
库不是线程安全的。
接受如下选项:
- list_voices:如果为1,列出有效的语音并退出,默认0。
- nb_samples, n:设置每个帧最大样例数量,默认512。
- textfile:设置要朗读的文件名。
- text:设置要朗读的文本。
- voice, v:设置语音合成的声音,默认参考选项
示例
从文件speech.txt读,使用标准声音合成:
flite=textfile=speech.txt
读取指定文本,并用语音合成:
flite=text='So fare thee well, poor devil of a Sub-Sub, whose commentator I am':voice=slt
作为ffmpeg输入:
ffmpeg -f lavfi -i flite=text='So fare thee well, poor devil of a Sub-Sub, whose commentator I am':voice=slt
播放合成语音:
ffplay -f lavfi flite=text='No more be grieved for which that thou hast done.'
更多
关于库的更多信息,确认
六、anoisesrc
产生噪声音频信号。
接受下列选项
- sample_rate、r:采样率,默认48000HZ。
- amplitude, a:指定生成的音频流的振幅(0.0 - 1.0)。默认1.0。
- duration, d:指定生成的音频流的持续时间。不指定此选项会导致噪音的长度无穷大。
- color, colour, c:指定噪声的颜色。可用的噪声颜色有白色、粉色、棕色、蓝色、紫色和天鹅绒色。默认颜色是白色。
- seed, s:指定一个用于播种PRNG的值。
- nb_samples, n:设置每个输出帧的采样数量,默认是1024。
示例
产生60秒的粉色噪声,44.1 kHz的采样率和0.5的振幅:
anoisesrc=d=60:c=pink:r=44100:a=0.5
七、hilbert
生成odd-tap Hilbert变换FIR系数。
产生的流可以使用滤波器相移信号90度。
这在许多矩阵编码方案和分析信号生成中被使用。这个过程通常被写成乘以虚数单位i(或j)。
过滤器接受以下选项:
sample_rate, s:采样率,默认44100。
taps, t:设置FIR滤波器长度,默认22051。
nb_samples, n:设置每个输出帧的采样数量。
win_func, w:设置生成FIR系数时使用的窗口函数。
八、sinc
生成一个音频信号的振幅的正弦波1/8
是一个bit-exact音频信号(脉冲?)
接受如下选项:
- frequency, f:设置载波频率,默认 440 Hz.
- beep_factor, b:每个倍载波频率周期产生一个,默认为0,表示被禁止
- sample_rate, r:指定采样率,默认44100.
- duration, d:指定产生音频持续时间
- samples_per_frame:设置每帧样例数,默认1024
示例
产生440Hz的波Generate a simple 440 Hz sine wave:
sine
产生220Hz波,且880Hz产生一个,持续5秒:
sine=220:4:d=5 sine=f=220:b=4:d=5 sine=frequency=220:beep_factor=4:duration=5
附录
channel_layout
static const struct channel_layout_name channel_layout_map[] = {{ "mono", AV_CHANNEL_LAYOUT_MONO }, { "stereo", AV_CHANNEL_LAYOUT_STEREO },{ "2.1", AV_CHANNEL_LAYOUT_2POINT1 },{ "3.0", AV_CHANNEL_LAYOUT_SURROUND },{ "3.0(back)", AV_CHANNEL_LAYOUT_2_1 },{ "4.0", AV_CHANNEL_LAYOUT_4POINT0 },{ "quad", AV_CHANNEL_LAYOUT_QUAD },{ "quad(side)", AV_CHANNEL_LAYOUT_2_2 },{ "3.1", AV_CHANNEL_LAYOUT_3POINT1 },{ "5.0", AV_CHANNEL_LAYOUT_5POINT0_BACK },{ "5.0(side)", AV_CHANNEL_LAYOUT_5POINT0 },{ "4.1", AV_CHANNEL_LAYOUT_4POINT1 },{ "5.1", AV_CHANNEL_LAYOUT_5POINT1_BACK },{ "5.1(side)", AV_CHANNEL_LAYOUT_5POINT1 },{ "6.0", AV_CHANNEL_LAYOUT_6POINT0 },{ "6.0(front)", AV_CHANNEL_LAYOUT_6POINT0_FRONT },{ "hexagonal", AV_CHANNEL_LAYOUT_HEXAGONAL },{ "6.1", AV_CHANNEL_LAYOUT_6POINT1 },{ "6.1(back)", AV_CHANNEL_LAYOUT_6POINT1_BACK },{ "6.1(front)", AV_CHANNEL_LAYOUT_6POINT1_FRONT },{ "7.0", AV_CHANNEL_LAYOUT_7POINT0 },{ "7.0(front)", AV_CHANNEL_LAYOUT_7POINT0_FRONT },{ "7.1", AV_CHANNEL_LAYOUT_7POINT1 },{ "7.1(wide)", AV_CHANNEL_LAYOUT_7POINT1_WIDE_BACK },{ "7.1(wide-side)", AV_CHANNEL_LAYOUT_7POINT1_WIDE },{ "octagonal", AV_CHANNEL_LAYOUT_OCTAGONAL },{ "hexadecagonal", AV_CHANNEL_LAYOUT_HEXADECAGONAL },{ "downmix", AV_CHANNEL_LAYOUT_STEREO_DOWNMIX, },{ "22.2", AV_CHANNEL_LAYOUT_22POINT2, },
};
AVSampleFormat
enum AVSampleFormat {AV_SAMPLE_FMT_NONE = -1,AV_SAMPLE_FMT_U8, ///< unsigned 8 bitsAV_SAMPLE_FMT_S16, ///< signed 16 bitsAV_SAMPLE_FMT_S32, ///< signed 32 bitsAV_SAMPLE_FMT_FLT, ///< floatAV_SAMPLE_FMT_DBL, ///< doubleAV_SAMPLE_FMT_U8P, ///< unsigned 8 bits, planarAV_SAMPLE_FMT_S16P, ///< signed 16 bits, planarAV_SAMPLE_FMT_S32P, ///< signed 32 bits, planarAV_SAMPLE_FMT_FLTP, ///< float, planarAV_SAMPLE_FMT_DBLP, ///< double, planarAV_SAMPLE_FMT_S64, ///< signed 64 bitsAV_SAMPLE_FMT_S64P, ///< signed 64 bits, planarAV_SAMPLE_FMT_NB ///< Number of sample formats. DO NOT USE if linking dynamically
};
持续时间
它有两种表示方式:
- 表示小时数,表示分钟数(最多2位数字)表示秒数(也最多2位数字),是的小数位值
- 是秒的数值,是的小数位值。
两种语法前面都可选号,表示负数持续时间。
推荐一个零声学院免费教程,个人觉得老师讲得不错,
分享给大家:Linux,Nginx,ZeroMQ,MySQL,Redis,
fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,
TCP/IP,协程,DPDK等技术内容,点击立即学习
channel_layout
static const struct channel_layout_name channel_layout_map[] = {{ "mono", AV_CHANNEL_LAYOUT_MONO }, { "stereo", AV_CHANNEL_LAYOUT_STEREO },{ "2.1", AV_CHANNEL_LAYOUT_2POINT1 },{ "3.0", AV_CHANNEL_LAYOUT_SURROUND },{ "3.0(back)", AV_CHANNEL_LAYOUT_2_1 },{ "4.0", AV_CHANNEL_LAYOUT_4POINT0 },{ "quad", AV_CHANNEL_LAYOUT_QUAD },{ "quad(side)", AV_CHANNEL_LAYOUT_2_2 },{ "3.1", AV_CHANNEL_LAYOUT_3POINT1 },{ "5.0", AV_CHANNEL_LAYOUT_5POINT0_BACK },{ "5.0(side)", AV_CHANNEL_LAYOUT_5POINT0 },{ "4.1", AV_CHANNEL_LAYOUT_4POINT1 },{ "5.1", AV_CHANNEL_LAYOUT_5POINT1_BACK },{ "5.1(side)", AV_CHANNEL_LAYOUT_5POINT1 },{ "6.0", AV_CHANNEL_LAYOUT_6POINT0 },{ "6.0(front)", AV_CHANNEL_LAYOUT_6POINT0_FRONT },{ "hexagonal", AV_CHANNEL_LAYOUT_HEXAGONAL },{ "6.1", AV_CHANNEL_LAYOUT_6POINT1 },{ "6.1(back)", AV_CHANNEL_LAYOUT_6POINT1_BACK },{ "6.1(front)", AV_CHANNEL_LAYOUT_6POINT1_FRONT },{ "7.0", AV_CHANNEL_LAYOUT_7POINT0 },{ "7.0(front)", AV_CHANNEL_LAYOUT_7POINT0_FRONT },{ "7.1", AV_CHANNEL_LAYOUT_7POINT1 },{ "7.1(wide)", AV_CHANNEL_LAYOUT_7POINT1_WIDE_BACK },{ "7.1(wide-side)", AV_CHANNEL_LAYOUT_7POINT1_WIDE },{ "octagonal", AV_CHANNEL_LAYOUT_OCTAGONAL },{ "hexadecagonal", AV_CHANNEL_LAYOUT_HEXADECAGONAL },{ "downmix", AV_CHANNEL_LAYOUT_STEREO_DOWNMIX, },{ "22.2", AV_CHANNEL_LAYOUT_22POINT2, }, };
↩︎
ffmpeg学习——音频源相关推荐
- ffmpeg学习 函数分析swr_convert
文章目录 简单说明 采样格式转换 声道格式转换 采样频率转换 libswresample库使用 函数介绍 示例代码 有关ffmpeg中主要的api函数源码解析参考雷神系列文章,整理如下 ffmpeg学 ...
- FFmpeg学习(1)开篇
FFmpeg学习(1)开篇 FFmpeg学习(2)源码编译,环境配置 为什么要学习FFmpeg 本人希望打算深入研究音视频领域,音视频领域的内容很多,我自己打算从几方面循序渐进:FFmpeg常用功能实 ...
- FFmpeg学习之八(FFmpeg源码编译)
FFmpeg学习之八(FFmpeg源码编译) Mac下 FFmpeg源码编译 安装 1. 使用终端安装FFmpeg 2. 手动编译 2.1 编译环境 - Xcode 2.2 安装依赖库 2.3 安装F ...
- FFmpeg学习4:音频格式转换
前段时间,在学习试用FFmpeg播放音频的时候总是有杂音,网上的很多教程是基于之前版本的FFmpeg的,而新的FFmepg3中audio增加了平面(planar)格式,而SDL播放音频是不支持平面格式 ...
- 学习ffmpeg视音频编解码
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然 ...
- FFMPEG视音频编解码学习(1)
###开篇 看过了FFMPEG视音频编解码的基础知识,接着还有许多比如制作一个基于FFMPEG的视频播放器等,但是好像比较抽象,而且在公司的mac上很多软件也没有(重点是看的一头雾水), 还是老老实实 ...
- FFmpeg学习3:播放音频
参考dranger tutorial,本文将介绍如何使用FFmpeg解码音频数据,并使用SDL将解码后的数据输出. 本文主要包含以下几方面的内容: 关于播放音频的需要的一些基础知识介绍 使用SDL2播 ...
- CentOS7源码安装ffmpeg,并利用ffmpeg实现音频截取
下载ffmpeg git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg 下载完成后,进入到下载好的ffmpeg目录中执行configure脚本,并指定编 ...
- 基于 FFMPEG 的音频编解码(一):Hello FFMPEG,安装与编译
Hello FFMPEG 基于 FFMPEG 的音频编解码(一):Hello FFMPEG,安装与编译 基于 FFMPEG 的音频编解码(二):音频解码 基于 FFMPEG 的音频编解码(三):音频编 ...
最新文章
- linux centos 网络设置 优先使用ipv4 其次ipv6
- bzoj 4566 找相同字符 —— 广义后缀自动机
- Java的反射API
- 单片机C语言编程:.H文件与.C文件的关系!
- 【HDU - 5934】Bomb (强连通分量Tarjan + 缩点)
- 为Visual Studio 2010添加HTML5的项目模板
- java integer 包_java之学习基本类型包装类的概述及Integer类的概述和构造方法
- 【LeetCode笔记】剑指Offer 51. 数组中的逆序对(Java、分治)
- 修改 Windows Host 文件工具
- Navicat 教程:排序、查找或替换记录
- jquery中checkbox全选失效的解决方法
- 城市不透水面空间分析——以宁波为例
- 四、公文流转的基本过程
- 互联网快讯:粉笔科技双轨并进未来可期;猿辅导优质教学获赞赏;网红奶茶古茗被罚
- 蒟蒻的SCAU第一周个人排位赛赛后感想
- 关于RedisPool配置参数
- Work around for SQL Configuration Manager Consol
- 数据库学习 (一):数据库系统概述
- java jsonsql_java遍历解析json数据并插入到数据库中(MySQL)
- ssl证书默认端口是什么,ssl证书证书的作用
热门文章
- RxSwift之深入解析Using操作的应用和原理
- 大数据的应用是什么?有三大关键点
- 空口协议probe req和probe rsp 、auth req和auth rsp 、assoc req和assoc rsp讲解
- Spire.Doc在Word中插入图片时,自适应宽度设置
- 超前点播风波后,中国视频行业变现仍需摸索中前行
- 夜神模拟器的安装与使用
- iPhone 15 高端版本万元起步;华为授权 OPPO 使用其 5G 技术;DeepMind 推出 AI 编剧|极客头条...
- 第三方测试什么意思?国内知名第三方测试公司排名
- Android——新大陆云平台篇
- Python集合运算