一、abuffer

缓冲音频帧，作为滤镜链图中有效的组成（起点）

它主要编程使用，特别是通过中的接口进行调用。

接受如下参数：

time_base：用于提交帧的时间戳时基。是浮点数或者分数形式。
sample_rate：进入音频缓冲的采样率。
sample_fmt：进入音频缓冲的采样格式。下枚举值中的一个格式名称或者对应的整数
channel_layout：进入音频缓冲的通道布局。为中的定义的布局名称或者中类宏（对应的整数表示）
channels：进入缓冲的通道数。如果和同时被设置，则二者必须一致。

示例

abuffer=sample_rate=44100:sample_fmt=s16p:channel_layout=stereo

源接受信号立体声（采样率44100HZ）。

采样格式：s16p即6

通道布局：stereo，即0x3

abuffer=sample_rate=44100:sample_fmt=6:channel_layout=0x3

二、aevalsrc

按表达式生成一个音频信号（信号发生器）

它接受一个或者多个表达式（每个对应一个通道），根据表达式计算产生相应的音频信号。

接受如下的选项：

exprs：由’|’分隔的表达式列表，每个表达式对应一个通道。以防没有指定选项，选中的通道布局取决于提供的数量表达式。否则最后指定表达式应用于剩下的输出通道。
channel_layout, c：设置通道布局。这里的通道数必须等于表达式数量。
duration, d：设置源音频持续时间。参考内容以了解语法。注意由此生成的音频持续时间可能会超过这里指定的时间，因为生成的音频最少是一个完整的帧内容。如果不指定，或者指定一个非负数，表面会持续生成音频信号。
nb_samples, n：设置每个输出帧中每个通道的样例数量，默认1024。
sample_rate, s：指定采样频率，默认44100.

每个表达式可以包含下面的常量:

n：评估样本的数量，从0开始计数
t：样本时间表示，从0开始计时
s：样本采样率

示例

生成静音（无声）

ffmpeg -f lavfi -i aevalsrc=0 -t 10 1.mp3

生成频率为440Hz的正弦波，采样频率8000Hz:

ffmpeg -f lavfi -i aevalsrc="sin(440*2*PI*t):s=8000" -t 10 1.mp3

生成双路信号，这里指定为（中前和中后），表达式为:

ffmpeg -f lavfi -i aevalsrc="sin(420*2*PI*t)|cos(430*2*PI*t):c=FC|BC" -t 10 1.mp3

生成白噪声:

ffmpeg -f lavfi -i aevalsrc="-2+random(0)" -t 10 1.mp3

生成一个振幅调制信号:

ffmpeg -f lavfi -i aevalsrc="sin(10*2*PI*t)*sin(880*2*PI*t)" -t 10 1.mp3

生成2.5赫兹双耳节拍在360赫兹的载体:

ffmpeg -f lavfi -i aevalsrc="0.1*sin(2*PI*(360-2.5/2)*t) | 0.1*sin(2*PI*(360+2.5/2)*t)" -t 10 1.mp3

三、afirsrc

使用频率采样方法生成 FIR 系数。

生成的流可以与过滤器一起用于过滤音频信号。

过滤器接受以下选项：

taps, t：在输出音频流中设置过滤器系数的数量。默认值为 1025。
frequency, f：设置频率点，从中设置幅度和相位。这必须是非降序，第一个元素必须为 0，最后一个元素必须为 1。元素之间用空格分隔。
magnitude, m：为每个频率点设置幅度值频率. 值的数量必须与频点的数量相同。值由空格分隔。
phase, p：为每个频率点设置相位值频率. 值的数量必须与频点的数量相同。值由空格分隔。
sample_rate, r：设置采样率，默认为 44100。
nb_samples, n：设置每帧的样本数。默认值为 1024。
win_func, w：设置窗口功能。默认为blackman。

四、anullsrc

null（空）音频源会产生未处理的音频帧。它一般用于分析/调试，或作为滤镜可忽略的输入源（例如合成滤镜）

这个源接受下面选项：

channel_layout, cl：指定通道布局，可以是整数或对应的短语，默认为。定义channel_layout¹
sample_rate, r：采样率，默认 44100。
nb_samples, n：每帧的样本数。
duration, d：设置源音频持续时间。参考内容以了解语法。注意由此生成的音频持续时间可能会超过这里指定的时间，因为生成的音频最少是一个完整的帧内容。如果不指定，或者指定一个非负数，表面会持续生成音频信号。

示例

以采样率48000 Hz ，单声道().

ffmpeg -f lavfi -i anullsrc=r=44100:cl=4 -t 10 1.mp3
等价于
ffmpeg -f lavfi -i anullsrc=r=44100:cl=mono -t 10 1.mp3

五、flite

使用libflite库合成声音话语。

编译选项是

库不是线程安全的。

接受如下选项：

list_voices：如果为1，列出有效的语音并退出，默认0。
nb_samples, n：设置每个帧最大样例数量，默认512。
textfile：设置要朗读的文件名。
text：设置要朗读的文本。
voice, v：设置语音合成的声音，默认参考选项

示例

从文件speech.txt读，使用标准声音合成:

flite=textfile=speech.txt

读取指定文本，并用语音合成:

flite=text='So fare thee well, poor devil of a Sub-Sub, whose commentator I am':voice=slt

作为ffmpeg输入:

ffmpeg -f lavfi -i flite=text='So fare thee well, poor devil of a Sub-Sub, whose commentator I am':voice=slt

播放合成语音:

ffplay -f lavfi flite=text='No more be grieved for which that thou hast done.'

关于库的更多信息，确认

六、anoisesrc

产生噪声音频信号。

接受下列选项

sample_rate、r：采样率，默认48000HZ。
amplitude, a：指定生成的音频流的振幅(0.0 - 1.0)。默认1.0。
duration, d：指定生成的音频流的持续时间。不指定此选项会导致噪音的长度无穷大。
color, colour, c：指定噪声的颜色。可用的噪声颜色有白色、粉色、棕色、蓝色、紫色和天鹅绒色。默认颜色是白色。
seed, s：指定一个用于播种PRNG的值。
nb_samples, n：设置每个输出帧的采样数量，默认是1024。

示例

产生60秒的粉色噪声，44.1 kHz的采样率和0.5的振幅:

```
anoisesrc=d=60:c=pink:r=44100:a=0.5
```

七、hilbert

生成odd-tap Hilbert变换FIR系数。

产生的流可以使用滤波器相移信号90度。

这在许多矩阵编码方案和分析信号生成中被使用。这个过程通常被写成乘以虚数单位i(或j)。

过滤器接受以下选项:

sample_rate, s：采样率，默认44100。
taps, t：设置FIR滤波器长度，默认22051。
nb_samples, n：设置每个输出帧的采样数量。
win_func, w：设置生成FIR系数时使用的窗口函数。

八、sinc

生成一个音频信号的振幅的正弦波1/8

是一个bit-exact音频信号（脉冲？）

接受如下选项：

frequency, f：设置载波频率，默认 440 Hz.
beep_factor, b：每个倍载波频率周期产生一个，默认为0，表示被禁止
sample_rate, r：指定采样率，默认44100.
duration, d：指定产生音频持续时间
samples_per_frame：设置每帧样例数，默认1024

示例

产生440Hz的波Generate a simple 440 Hz sine wave:

sine

产生220Hz波，且880Hz产生一个，持续5秒:

sine=220:4:d=5 sine=f=220:b=4:d=5 sine=frequency=220:beep_factor=4:duration=5

附录

channel_layout

static const struct channel_layout_name channel_layout_map[] = {{ "mono",           AV_CHANNEL_LAYOUT_MONO                }, { "stereo",         AV_CHANNEL_LAYOUT_STEREO              },{ "2.1",            AV_CHANNEL_LAYOUT_2POINT1             },{ "3.0",            AV_CHANNEL_LAYOUT_SURROUND            },{ "3.0(back)",      AV_CHANNEL_LAYOUT_2_1                 },{ "4.0",            AV_CHANNEL_LAYOUT_4POINT0             },{ "quad",           AV_CHANNEL_LAYOUT_QUAD                },{ "quad(side)",     AV_CHANNEL_LAYOUT_2_2                 },{ "3.1",            AV_CHANNEL_LAYOUT_3POINT1             },{ "5.0",            AV_CHANNEL_LAYOUT_5POINT0_BACK        },{ "5.0(side)",      AV_CHANNEL_LAYOUT_5POINT0             },{ "4.1",            AV_CHANNEL_LAYOUT_4POINT1             },{ "5.1",            AV_CHANNEL_LAYOUT_5POINT1_BACK        },{ "5.1(side)",      AV_CHANNEL_LAYOUT_5POINT1             },{ "6.0",            AV_CHANNEL_LAYOUT_6POINT0             },{ "6.0(front)",     AV_CHANNEL_LAYOUT_6POINT0_FRONT       },{ "hexagonal",      AV_CHANNEL_LAYOUT_HEXAGONAL           },{ "6.1",            AV_CHANNEL_LAYOUT_6POINT1             },{ "6.1(back)",      AV_CHANNEL_LAYOUT_6POINT1_BACK        },{ "6.1(front)",     AV_CHANNEL_LAYOUT_6POINT1_FRONT       },{ "7.0",            AV_CHANNEL_LAYOUT_7POINT0             },{ "7.0(front)",     AV_CHANNEL_LAYOUT_7POINT0_FRONT       },{ "7.1",            AV_CHANNEL_LAYOUT_7POINT1             },{ "7.1(wide)",      AV_CHANNEL_LAYOUT_7POINT1_WIDE_BACK   },{ "7.1(wide-side)", AV_CHANNEL_LAYOUT_7POINT1_WIDE        },{ "octagonal",      AV_CHANNEL_LAYOUT_OCTAGONAL           },{ "hexadecagonal",  AV_CHANNEL_LAYOUT_HEXADECAGONAL       },{ "downmix",        AV_CHANNEL_LAYOUT_STEREO_DOWNMIX,     },{ "22.2",           AV_CHANNEL_LAYOUT_22POINT2,           },
};

AVSampleFormat

enum AVSampleFormat {AV_SAMPLE_FMT_NONE = -1,AV_SAMPLE_FMT_U8,          ///< unsigned 8 bitsAV_SAMPLE_FMT_S16,         ///< signed 16 bitsAV_SAMPLE_FMT_S32,         ///< signed 32 bitsAV_SAMPLE_FMT_FLT,         ///< floatAV_SAMPLE_FMT_DBL,         ///< doubleAV_SAMPLE_FMT_U8P,         ///< unsigned 8 bits, planarAV_SAMPLE_FMT_S16P,        ///< signed 16 bits, planarAV_SAMPLE_FMT_S32P,        ///< signed 32 bits, planarAV_SAMPLE_FMT_FLTP,        ///< float, planarAV_SAMPLE_FMT_DBLP,        ///< double, planarAV_SAMPLE_FMT_S64,         ///< signed 64 bitsAV_SAMPLE_FMT_S64P,        ///< signed 64 bits, planarAV_SAMPLE_FMT_NB           ///< Number of sample formats. DO NOT USE if linking dynamically
};

持续时间

它有两种表示方式：

表示小时数，表示分钟数（最多2位数字）表示秒数（也最多2位数字），是的小数位值
是秒的数值，是的小数位值。

两种语法前面都可选号，表示负数持续时间。

推荐一个零声学院免费教程，个人觉得老师讲得不错，
分享给大家：Linux，Nginx，ZeroMQ，MySQL，Redis，
fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，
TCP/IP，协程，DPDK等技术内容，点击立即学习

channel_layout

static const struct channel_layout_name channel_layout_map[] = {{ "mono",           AV_CHANNEL_LAYOUT_MONO                }, { "stereo",         AV_CHANNEL_LAYOUT_STEREO              },{ "2.1",            AV_CHANNEL_LAYOUT_2POINT1             },{ "3.0",            AV_CHANNEL_LAYOUT_SURROUND            },{ "3.0(back)",      AV_CHANNEL_LAYOUT_2_1                 },{ "4.0",            AV_CHANNEL_LAYOUT_4POINT0             },{ "quad",           AV_CHANNEL_LAYOUT_QUAD                },{ "quad(side)",     AV_CHANNEL_LAYOUT_2_2                 },{ "3.1",            AV_CHANNEL_LAYOUT_3POINT1             },{ "5.0",            AV_CHANNEL_LAYOUT_5POINT0_BACK        },{ "5.0(side)",      AV_CHANNEL_LAYOUT_5POINT0             },{ "4.1",            AV_CHANNEL_LAYOUT_4POINT1             },{ "5.1",            AV_CHANNEL_LAYOUT_5POINT1_BACK        },{ "5.1(side)",      AV_CHANNEL_LAYOUT_5POINT1             },{ "6.0",            AV_CHANNEL_LAYOUT_6POINT0             },{ "6.0(front)",     AV_CHANNEL_LAYOUT_6POINT0_FRONT       },{ "hexagonal",      AV_CHANNEL_LAYOUT_HEXAGONAL           },{ "6.1",            AV_CHANNEL_LAYOUT_6POINT1             },{ "6.1(back)",      AV_CHANNEL_LAYOUT_6POINT1_BACK        },{ "6.1(front)",     AV_CHANNEL_LAYOUT_6POINT1_FRONT       },{ "7.0",            AV_CHANNEL_LAYOUT_7POINT0             },{ "7.0(front)",     AV_CHANNEL_LAYOUT_7POINT0_FRONT       },{ "7.1",            AV_CHANNEL_LAYOUT_7POINT1             },{ "7.1(wide)",      AV_CHANNEL_LAYOUT_7POINT1_WIDE_BACK   },{ "7.1(wide-side)", AV_CHANNEL_LAYOUT_7POINT1_WIDE        },{ "octagonal",      AV_CHANNEL_LAYOUT_OCTAGONAL           },{ "hexadecagonal",  AV_CHANNEL_LAYOUT_HEXADECAGONAL       },{ "downmix",        AV_CHANNEL_LAYOUT_STEREO_DOWNMIX,     },{ "22.2",           AV_CHANNEL_LAYOUT_22POINT2,           },
};

↩︎

ffmpeg学习——音频源相关推荐

ffmpeg学习函数分析swr_convert
文章目录简单说明采样格式转换声道格式转换采样频率转换 libswresample库使用函数介绍示例代码有关ffmpeg中主要的api函数源码解析参考雷神系列文章,整理如下 ffmpeg学 ...
FFmpeg学习(1)开篇
FFmpeg学习(1)开篇 FFmpeg学习(2)源码编译,环境配置为什么要学习FFmpeg 本人希望打算深入研究音视频领域,音视频领域的内容很多,我自己打算从几方面循序渐进:FFmpeg常用功能实 ...
FFmpeg学习之八（FFmpeg源码编译）
FFmpeg学习之八(FFmpeg源码编译) Mac下 FFmpeg源码编译安装 1. 使用终端安装FFmpeg 2. 手动编译 2.1 编译环境 - Xcode 2.2 安装依赖库 2.3 安装F ...
FFmpeg学习4：音频格式转换
前段时间,在学习试用FFmpeg播放音频的时候总是有杂音,网上的很多教程是基于之前版本的FFmpeg的,而新的FFmepg3中audio增加了平面(planar)格式,而SDL播放音频是不支持平面格式 ...
学习ffmpeg视音频编解码
在CSDN上的这一段日子,接触到了很多同行业的人,尤其是使用FFMPEG进行视音频编解码的人,有的已经是有多年经验的"大神",有的是刚开始学习的初学者.在和大家探讨的过程中,我忽然 ...
FFMPEG视音频编解码学习(1)
###开篇看过了FFMPEG视音频编解码的基础知识,接着还有许多比如制作一个基于FFMPEG的视频播放器等,但是好像比较抽象,而且在公司的mac上很多软件也没有(重点是看的一头雾水), 还是老老实实 ...
FFmpeg学习3：播放音频
参考dranger tutorial,本文将介绍如何使用FFmpeg解码音频数据,并使用SDL将解码后的数据输出. 本文主要包含以下几方面的内容: 关于播放音频的需要的一些基础知识介绍使用SDL2播 ...
CentOS7源码安装ffmpeg，并利用ffmpeg实现音频截取
下载ffmpeg git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg 下载完成后,进入到下载好的ffmpeg目录中执行configure脚本,并指定编 ...
基于 FFMPEG 的音频编解码（一）：Hello FFMPEG，安装与编译
Hello FFMPEG 基于 FFMPEG 的音频编解码(一):Hello FFMPEG,安装与编译基于 FFMPEG 的音频编解码(二):音频解码基于 FFMPEG 的音频编解码(三):音频编 ...

ffmpeg学习——音频源

一、abuffer

示例

二、aevalsrc

示例

三、afirsrc

四、anullsrc

示例

五、flite

示例

更多

六、anoisesrc

示例

七、hilbert

八、sinc

示例

附录

channel_layout

AVSampleFormat

持续时间

channel_layout

ffmpeg学习——音频源相关推荐

最新文章

热门文章