【音视频开发】为什么无损音频会有44.1Khz这样的奇葩采样率?
文章目录
- 一、 问题:为什么无损音频会有44.1Khz这样的奇葩采样率?
- 二 、PCM流程
- 2.1 PCM流程
- 2.2 PCM量化方式
- 2.2 量化位数
- 2.3 比特率
- 三、答疑解惑
- 3.1 使用采样定理来解释
- 3.2 以影片磁带录音?硬件限制而来的 44.1kHz
- 3.3 关于44100和质数的关系
- 四、参考链接
一、 问题:为什么无损音频会有44.1Khz这样的奇葩采样率?
相信每一个刚接触音频的玩家,看到44100Hz这种奇葩采样率的时候,脑袋上都会冒出下面这个黑人问号:
二 、PCM流程
2.1 PCM流程
PCM: Pluse Code Modulation
脉冲编码调制
2.2 PCM量化方式
模拟信号的切细规则是CD格式。
“采样频率为44.1kHz,量化位数为16位”是指以每秒44,100
次执行采样,然后以16
位精度(从2到16的幂级数)读取电平。运作方式。采样也称为采样
,但是采样首先出现,没有采样就无法进行量化。
2.2 量化位数
2.3 比特率
数据比特率:1秒时间内的比特数目,用于衡量音频数据单位时间内的容量大小。
以CD的音质为例:
- 量化格式为16比特(2字节)
- 采样率是44100
- 声道数为2
这些信息就描述了CD的音质
而对于CD音质的数据,比特率是多少呢?
44100 * 16 * 2 = 1378.125kbps
那么1分钟,这类CD音质的数据需要占据多大的存储空间呢?
1378.125 * 60 / 8 / 1024 = 10.09MB
三、答疑解惑
3.1 使用采样定理来解释
音频采样也是一种信号的转化,即由模拟信号转化为数字信号。既然是信号间的转化,那么它便符合【奈奎斯特采样定理】。
图:奈奎斯特采样定理界面
奈奎斯特采样定理指出,当采样频率低于2倍频谱峰值时,将会出现混淆现象,若超过2倍则不会出现混淆。由于人类的听力范围约为20 Hz至20,000 Hz,因此采样率必须大于40 kHz。
- 采样定理
根据奈奎斯特定理(Nyquist Theorem)
,取样频率两倍大于被取样讯号的最大频率,即可重构出原始的被取样讯号。 - 香农采样定理
- 奈奎斯特采样定理(Nyquist)
时域采样定理(香农采样定理,又称奈奎斯特采样定理)
的表述如下:
频带为 F 的连续信号 f(t) 可用一系列离散的采样值 f(t1), f(t1±Δ t), f(t1±2Δ t),…来表示,只要这些采样点的时间间隔 Δ t≤1/2 F,便可根据各采样值完全恢复原来的信号 f(t)。
时域采样定理的另一种表述方式是:
频带为F的连续信号f(t)可用一系列离散的采样值f(t1),f(t1±Δt),f(t1±2Δt),…来表示,只要这些采样点的时间间隔Δt≤1/2F,便可根据各采样值完全恢复原来的信号f(t)。时域采样定理的另一种表述方式是:当时间信号函数f(t)的最高频率分量为fM时,f(t)的值可由一系列采样间隔小于或等于1/2fM的采样值来确定,即采样点的重复频率f≥2fM。图为模拟信号和采样样本的示意图。
但实际上,重构出原始讯号所用来抗混叠(Anti-Aliasing)
、消除某频率以上讯号的低通滤波器(Low Pass Filter)
并非是理想的,它有个过渡频宽(Transition Band)
会导致在这个频宽内的讯号仍被衰减通过。
因此,如果取样频率不足于被取样讯号的最大频率加上其低通滤波器的过渡频宽的两倍,最大频率附近的声音讯号依然会有混叠现象,将会导致讯号失真(Distortion)。
为了完整保留最大声音频率,必须预留过度频宽,典型的过度频宽大小为2050Hz
我们人类的耳朵可捕捉到的声波范围是20~20kHz
。所以对于人类来说,超出该范围的声音无意义(反正听不到)。大于20kHz的波称为超声波(超音波
),小于20Hz的波称为次声波
,超声波和次声波我们人耳都是听不到的。
我们计算采样频率的时候在最大频率20kHz加上过度频宽并乘以2,这也是为何CD是使用44.1kHz作为取样频率的原因,算法如下:
(20000Hz + 2050Hz) * 2 = 44100Hz = 44.1kHz
3.2 以影片磁带录音?硬件限制而来的 44.1kHz
其实不少影音规格、参数有时都是受当时硬件的限制而制定出来,好似因为 CRT 电视的亮度与电压不是成线性正比,于是就有了 Gamma 2.2 这个常见的电视设定,CD 和数码音乐的 44.1kHz 这个奇特数字也是有点类似。
因为早期只有影片录影的磁带才有足够容量来录制一定长度的数码音乐讯号,而当时这类磁带又分为欧洲主流的 PAL 和美国、日本主流的 NTSC 制式,为了减低制作成本,以最少的改动来运用当时现有的器材,于是在取样率方面就要同时迁就 PAL(625 线、50Hz)和 NTSC(525 线、60Hz)
的规格。
撇除不可用的线数(e.g. 625 - 37 = 588 线、525 - 35 = 490 线),隔行扫描的线数除以二(e.g. 588 / 2 = 294、490 / 2 = 245),于是就计算出了这个可以共用 PAL 和 NTSC 磁带的取样率:
PAL: 294 × 50 × 3 = 44,100 Hz
NTSC: 245 × 60 × 3 = 44,100 Hz
当中「× 3」
是每条线可以储存 3 次取样
,而 44.1kHz 也超过了人耳聆听范围 20Hz - 20kHz 所需要的取样率,其后 44.1kHz 也被应用到 1982 年的 CD「Red Book」定义规格当中,于是也沿用至今。
最早的数字录音由一台录像机 + 一部PCM编码器制作的,由于当时使用的是PAL录像制式(帕制,与之对应的有NTSC),场频50Hz,可用扫描线数294条,一条视频扫描线的磁迹中记录3个音频数据块,把他们相乘,就得到了44100这个奇葩数字…(索尼和飞利浦的工程师要背锅)
7、80 年代的数码录音采用的就是「现成」的录影带(Video Cassette Tape)。
当年的数码录影、影像系统分为欧洲的 PAL 和美国、日本的 NTSC,虽然来到全高清和 4K 年代仍有 50Hz、60Hz 之分,但近年的电视基本都同时支援,所以大家也没太留意制式的分别了。
CD 也沿用了 44.1kHz 的取样率规格,所以早期在 rip 碟的时候也是保留 44.1kHz 有最佳音质。
3.3 关于44100和质数的关系
44100 是前四个质数
(22⋅32⋅52⋅72)({\displaystyle 2^{2}\cdot 3^{2}\cdot 5^{2}\cdot 7^{2}}) (22⋅32⋅52⋅72)
,因此具有许多有用的整数因子,对于很多运算来说是个简单的数字。
使用了 44.1 kHz 的各种减半和倍增 –WAV文件中的较低速率 11.025 kHz 和 22.05 kHz,适用于低带宽应用,而较高的 88.2 kHz 和 176.4 kHz 速率用于母带制作和DVD 音频 – 较高的速率对于提供额外分辨率的通常原因都很有用(因此对编辑引入的失真不太敏感), 并且还使低通滤波更容易,因为可以实现更大的过渡带(在20 kHz和采样率下的人听觉之间)。88.2 kHz 和 176.4 kHz 速率主要用于最终目标是 CD 的情况。
四、参考链接
- 44,100_Hz Wiki
- 什么是采样频率,量化比特数和时钟?
- CD为什么采用44.1kHz采样频率?
- Why 44.1 kHz?
- 无损音频为什么是44.1Khz
- 科普 | 为什么音频采样率都是44100?
- 【影音競技場】44.1kHz vs. 48kHz:奇特取樣率同攝錄制式有關?兩者音質有分別?
【音视频开发】为什么无损音频会有44.1Khz这样的奇葩采样率?相关推荐
- 【秒懂音视频开发】07_音频录制01_命令行
命令简介 FFmpeg的bin目录中提供了3个命令(可执行程序),可以直接在命令行上使用. 3个命令 ffmpeg ffmpeg的主要作用:对音视频进行编解码. # 将MP3文件转成WAV文件 ffm ...
- Qt音视频开发04-保存音频文件(pcm/wav/aac)
一.前言 音频的保存相对来说比视频的要简单,具有通用性,不需要经过ffmpeg的编码,ffmpeg解码出来后一般会转换成pcm原始的数据用来播放,所以对数据直接写文件即可,但是这种格式是无法用播放器直 ...
- 音视频开发基础入门|声音的采集与量化、音频数字信号质量、音频码率
栏目介绍: 为了帮助开发者更好的理解音视频概念,进行音视频应用开发,ZEGO 即构科技联合内部音视频开发专家打磨了本套<音视频开发进阶>课程,帮助大家轻松入门并可以自己动手开发音视频 Ap ...
- iOS音视频开发七:视频采集
将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发. 这里是第七篇:iOS 视频采集 Demo.这个 ...
- iOS音视频开发八:视频编码,H.264 和 H.265 都支持
我们将通过拆解采集 → 编码 → 封装 → 解封装 → 解码 → 渲染流程并实现 Demo 来向大家介绍如何在 iOS/Android 平台上手音视频开发. 这里是第八篇:iOS 视频编码 Demo. ...
- 【Android 音视频开发-音视频硬解码篇】1.音视频基础知识
这是一个入门系列,涉及的知识也仅限于够用. 最后,写文章过程中,会借鉴参考其他人分享的文章,会在文章最后列出,感谢这些作者的分享. 本文你可以了解到 作为开篇的文章,我们先来看看音视频由什么构成的,以 ...
- 即时通讯音视频开发(七):音频基础及编码原理入门
前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...
- 即时通讯音视频开发(六):如何开始音频编解码技术的学习
前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...
- JavaCV音视频开发宝典:基于JavaCV实现wav音频直播服务,wav在线FM电台直播服务,无需流媒体服务,浏览器原生audio标签直接播放wav直播音频
<JavaCV音视频开发宝典>专栏目录导航 <JavaCV音视频开发宝典>专栏介绍和目录 前言 之前写过了mp3实现FM电台直播服务:<JavaCV音视频开发宝典:J ...
最新文章
- 【随笔】express中间件系统的基本实现
- 机器学习笔记:FLOPs
- psu是什么电脑配件_PSU的完整形式是什么?
- Python dict() 函数
- Jetson AGX Xavier配置PyTorch与TorchVision流程
- linux mysql 6.0.4 启动_MySQL Connector/J 6.x jdbc.properties 配置, mysql-connector-java-6.0.4.jar 异常...
- 【题解】Luogu P5071 [Ynoi2015]此时此刻的光辉
- 蘑菇车联打造一体化解决方案,致力产业协同发展
- 浅谈算法(简单算法)
- python官网的sdk下载详细步骤-Python SDK(beta)
- web安全day35:Linux防火墙进阶
- 利用js实现文件上传
- DH算法原理深入详解
- 谷歌浏览器的视频下载插件推荐
- 独家专访VB100:趋势科技退出缘于新病毒检测失败
- error: ‘__ATOMIC_RELAXED’ undeclared (first use in this function)
- xshell6配色-保护您的眼睛
- 织梦php版本图片不能上传,让dedecms织梦后台支持上传bmp格式的图片的教程
- 在移动硬盘中,安装CentOS 7双系统
- PHP Curl出现403错误的解决办法 beecloud webhook订单状态返回 服务器403的问题