音频属性采样率、通道数、位数、比特率、帧等
【音频】
指人耳可以听到的声音频率在20HZ~20kHz之间的声波,称为音频。
【采样频率】
来源:音频采样,是把声音从模拟信号转换为数字信号。
定义:采样率,就是每秒对声音进行采集的次数,同样也是所得的数字信号的每秒样本数。
常用的采样率有:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz - AM调幅广播所用采样率
22,050 Hz和24,000 Hz - FM调频广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
47,250 Hz - 商用 PCM 录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 商用数字录音机所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
2.8224 MHz - Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。
采样频率大小意义:采样越高,声音的还原就越真实越自然,但同时它占的资源比较多。
人对频率的识别范围:是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。这和电影的每秒 24 帧图片的道理差不多。
如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.
【声道】
当人听到声音时,能对声源进行定位,那么通过在不同的位置设置声源,就可以造就出更好的听觉感受,如果配合影像进行音频位置的调整,则会得到更好的视听效果。常见的声道有:
- 单声道,mono
- 双声道,stereo,最常见的类型,包含左声道以及右声道
- 2.1声道,在双声道基础上加入一个低音声道
- 5.1声道,包含一个正面声道、左前方声道、右前方声道、左环绕声道、右环绕声道、一个低音声道,最早应用于早期的电影院
- 7.1声道,在5.1声道的基础上,把左右的环绕声道拆分为左右环绕声道以及左右后置声道,主要应用于BD以及现代的电影院
【采样位数】
音频在经过采样得到样本后,还需要对该样本执行两个步骤:
1.量化。音频量化的量化位数常用的有:
8bit (也就是1字节) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
16bit (也就是2字节) 可以细到 65536 个数, 这已是 CD 标准了;
32bit (也就是4字节) 能把振幅细分到 4294967296 个等级, 实在是没必要了.
量化位数又叫做采样位数、位深度、分辨率, 它是指声音的连续强度被数字表示后可以分为多少级。也可以说是声卡的分辨率,它的数值越大,分辨率也就越高,所发出声音的能力越强。
2.二进制编码。也就是把量化所得的结果,即单个声道的样本,以二进制的码字进行存放。
【帧】
音频在量化得到二进制的码字后,需要进行变换,而变换是以块为单位(block)进行的,一个块由多个(120或128)样本组成。而一帧内会包含一个或者多个块。帧的常见大小有960、1024、2048、4096等。一帧记录了一个声音单元,它的长度是样本长度和声道数的乘积。
帧(frame)是音频文件的最小的组成单位
一个音频音频帧的播放时长计算为:
音频帧的播放时间=每帧对应的采样样本的个数/采样频率(单位为s)
如果我们定义一个mp3的采样率为44.1khz,假设mp3格式的每帧采样点为1152个,则一个mp3音频帧的长度为,1152 /44100 *1000 =26.122ms。
不同的音频文件,音频的帧采样点是不一样的
【比特率】
每秒的传输速率(位速, 也叫比特率)。如705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒(per second)的意思,表示每秒705600bit的容量。压缩的音频文件常常用倍速来表示,譬如达到CD音质的MP3是128kbps/44100HZ。注意这里的单位是bit而不是Byte,一个Byte等于8个bit(位),bit是最小的单位,一般用于网络速度的描述和各种通信速度,Byte则用于计算硬盘,内存的大小。
【采样率、采样位数、比特率三者之间的关系】
比特率=采样率采样位数通道数
例:根据一个文件的大小推算出文件时长
譬如 “Windows XP 启动.wav” 的文件长度是 424,644 字节, 它是 “22050HZ / 16bit / 立体声” 格式(这可以从其 “属性->摘要” 里看到),
那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050162 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒),
播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。
但是这还不够精确, 包装标准的 PCM 格式的 WAVE 文件(.wav)中至少带有 42 个字节的头信息, 在计算播放时间时应该将其去掉,
所以就有:(424644-42) / (2205016*2/8) ≈ 4.8140816(秒). 这样就比较精确了。也就是:
(文件总大小 - 头信息)/ (采样率 * 采样位数 * 通道数 / 8) [也就是比特率] ≈ 文件时长。
【参考】
https://blog.csdn.net/weixin_30824277/article/details/95092351
https://blog.csdn.net/LS7011846/article/details/86634521
音频属性采样率、通道数、位数、比特率、帧等相关推荐
- 【Android 高性能音频】AAudio 音频流 样本缓冲 相关配置 ( 通道数 | 样本格式 | 帧缓冲 | 采样率 | 每帧样本数 == 通道数 )
文章目录 I . AAudio 音频流创建流程 II . AAudio 音频流构建器 设置 通道数 AAudioStreamBuilder_setChannelCount III . AAudio 音 ...
- 音频属性相关:声道、采样率、采样位数、样本格式、比特率
不仅限于FFmpeg, 音频采样所得的PCM都含有三个要素:声道(channel).采样率(sample rate).样本格式(sample rate). 声道 当人听到声音时,能对声源进行定位,那么 ...
- 音频通道数、采样频率、采样位数、采样个数(样本数)的概念及计算一帧音频的大小、每秒播放的音频字节大小、一帧的播放时长、音频重采样
对于下面data和linesize的解释(参考下面3.4中的av_samples_alloc_array_and_samples函数说明): 1)data是通道的意思,例如双通道,data[0]代表左 ...
- 音频参数获取:采样率、比特率,通道数
获取音频文件采样率.比特率,通道数的一种方法: MediaExtractor mex = new MediaExtractor();try {mex.setDataSource(mp3Path);} ...
- 音频相关基础知识(采样率、位深度、通道数、PCM、AAC)
(这其实是一篇转载好几篇的博客,然后自己加了少许) 转载博客1 关于采样率&位深&码率&无损的一些心得_Marenow的博客-CSDN博客_flac格式采样率比特率记笔记,记下 ...
- 音频、音频属性-采样精度、比特率、音频格式
音频定义 1.Audio,指人说话的声音常指300Hz-3400Hz的频带. 2.指存储声音内容的文件. 3.在某些方面能指作为波滤的振动. 音频是个专业术语,人类能够听到的所有声音都称之为音频,它可 ...
- 【Android 高性能音频】AAudio 音频流 数据回调细节 ( 数据回调函数优先级 | 数据回调函数 | 采样率 | 采样数 | 缓冲区调整 | 线程不安全 )
文章目录 I . 数据回调函数优先级 II . 数据回调函数 相关内容 III . 采样率 处理细节 IV . 数据回调函数 每次 采样个数 numFrames V . 数据回调函数 缓冲区 ( AA ...
- 关于PCM音频重采样思路及注意事项(频率变换和通道数变换(单通道转双通道))
最近在做一个语音广播的项目,实现语音广播的过程主要是:音频采集.音频编码.音频发送.音频解码和音频播放,这个过程在这里不展开说明,本文主要讲述其中的音频重采样和音频降噪的问题和记录如何解决的思路.本文 ...
- (一) 音视频基础_Mpeg4封装格式音视频编码格式_解封装解码_像素格式_PCM音频-采样率-通道-planar_MP4标准和h264格式的NAL的GOP分析
封装:从文件中把音视频读出来 解码:将音视频解压出来 重采样:将音视频转换成声卡显卡支持的格式,视频需要做像素格式的转换MPEG(或叫MPEG-4)是一套用于音频﹑视频信息压缩的编码标准. MPEG- ...
- 图像属性:格式、尺寸、分辨率、通道数、颜色空间
下图是我从桌面找的一张图片,右键属性,可以看到如下内容: 常用的属性有:尺寸.位深度.格式等 一.图像格式 BMP:位图 二.图像尺寸 灰度图像:0~255 0:黑色 255:白色 彩色图像: ...
最新文章
- protel快捷键大全
- .NET 5 自身就是一个 .NET Standard
- Spring Boot freemarker导出word下载
- 《数字金融消费者权益保护实践与探索》正式发布
- Apache POI读取Excel
- Java微信运动步数排序设计_微信小程序仿微信运动步数排行-交互
- MAC上使用gdb(Mac10.12未解决)
- LNMP 1.2 Nginx编译安装
- python网易云收费_python网易云音乐抓取
- Office 2019怎么下载?附学习视频教程
- ubuntu上安装使用冰封王座
- unity android录制视频教程,Unity移动端视频录制,Android和IOS都支持
- java程序throw异常,Java中处理异常throw和throws
- 负数和正数的存储方式。
- 什么是动态编程Python示例
- 无法向虚拟机中拷贝文件解决办法
- android平板能玩吃鸡吗,刺激战场用什么平板好 平板吃鸡配置推荐
- java基于SSM的手机商城
- 东北大学软件项目管理与过程改进复习提纲(2020)——第七章《项目成本管理》
- 20本必读的用户体验书目