记笔记,记下来自己的一些关于音频基础知识的总结。

采样率

外界的声音都是模拟信号,在数字设备中A/D转化成为了由0、1表示的数字信号后被储存下来。数字信号都是离散的,所以采样率是指一秒钟采样的次数,采样率越高,还原的声音也就越真实。由于人耳听觉范围是20Hz~20kHz,根据香农采样定理(也叫奈奎斯特采样定理),理论上来说采样率大于40kHz的音频格式都可以称之为无损格式。但在40kHz采样率下得到的声音已没有细节可言,所有频率都是只采样了一个波峰一个波谷。现一般的专业设备的采样频率为44.1kHz。44.1kHz是专业音频中的最低采样率,也叫“CD级音质”(22.05kHz采样率为广播级音质)。更细化的还有96kHz,192kHz等等,当然要听到这些更高采样率中的细节取决于耳朵和设备了。

位深度

若要尽可能精确地还原声音,只有高采样率是不够的。描述一个采样点,横轴(时间)代表采样率,纵轴(幅度)代表位深度。16bit表示用16位(2个字节)来表示对该采样点的电平(通俗点来说和音量大小成正比)进行编码时所能达到的精确程度,也就是把纵轴分为16份描述电平大小,如-3dB和-3.1415926dB的精度差别。同理还有20bit和24bit。16bit被认为是专业音频领域里面最低的位深度标准,和44.1kHz的采样率一样,共同作为专业音频和消费产品的标准。位深度也直接关系到信号噪声比的大小,直接影响到所录制信号的整体动态范围。

码率

无损无压缩格式中(如.wav),码率=采样率x位深度x声道数。在有损压缩中(如.mp3)码率便不等于这个公式了,因为原始信息已经被破坏。码率描述了一秒钟的该音频的信息量,因而声音文件总的大小是码率x总时长。码率也叫位速,单位是比特率(bps,bit per second)。通常听歌时候的128kbps、320kbps均为码率,其中320kbps是mp3格式的最高比特率。但和44.1kHz采样率、16bit位深的wav文件比起来(计算一下双声道的码率是44.1x16x2=1411.2kbps),相去甚远。压缩后码率便发生了变化。无损压缩中的码率与音质无关,有损压缩中的码率和音质正相关。

无损压缩

无损压缩指的是在无损格式之间的压缩(转换),无论压缩(转换)成什么格式,音质都是相同的,并且都能还原成最初同样的文件。平时所说的无损均是指无损压缩,没有无损码率的说法。对于各种格式的压缩都是对应着一种算法(或者说编码),播放的时候需要有解码器进行译码,而且不同的解码器也可能会影响解压出来的文件完整性。常见的无损格式有:
wav:微软公司的一种声音文件格式,是无压缩的最接近真实声音的格式(其次是midi),支持多采样率多量化精度。所有的无损格式本质都是wav的压缩,在播放时会转回wav。
flac:Free Lossless Audio Coded,是国际通用格式,特点是压缩比高,编码算法也相当成熟,当flac文件受损时依然能正常播放。另外,该格式也是最先得到广泛硬件支持的无损格式。
ape:使用Monkey‘s Audio软件对CD抓轨而转换成的文件格式,但优势并不突出,解码较慢。
wma-lossless:也是微软公司出品,特点是压缩比高,但未成为主流。
aiff:苹果公司出品,是Apple苹果电脑上面的标准音频格式。
DSD:Sony大法的,不是很了解,欣赏不来辣种文化,但就说单纯的冲,还是要冲的。

有损压缩

有损压缩指的是声音信息在压缩过程中发生了丢失,且所丢失的声音无法用采样率和位数表示出来。但特点就是压缩后的文件变的很小,常在流媒体中使用。常见的有损格式有:
mp3:模拟人耳听觉研究出的一种复杂算法,被称为“心理声学模型”。它通过抽取音频中的一些频段来达到提高压缩比,降低码率,减少所占空间,但同时声音的细节如人声的情感、后期的混响等等都已经发生变形。盲听的话也很难较快地分辨出wav和mp3,需要借助设备。mp3目前是最为普及的声频压缩格式,可以最大程度地保留压缩前的音质。
wma:微软公司力作,特点是在较低比特率下(如64kbps),wma可以在与mp3相同的音质条件下获得更小的体积。并且在超低比特率(如16kbps),wma音质比mp3要好得多。
aac:苹果电脑上的声音文件储存格式。
ogg:完全免费、开放和没有专利限制,但普及性较差。

如有错误,还望各位不吝指正!

关于采样率位深码率无损的一些心得相关推荐

  1. HEVCProfileMain10HDR10 和 非8bit数据位深的一些讨论。

    用过Android-MediaCodec做视频编解码的同学,应该都会见过这个定义变量--HEVCProfileMain10HDR10,其定义是在MediaCodecInfo.CodecProfileL ...

  2. 数字音视频技术:音频中的一些概念(采样率, 位深度, 声道数, Sample/Frame/Packet)

    数字音视频技术:音频中的一些概念(采样率, 位深度, 声道数, Sample/Frame/Packet) - 夜行过客 - 博客园 视频音频比特率(码率)与采样率有什么联系? - 知乎

  3. 图像的大小计算 位深和色深

    图像的大小计算 1.位深和色深 位深:即在某一分辨率下,每一个像素点可以有多少种色彩来描述,单位为"bit"(位).典型的色深是8-bit.16-bit.24-bit和32-bit ...

  4. C++:将六个tif分色片写成bmp格式图片(8位深)

    #include <cv.h> #include <highgui.h> #include <iostream> //#include <windows.h& ...

  5. 【OpenCV】cv::Mat位深和通道,CV_8UC1等

    位深 每个像素由多少位来存储 是一个精度问题,一般图片是8bit(位)的,则深度是8 通道 每个像素点能存放多少个数 类似于RGB彩色图中的每个像素点有三个值,即三通道 一个图像的通道数是N,就表明每 ...

  6. 【PIL】图像分割竞赛中8位深调色板模式的mask读取与保存(PASCAL VOC)

    [PIL]图像分割竞赛中8位深调色板模式的mask读取与保存(PASCAL VOC) 目录: [PIL]图像分割竞赛中8位深调色板模式的mask读取与保存(PASCAL VOC) 1.调色板图像原理 ...

  7. 纯无趣技术贴,关于色深、位深、图像深度详解

    因为近期接触了一点嵌入式开发,需要的图片资源格式和以往接触的移动及web开发差别比较大,才有了下面这篇文章.因为比较晦涩,不需要的就可以绕行了. 图像深度.色深.位深的大统一 首先明确一点,图像深度就 ...

  8. 2021-01-12 图像的大小计算 位深和色深

    图像的大小计算 1.位深和色深 位深:即在某一分辨率下,每一个像素点可以有多少种色彩来描述,单位为"bit"(位).典型的色深是8-bit.16-bit.24-bit和32-bit ...

  9. 用电脑自带的系统软件改变图片的格式、分辨率和位深

    最近想学习一个图片处理的小项目,但是图片输入的格式规定了,只能是328x356的分辨率和位深度为8的bmp图片,然后我就傻了,在网上找了半天,说是能够用PS软件之类的能完成,但是真的不想大材小用,而且 ...

最新文章

  1. R语言ggplot2可视化:应用pivot_longer函数将数据从宽格式转换为长格式、为dataframe的每一列绘制密度图和直方图(堆叠)
  2. UVA 311 Packets
  3. 64 大小_电脑系统32位和64位有什么区别
  4. 今天写的一个makefile,备份下
  5. Flex布局里的align-self属性
  6. 学习数字图像处理经验谈
  7. 正确使用和理解C#中的闭包
  8. java字符串拼接例子_Java详解【String】+【StringBuilder vs StringBuffer】+【字符串拼接】...
  9. gitee自动部署的使用
  10. Python使用Tornado+Redis维护ADSL拨号服务器代理池
  11. c语言中不带任何修饰符的浮点变量,江苏省计算机等级考试二级C语言笔试辅导题目...
  12. 在mysql存储过程中拼接sql解决in的字段类型不匹配问题
  13. 端游一般用什么配置的服务器呢?
  14. latex关于的报错问题及表格排版问题
  15. uboot分析之 usb启动
  16. source insight的查找功能
  17. 临床执业助理医师(综合练习)题库【5】
  18. ❥关于C++之写入/读取文本文件
  19. 想哪写哪_随笔20191203
  20. 行车记录仪总显示SD卡已满?看看是怎么回事

热门文章

  1. ROM制作---原生安卓国内适配部分修改点
  2. 【JTAG】1500协议详解
  3. Java核心技术----枚举类型与泛型
  4. android客户端接入新浪、腾讯微博以及人人网
  5. webstorm 2018 激活破解方法大全 亲测第三个有用
  6. 老程序员的经验:应该怎么培养编程思维?
  7. Python全栈开发——面向对象进阶(一切皆对象)
  8. 虚拟机Ubuntu下共享文件夹MyShare不显示
  9. 心电信号调理电路设计
  10. 学习PCB之pcb器件的绘制