目录

  • 为什么音频需要编码
  • 编码原理
    • 频频域掩蔽效应
    • 时域掩蔽效应
  • 压缩编码方法
  • 音频编码器选型

为什么音频需要编码

和图像压缩原理对比
数字音频信号如果不加压缩地直接进行传送,将会占用极大的带宽。
例如,一套双声道数字音频若取样频率为44.1KHz,16bit量化,码率为

2 x 44.1kHz x 16bit = 1.411Mbit/s

如此大的带宽将给信号的传输和处理都带来许多困呐和成本(阿里云服务器带宽大于5M后,没M价格是100元/月)
因此必须采取音频压缩技术对音频数据进行处理,才能有效地传输音频数据

编码原理

数字音频压缩编码在保证信号在听觉方面不产生失真的前提下,对音频数据信号尽可能大的压缩,降低数据量。数字音频压缩编码采取去除声音信号中的冗余成分的方法来实现

所谓冗余成分指的是音频中不能被人耳感知到的信号,即[20, 20k]Hz以外频率的信号,他们对确定声音的音色,音调等信息没有任何的帮助。

此外,根据人耳听觉的生理和心理声学现象,当一个强音信号与一个弱音信号同时存在时,弱音信号将被强音信号所遮蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应,主要表现在频谱掩蔽效应和时域掩蔽效应。

频频域掩蔽效应


一个频率的声音音量(db)小于某个阈值,人耳就会听不到。当有另外能量较大的声音出现的时候,该声音频率附近的阈值就会提高很多,即所谓的掩蔽效应,如上图所示。

由图中我们可以看出人耳对2KHz~5KHz的声音最敏感,而对频率太低或太高的声音信号都很迟钝,当有一个频率为0.2KHz、强度内60db的声音出现时,其附近的阈值提高了很多.
由图中我们可以看出在在0.1KHz以下、1KHz以上的部分,由于离0.2KHz强信号较远,不受0.2KHz强信号影响,阈值不受影响;而在0.1KHz~1KHz范围,由于0.2KHz强音的出现,阈值有较大的提升,人耳在此范围所能感觉到的最小声音强度大幅提升。如果0.1KHz~1KHz范围内的声音信号的强度在被提升的阈值曲线之下,由于它被0.2KHz强音信号所掩蔽,那么此时我们人耳只能听到0.2KHz的强音信号而根本听不见其它弱信号,这些与0.2KHz强音信号同时存在的弱音信号就可视为冗余信号而不必传送。

20hz和20khz左右音量需要非常大才能听见
如果在)0.2khz时音量很大,就会出现掩蔽效应,即0.2khz音量很大的点的附近频率的声音也需要很大才能听得见。于是我们不需要编码白色部分的声音,低于那个点以下的声音都听不到

时域掩蔽效应


在强音和弱音信号同时出现时,还存在时域掩蔽效应。即两者发生时间很接近的时候,也会发生掩蔽效应。时域掩蔽过程曲线如图所示,分为前掩蔽、同时掩蔽和后掩蔽三部分。

  • 前掩蔽
    人耳在听到强信号之前的短暂时间内,已经存在的弱信号或被这笔而听不到

  • 同时掩蔽
    当强信号消失后与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到

  • 后掩蔽
    强信号消失后,需经过较长的一段时间才能重新听见弱信号

这些被掩蔽的弱信号可以视为冗余信号

突然有强音,这时弱信号听不见
强音消失后一段时间后才能听见弱信号

压缩编码方法

当前数字音频编码领域存在不同编码方案和实现方式,基本编码思路大同小异,如图所示

对每一个音频声道中的音频采样信号

  • 1、将他们映射到频域中,这种时域到频域的映射可通过子带滤波器实现。每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值(人耳对1kHz-7kHz较为敏感)
  • 2、由计算出的掩蔽门限值决定从公共比特池中分配给该声道不同频率域中多少比特数,接着进行量化以及编码工作
  • 3、将控制参数及辅助数据加入数据之中,产生编码后的数据流

音频编码器选型

  • OPUS
  • MP3
  • AAC
  • AC3和EAC3(杜比公司的方案)
    参考《详解音频编码的原理、演进和引用选型等》
    https://www.jianshu.com/p/6b4c481f4294

音频处理——音频编码原理简介相关推荐

  1. 即时通讯音视频开发(七):音频基础及编码原理入门

    前言 即时通讯应用中的实时音视频技术,几乎是IM开发中的最后一道高墙.原因在于:实时音视频技术 = 音视频处理技术 + 网络传输技术 的横向技术应用集合体,而公共互联网不是为了实时通信设计的. 系列文 ...

  2. 音视频基础之音频编码原理简介

    一:隐蔽信号 数字音频信号如果不加压缩地直接进行传送,将会占用极大的带宽.例如,一套双声道数字音频若取样频率为44.1KHz,每样值按16bit量化,则其码率为: 244.1kHz16bit=1.41 ...

  3. FFmpeg入门详解之20:视频编码原理简介

    视频为何需要压缩? 原因:未经压缩的数字视频的数据量巨大 ● 存储困难 ○ 一G只能存储几秒钟的未压缩数字视频. ● 传输困难 ○ 1兆的带宽传输一秒的数字电视视频需要大约4分钟. 主要压缩了什么东西 ...

  4. 二维码 编码原理简介

    一.什么是二维码: 二维码 (2-dimensional bar code),是用某种特定的几何图形按一定规律在平面(二维方向上) 分布的黑白相间的图形记录数据符号信息的. 在许多种类的二维条码中,常 ...

  5. 【Android音视频开发】音频编码原理

    文章变更表 文章版本号 变更内容 变更日期 备注 0.0.1 创建 2022/9/29 初版 0.0.2 补充编码原理和音频格式等内容 2022/9/30 1. 前言 在[Android音视频开发] ...

  6. 详解音频编解码的原理、演进和应用选型等

    本文来自网易云音乐音视频实验室负责人刘华平在LiveVideoStackCon 2017大会上的分享,并由LiveVideoStack根据演讲内容整理而成(本次演讲PPT文稿,请从文末附件下载). 1 ...

  7. 即时通讯音视频开发(十八):详解音频编解码的原理、演进和应用选型

    1.引言 大家好,我是刘华平,从毕业到现在我一直在从事音视频领域相关工作,也有一些自己的创业项目,曾为早期Google Android SDK多媒体架构的构建作出贡献. 就音频而言,无论是算法多样性, ...

  8. 数据压缩(十三)——MPEG音频编码原理及编码器调试

    文章目录 一.MPEG音频编码原理 1.1 基本思想 1.2 心理声学模型(Psychoacoustic model) 1.2.1 听觉阈值 1.2.2 频域掩蔽 1.3 临界频带(Critical ...

  9. FFmpeg入门详解之16:音频编码原理

    音频编码 编码 即压缩编码,其原理是压缩掉冗余的信号,冗余信号是指不能被人耳感知到的信号,包括人耳听觉范围之外的音频信号以及被掩蔽掉的音频信号. 模拟音频信号转换为数字信号需要经过采样和量化, 量化的 ...

  10. LPCM AAPCM G711 G726 AAC 音频采样、编码及帧大小计算

    LPCM LPCM: linear pulse code modulation     LPCM,即线性脉冲编码调制,是一种非压缩音频数字化技术,是一种未压缩的原音重现,在普通CD.DVD及其他各种要 ...

最新文章

  1. docker的容器管理和网络模式
  2. 如何使用SAP UI5 SDK网站查询指定控件的属性如何使用
  3. 商务部部长助理黄海:中国服务外包产业发展势头良好
  4. 电脑太慢了最简单的办法怎么弄_最简单快速的方法恢复电脑误删文件-数据恢复常见问题...
  5. (10)二进制文件方式部署Kubernetes高可用集群----------部署node节点
  6. Geodetector软件下载、地理探测器的应用实践与结果解读
  7. 怎样启动Windows系统呢
  8. 基于公众号扫码授权登录
  9. 做人做事要有上进心2
  10. html表单控件富文本框,表单控件之富文本框实践
  11. 光纤收发器双模和单模有什么区别?如何区分单模、双模光纤收发器?
  12. Office服务器意外响应,Office 所有使用过程中未响应,崩溃,意外关闭
  13. 关于CreateProcess的问题
  14. C语言文件操作与系统文件操作接口
  15. 【单调栈】【数据结构】向右看齐 Look Up(luogu P2947)
  16. Lintcode题目总结
  17. Flink Task、Sub-Task、task slot和parallelism
  18. UI自动化测试工具-龙测使用体验
  19. 在CentOS 5里使用 vault.centos.org 作为yum源
  20. 企业IT管理基础知识巩固系列之(三)数据中心(机房)等级标准

热门文章

  1. 【MySQL】不建议使用分区表
  2. 人工智能/机器人/工程类投稿期刊、会议推荐
  3. Spring Boot中使用JUnit5进行单元测试
  4. python爬虫爬取百度图片
  5. 微信小程序:获取验证码
  6. window MFC桌面下雪程序
  7. 加点字符就能让qq昵称很酷的神奇代码?
  8. 谷歌企业文化建设分析
  9. 博客迁移说明 : )
  10. 【Scala】Scala练习题(一)