音频基础概念及常见编码格式
声音是由物体振动而产生的
声波的三要素
声波的三要素是频率、振幅和波形,频率代表音阶的高低,振幅代表响度(音量),波形代表音色。
PCM脉冲编码调制
PCM(Pulse Code Modulation),脉冲编码调制。人耳听到的是模拟信号,PCM是把声音从模拟信号转化为数字信号的技术。原理是用一个固定的频率对模拟信号进行采样,采样后的信号在波形上看就像一串连续的幅值不一的脉冲(脉搏似的短暂起伏的电冲击),把这些脉冲的幅值按一定精度进行量化,这些量化后的数值被连续的输出、传输、处理或记录到存储介质中,所有这些组成了数字音频的产生过程(抽样、量化、编码三个过程)。
描述一段PCM数据一般需要以下几个概念:量化格式(sampleFormat)、采样率(sampleRate)、声道数(channel)
量化是指在幅度轴上对信号进行数字化
采样就是在时间轴上对信号进行数字化
编码就是按照一定的格式记录采样和量化后的数字数据,比如顺序存储或压缩存储
采样频率:每秒采集数据的次数
采样精度:每次采集数据的位数
声道数:存在几路音频
比特率:针对编码格式,表示压缩编码后每秒的音频数据量大小
音频压缩编码
压缩编码的原理实际上是压缩掉冗余信号,冗余信号是指不能被人耳感知到的信号
几种常用的压缩编码格式
(1)WAV
WAV为微软公司(Microsoft)开发的一种声音文件格式,WAV是最接近无损的音乐格式,所以文件大小相对也比较大。
WAV编码的一种实现(有多种实现方式,但是都不会进行压缩操作)就是在PCM数据格式的前面加上44字节,分别用来描述PCM的采样率、声道数、数据格式等信息。
特点:音质非常好,大量软件都支持
适用场合:多媒体开发的中间文件、保存音乐和音效素材。
(2)MP3编码
MP3具有不错的压缩比,使用LAME编码(MP3编码格式的一种实现)的中高码率的MP3文件,听感上非常接近源WAV文件,当然在不同的应用场景下,应该调整合适的参数以达到最好的效果。
特点:音质在128Kbit/s以上表现还不错,压缩比比较高,大量软件和硬件都支持,兼容性好。
适用场合:高比特率下对兼容性有要求的音乐欣赏。
(3)AAC编码
AAC是新一代的音频有损压缩技术,全称Advanced Audio Coding,是一种专为声音数据设计的文件压缩格式。与MP3不同,它采用了全新的算法进行编码,更加高效,具有更高的“性价比”。优点:相对于mp3,AAC格式的音质更佳,文件更小。
适用场合:128Kbit/s以下的音频编码,多用于视频中音频轨的编码。
(4)Ogg编码
Ogg是一种非常有潜力的编码,Ogg除了音质好之外,还是完全免费的,Ogg有着非常出色的算法,可以用更小的码率达到更好的音质,但目前因为还没有媒体服务软件的支持
特点:可以用比MP3更小的码率实现比MP3更好的音质,高中低码率下均有良好的表现,兼容性不够好,流媒体特性不支持。
适用场合:语音聊天的音频消息场景。
音频基础概念及常见编码格式相关推荐
- Python基础概念_14_常见术语
常见术语 15 常见术语 15.1 简介 Python里有一些常见的专业名词.用语,我们一般统称为术语.为了更方便的学习python我们通过表格的方式列举了常用的术语和单词以及工具. 15.2 常见术 ...
- Python基础概念_13_常见关键字
常见关键字 14 常见关键字 14.1 常用关键字 Python里的关键字可通过内置的函数查看.见如下命令: >>>import keyword >>>keywor ...
- 音视频基础概念(5)——音频基础说明
现实生活中,音频(Audio)主要用在两大场景中,包括语音(Voice)和音乐(Music).语音主要用于沟通,如打电话等.目前由于语音识别技术的发展,人机语音交互也是语音的一个应用方向,很多大厂推出 ...
- voip 音频采集时间_数字音频基础------从PCM说起
"不得不说,现在网上的文章,包括百科词条,在数字音频基础概念上有太多混乱的表达,甚至存在错误.比如比特率.位率.位速和码率这四个词其实是同一个意思.再比如千比特kb表示1000bit,而不是 ...
- Android音视频学习系列(五) — 掌握音频基础知识并使用AudioTrack、OpenSL ES渲染PCM数据
系列文章 Android音视频学习系列(一) - JNI从入门到精通 Android音视频学习系列(二) - 交叉编译动态库.静态库的入门 Android音视频学习系列(三) - Shell脚本入门 ...
- 面试:JavaScript基础概念
文章目录 1. JS基础概念 JavaScript 常见知识总结 重点 1.js的基本数据类型都有哪些 2.判断基本数据类型的方法 typeof instanceof Object.prototype ...
- Git基础概念与Flow流程介绍
文章目录 Git相关 基本概念 常见客户端 TortoiseGit Sourcetree Intellij Idea 命令行 常用命令 存储区域 命令之 add & commit &p ...
- 【音频播放】自制音频播放器—音视频基础概念,未完待续。。。
近期用Electron制作了一个简易版客户端,未完待补充,重点在播放,引用凯教,先说几点.(图片禁止搬运,不得允许不准转载) 研究音频的数字化技术之前,必须对声音和图像的的物理性质有基本的了解. 如下 ...
- “声音”背后的原理(3):音频信号处理的基础概念和流程小结
文章目录 基础概念 音频处理流程(获取音频) 音频特征 从音频信号到特征帧 从信号到特征的全过程 从信号到特征关键点 基础概念 如何理解音频帧?一帧的时长是多少? 如何理解采样个数和采样率? 下面通过 ...
- 语音处理:音频入门之基础概念总结
语音处理:音频入门之基础概念总结 基本概念 语音增强 基本概念 过采样:超过音频本身实际带宽的采样率,如音频带宽12kHz,用96kHz采样属于过采样,用24kHz采样则较为合理.上采样,也属于过采样 ...
最新文章
- idea springmvc_SSM三大框架使用Maven快速搭建整合(SpringMVC+Spring+Mybatis)
- SAP VC销售订单中可配置物料的使用
- ConfigParser配置文件
- Linux系统文件和目录管理
- 【数理知识】《积分变换与场论》王振老师-第3章-矢量与矢量空间
- Android 毛小软件,毛库官方app
- mysql查询去年本月的数据_MySQL查询本周、上周、本月、上个月份数据的sql代码...
- springboot+Mybatis-plue自动生成代码
- JDBC基础篇(MYSQL)——自定义JDBCUtil工具类
- VSD Viewer for Mac(Visio绘图文件阅读器)
- eTerm指令、民航指令大全、黑屏指令
- 直播app源码开发,聊天服务器的搭建教程
- SQL SERVER 取得某月第一天
- [STL源码剖析]空间置配器allocator
- 计算机显示usb无法识别,计算机不断弹出无法识别的USB设备的解决方案
- 含有使字的诗句_古诗含“把”字
- Android品牌手机,手机坑合集,手机厂商
- 有一篇文章,共有三行文字,每行有80个字符。要求分别统计出其中英文大写字母,小写字母,数字,空格以及其他字符的个数
- 计算机创新创业1000字,大学生创新创业论文1000字
- AISHELL-1 语音识别实战