声音是由物体振动而产生的

声波的三要素

声波的三要素是频率、振幅和波形,频率代表音阶的高低,振幅代表响度(音量),波形代表音色。

PCM脉冲编码调制

PCM(Pulse Code Modulation),脉冲编码调制。人耳听到的是模拟信号,PCM是把声音从模拟信号转化为数字信号的技术。原理是用一个固定的频率对模拟信号进行采样,采样后的信号在波形上看就像一串连续的幅值不一的脉冲(脉搏似的短暂起伏的电冲击),把这些脉冲的幅值按一定精度进行量化,这些量化后的数值被连续的输出、传输、处理或记录到存储介质中,所有这些组成了数字音频的产生过程(抽样、量化、编码三个过程)。

描述一段PCM数据一般需要以下几个概念:量化格式(sampleFormat)、采样率(sampleRate)、声道数(channel)

量化是指在幅度轴上对信号进行数字化

采样就是在时间轴上对信号进行数字化

编码就是按照一定的格式记录采样和量化后的数字数据,比如顺序存储或压缩存储

采样频率:每秒采集数据的次数

采样精度:每次采集数据的位数

声道数:存在几路音频

比特率:针对编码格式,表示压缩编码后每秒的音频数据量大小

音频压缩编码

压缩编码的原理实际上是压缩掉冗余信号,冗余信号是指不能被人耳感知到的信号

几种常用的压缩编码格式

(1)WAV

WAV为微软公司(Microsoft)开发的一种声音文件格式,WAV是最接近无损的音乐格式,所以文件大小相对也比较大。

WAV编码的一种实现(有多种实现方式,但是都不会进行压缩操作)就是在PCM数据格式的前面加上44字节,分别用来描述PCM的采样率、声道数、数据格式等信息。

特点:音质非常好,大量软件都支持

适用场合:多媒体开发的中间文件、保存音乐和音效素材。

(2)MP3编码

MP3具有不错的压缩比,使用LAME编码(MP3编码格式的一种实现)的中高码率的MP3文件,听感上非常接近源WAV文件,当然在不同的应用场景下,应该调整合适的参数以达到最好的效果。

特点:音质在128Kbit/s以上表现还不错,压缩比比较高,大量软件和硬件都支持,兼容性好。

适用场合:高比特率下对兼容性有要求的音乐欣赏。

(3)AAC编码

AAC是新一代的音频有损压缩技术,全称Advanced Audio Coding,是一种专为声音数据设计的文件压缩格式。与MP3不同,它采用了全新的算法进行编码,更加高效,具有更高的“性价比”。优点:相对于mp3,AAC格式的音质更佳,文件更小。

适用场合:128Kbit/s以下的音频编码,多用于视频中音频轨的编码。

(4)Ogg编码

Ogg是一种非常有潜力的编码,Ogg除了音质好之外,还是完全免费的,Ogg有着非常出色的算法,可以用更小的码率达到更好的音质,但目前因为还没有媒体服务软件的支持

特点:可以用比MP3更小的码率实现比MP3更好的音质,高中低码率下均有良好的表现,兼容性不够好,流媒体特性不支持。

适用场合:语音聊天的音频消息场景。

音频基础概念及常见编码格式相关推荐

  1. Python基础概念_14_常见术语

    常见术语 15 常见术语 15.1 简介 Python里有一些常见的专业名词.用语,我们一般统称为术语.为了更方便的学习python我们通过表格的方式列举了常用的术语和单词以及工具. 15.2 常见术 ...

  2. Python基础概念_13_常见关键字

    常见关键字 14 常见关键字 14.1 常用关键字 Python里的关键字可通过内置的函数查看.见如下命令: >>>import keyword >>>keywor ...

  3. 音视频基础概念(5)——音频基础说明

    现实生活中,音频(Audio)主要用在两大场景中,包括语音(Voice)和音乐(Music).语音主要用于沟通,如打电话等.目前由于语音识别技术的发展,人机语音交互也是语音的一个应用方向,很多大厂推出 ...

  4. voip 音频采集时间_数字音频基础------从PCM说起

    "不得不说,现在网上的文章,包括百科词条,在数字音频基础概念上有太多混乱的表达,甚至存在错误.比如比特率.位率.位速和码率这四个词其实是同一个意思.再比如千比特kb表示1000bit,而不是 ...

  5. Android音视频学习系列(五) — 掌握音频基础知识并使用AudioTrack、OpenSL ES渲染PCM数据

    系列文章 Android音视频学习系列(一) - JNI从入门到精通 Android音视频学习系列(二) - 交叉编译动态库.静态库的入门 Android音视频学习系列(三) - Shell脚本入门 ...

  6. 面试:JavaScript基础概念

    文章目录 1. JS基础概念 JavaScript 常见知识总结 重点 1.js的基本数据类型都有哪些 2.判断基本数据类型的方法 typeof instanceof Object.prototype ...

  7. Git基础概念与Flow流程介绍

    文章目录 Git相关 基本概念 常见客户端 TortoiseGit Sourcetree Intellij Idea 命令行 常用命令 存储区域 命令之 add & commit &p ...

  8. 【音频播放】自制音频播放器—音视频基础概念,未完待续。。。

    近期用Electron制作了一个简易版客户端,未完待补充,重点在播放,引用凯教,先说几点.(图片禁止搬运,不得允许不准转载) 研究音频的数字化技术之前,必须对声音和图像的的物理性质有基本的了解. 如下 ...

  9. “声音”背后的原理(3):音频信号处理的基础概念和流程小结

    文章目录 基础概念 音频处理流程(获取音频) 音频特征 从音频信号到特征帧 从信号到特征的全过程 从信号到特征关键点 基础概念 如何理解音频帧?一帧的时长是多少? 如何理解采样个数和采样率? 下面通过 ...

  10. 语音处理:音频入门之基础概念总结

    语音处理:音频入门之基础概念总结 基本概念 语音增强 基本概念 过采样:超过音频本身实际带宽的采样率,如音频带宽12kHz,用96kHz采样属于过采样,用24kHz采样则较为合理.上采样,也属于过采样 ...

最新文章

  1. idea springmvc_SSM三大框架使用Maven快速搭建整合(SpringMVC+Spring+Mybatis)
  2. SAP VC销售订单中可配置物料的使用
  3. ConfigParser配置文件
  4. Linux系统文件和目录管理
  5. 【数理知识】《积分变换与场论》王振老师-第3章-矢量与矢量空间
  6. Android 毛小软件,毛库官方app
  7. mysql查询去年本月的数据_MySQL查询本周、上周、本月、上个月份数据的sql代码...
  8. springboot+Mybatis-plue自动生成代码
  9. JDBC基础篇(MYSQL)——自定义JDBCUtil工具类
  10. VSD Viewer for Mac(Visio绘图文件阅读器)
  11. eTerm指令、民航指令大全、黑屏指令
  12. 直播app源码开发,聊天服务器的搭建教程
  13. SQL SERVER 取得某月第一天
  14. [STL源码剖析]空间置配器allocator
  15. 计算机显示usb无法识别,计算机不断弹出无法识别的USB设备的解决方案
  16. 含有使字的诗句_古诗含“把”字
  17. Android品牌手机,手机坑合集,手机厂商
  18. 有一篇文章,共有三行文字,每行有80个字符。要求分别统计出其中英文大写字母,小写字母,数字,空格以及其他字符的个数
  19. 计算机创新创业1000字,大学生创新创业论文1000字
  20. AISHELL-1 语音识别实战

热门文章

  1. 我的深圳真实驾考经历
  2. 用Python绘制折线图(下)
  3. 02、PMI点互信息 PPMI(Positive PMI)
  4. 排序算法,对内存小数据量大的数据排序(一)
  5. 图解积分法_计算机模拟图解积分法求气相吸收总传质单元数
  6. 基于词典方法和机基于器学习方法的中文情感倾向分析(Web)
  7. 第一章节:期货及衍生品概述
  8. 编解码学习笔记(九) QuickTime系列
  9. 史上最全 | 室外大规模3D检测数据集汇总
  10. 国外科研论文搜索网站汇总