多媒体技术基础之---重新认识声音
声音一个最基本的常识就是“它是一种能量”,初中物理课上我们也学过声音的三要素分别是音色、音调和响度。
音色:简单理解,就是一种声音的固有特征。比如,电子琴和小提琴发出的声音是有明显区别的,笛子和古筝也有各自的声音特征。有些声音模仿秀的选手可以通过训练,达到模仿不同人或者不同乐器的效果。
音调:也就是我们所说的频率,单位是赫兹Hz,频率越高听起来越刺耳、越尖锐,频率越低听起来越低沉、越浑厚。医学研究表明,人的听觉系统能察觉的最低频率为20Hz,最高为20000Hz,超出这个范围人类一般就听不到了。其实现实生活中根本就不存在完全能听到20Hz~20kHz这样的人,并且随着年龄的增长、体质的变化,人能听到的声音只会是这个区间的一个子集。
例如“宫”调,风格悠扬沉静、淳厚庄重,根据五音通五脏的理论,宫调入脾,对消化系统的作用比较明显。这就是为什么很多古代电视或者电影里,皇庭寿宴席的时候一般都是奏宫乐。如果对中华文化感兴趣的朋友肯定注意到,我们古代繁体字的药材的“藥”和音乐的“樂”的字根是一样的,可见老祖宗造字时并不是瞎画的,这说明声音的确还是可以治病。现在精通音律的老师傅是越来越少了。感慨一句,中华文明,博大精深,后继者何也?呜呼。。。扯远了,收一下。
而人一般能发出的声音频率也是男女有别,大致范围如下:
低音 |
中音 |
高音 |
|
男 |
82 Hz~392Hz |
123 Hz~493Hz |
164 Hz~698Hz |
女 |
220 Hz~1.1kHz |
响度:就是声音的大小,一般用“分贝”来表示,单位是dB,这个参数说明了声音所携带的能量的大小,声音越大,在相同传播介质里所能传递的距离就远。
在物理世界里,我们的声音在传输过程中都是连续,像下面这个样子:
可是如果要让计算机来处理它,就牵扯到我们经常说的数字化了。关于声音在数字化过程中有三个核心步骤:采样、量化和编码。
采 样:在模拟声音的时间轴上周期性地取点,将时域连续的模拟信号变成离散信号的过程就叫做采样。每秒钟的采样点越多,数字化之后的声音就越接近原模拟声音。每秒钟的采样次数就叫做采样频率,根据奈奎斯特定律,采样频率 fs 和被采样声音的最高频率 fmax 的关系如下:
fs≥2fmax
PS:有些地方把声音的频谱范围也叫做声音的带宽,指的是声音从最低频率到最高频率之间的宽度。
量化:用于表示在采样点所获取的声音能量值。量化就是将空域连续的模拟信号转换成离散信号的过程。量化精度越高,所能表示的声音采样范围就越大,量化误差就也越小,相应地,所占用的存储空间也就越大。简而言之,就是对于采样所得到的样本点,我们打算用几位二进制数来表示它。例如,如果是8bit的量化精度,那么我们最多能表示的采样点就只有256个;如果是16bit,最多能表示的采样点就可以多达65536个。
编码:对于经过采样量化后的数据按一定的算法进行编码处理。在计算机里最接近模拟声音的编码方式就是PCM脉冲编码方式。那么对于上述量化结果,我们发现这段音频采样点的量化空间最多也就是11个,我们用4bit就可以完全表示它们了。所以量化精度就是4bit,可表示的样本空间是[0~15],因此,上述编码序列就是{3,5,6,7,8,5,4,8,10,8,5,1,1,2,5}。
当然,真正到了量化阶段时又分均匀量化和非均匀量化,量化的同时就自动编码成PCM格式的数据了。通常意义来说,量化和编码都是同时进行的。
ITU-T建议的G.711是最早公布的语音编码标准,它规定了A律13折线和u律15折线PCM编码的两种方案。这里就不再继续展开了,都是数学层面的东东,不纠结。中国和欧洲采用的A律13折线的PCM编码方式,北美和日本采用的是u律15折线的PCM编码方式。
在计算机里我们就认为PCM就是数字音频信号的原始无损格式,其存储方式通常是.wav文件,即wav格式的音频文件就是原始的未经任何压缩处理的数字音频文件,这样的文件大部分情况下都来自于录音设备。如果你使用音频格式转换工具将mp3转成wav的话,那么很不幸的是你的这个wav并不是无损格式的文件,因为mp3格式的文件是对原始wav文件经过有损压缩后得来的,而这个过程不是可逆的,即mp3转成的wav只有原始wav的部分信息。但从人的听觉系统来说,一般人是分辨不出来其中的差别,除非用专业发烧级音响设备,再加上一双有着专业特性的耳朵,区别还是很明显的。
例如,我们手头现在有款奥林巴斯的LS-14专业数码录音笔,我们将采样频率设为44100Hz,量化精度为16bit,采用双声道的模式进行音频录制,每秒钟所产生的数据量为44100x16x2=176400 bit,那么3分钟将会产生的声音数据约为30.28MB。显然,这个结果显然不太令人满意,接下来就有了各种音频压缩算法的出现,也就是多媒体技术术语里所说的编码器,其实就是压缩算法而已。目的只有一个:在高保真原有音质的前提下,最大限度地对数字化之后的PCM编码文件进行压缩,以降低其所占的磁盘空间。整个过程可以描述如下:
幸运的是,现在PCM编码方式已经固化在很多音频设备的DSP芯片里了,不需要我们关心。一种编码算法一定对应一种相应的解码算法才行,不然编来有毛用。我们可以看到,整个过程中PCM编码格式充当了各种编解码器之间转换的中间桥梁,这也就是为什么我们说PCM格式的声音文是计算机里的“模拟文件”的原因了。不管是不同音频压缩格式之间的互相转换,还是最终输送给数模转换器的格式都是PCM格式。
上面几种格式里有个flac和其他几种格式有着本质的区别,flac是无损压缩格式,和它齐名还有家喻户晓的ape格式。什么意思?无损格式的音频文件是在对原始wav文件压缩是没有删减过滤它的任何信息的情况下,完全通过算法活生生的把wav文件的体重给减了下来,而且flac和ape可以完整还原原始wav的所有信息,一个毫毛都不差。ape的压缩比高达55%。这和那些有损压缩的mp3、ogg、aac等是没法相比的,因为人家是无损的,就这么简单。有些人喜欢听CD,而另外一些人则喜欢听mp3,其实他们根本就不是一个级别的,也没有可比性的。最后,献上天王的一首单曲以飨各位看官肯花宝贵的时间听我在这里唧唧歪歪的大半天,配上森海或者AKG的耳机好好享受一下生活吧(不敢保证每个人能都听到那种感觉,毕竟人家mp3也不是盖的)。
人生不止眼前的代码和BUG,还有耳朵与音乐。
附件:Billie.Jean-ape和Billie.Jean-mp3
<script>window._bd_share_config={"common":{"bdSnsKey":{},"bdText":"","bdMini":"2","bdMiniList":false,"bdPic":"","bdStyle":"0","bdSize":"16"},"share":{}};with(document)0[(getElementsByTagName('head')[0]||body).appendChild(createElement('script')).src='http://bdimg.share.baidu.com/static/api/js/share.js?v=89860593.js?cdnversion='+~(-new Date()/36e5)];</script>
阅读(3448) | 评论(14) | 转发(4) |
上一篇:深入理解C语言的函数调用过程
下一篇:多媒体技术基础之---Come on!来点儿音乐吧
- linux 常见服务端口
- xmanager 2.0 for linux配置
- 【ROOTFS搭建】busybox的httpd...
- openwrt中luci学习笔记
- 什么是shell
- linux dhcp peizhi roc
- 关于Unix文件的软链接
- 求教这个命令什么意思,我是新...
- sed -e "/grep/d" 是什么意思...
- 谁能够帮我解决LINUX 2.6 10...
wjlkoorey2582013-11-21 12:30:23
lmnos:多谢提醒,我写错了,MP4确实不是一种不是一种音、视频编解码格式 MPEG-4它是一整套标准
共同学习
http://en.wikipedia.org/wiki/MPEG-4_Part_14
http://www.differencebetween.info/difference-between-mpeg4-and-mp4
回复 | 举报
lmnos2013-11-21 00:13:49
wjlkoorey258:你那个播放器真心不错,特别是界面,哥们倍儿喜欢,建议在你的github上放一份,让哥们也来膜拜膜拜。。。
纠正你个小知识点,mp4不是一种音、视频编解码格式,它只是一种容器(container)格式而已,哥们后面写个多媒体的系列博文,到时候欢迎共同来探讨哈。。
多谢提醒,我写错了,MP4确实不是一种不是一种音、视频编解码格式 MPEG-4它是一整套标准
回复 | 举报
wjlkoorey2582013-11-20 22:22:11
lmnos:我捣鼓各种音频解码器时,了解过这些,不过你写的真心不错,我最喜欢听APE格式的音乐了,同时我的高歌一曲音乐播放器也支持mp3;ape;wma;wav;flac;ogg;cda;
m4a;tta;acc+;mpc;mp4;ac3;MOD 这些格式
你那个播放器真心不错,特别是界面,哥们倍儿喜欢,建议在你的github上放一份,让哥们也来膜拜膜拜。。。
纠正你个小知识点,mp4不是一种音、视频编解码格式,它只是一种容器(container)格式而已,哥们后面写个多媒体的系列博文,到时候欢迎共同来探讨哈。。
回复 | 举报
wjlkoorey2582013-11-20 22:17:56
xdsnet:不是搞通信的,是搞教育的,呵呵
老师好
回复 | 举报
lmnos2013-11-20 20:53:29
我捣鼓各种音频解码器时,了解过这些,不过你写的真心不错,我最喜欢听APE格式的音乐了,同时我的高歌一曲音乐播放器也支持mp3;ape;wma;wav;flac;ogg;cda;
m4a;tta;acc+;mpc;mp4;ac3;MOD 这些格式
- 首页
- 上一页
- 1
- 2
- 3
- 下一页
- 末页
多媒体技术基础之---重新认识声音相关推荐
- 多媒体技术基础及应用
多媒体技术基础及应用 第1章 多媒体技术概要 1.1 多媒体是交互式信息传播媒体 1.2 多媒体涉及的几个概念 1.2.1 超文本的概念 1.2.2 超媒体的概念 1.2.3 标准通用标记语言 (SG ...
- 多媒体计算机接口卡,多媒体技术基础 2.2多媒体接口卡 多媒体接口卡.docx
多媒体技术基础 多媒体技术基础 Multimedia technology infrastructure电子教案 Multimedia technology infrastructure 教案首页 课 ...
- 计算机应用数字多媒体,多媒体技术基础计算机应用专业系列教材 主讲:薛文涛【精品-ppt】.ppt...
多媒体技术基础计算机应用专业系列教材 主讲:薛文涛[精品-ppt] 多媒体技术基础 计算机应用专业系列教材 主讲:薛文涛;第一章 多媒体技术概述;1.1.1 多媒体的有关概念(1) 多媒体:声音,图形 ...
- 复旦大学计算机科学技术学院期末,复旦大学计算机科学技术学院多媒体技术基础试题...
<复旦大学计算机科学技术学院多媒体技术基础试题>由会员分享,可在线阅读,更多相关<复旦大学计算机科学技术学院多媒体技术基础试题(5页珍藏版)>请在人人文库网上搜索. 1.复旦大 ...
- 计算机多媒体从时效分,多媒体技术基础大学计算机基础课件.ppt
多媒体技术基础大学计算机基础课件 桂林航专 1.多媒体基本概念 (1)媒体.多媒体及多媒体技术. (2)多媒体信息的类型. (3)多媒体信息处理的关键技术. (4)多媒体计算机的硬件系统和软件系统. ...
- 山东专升本计算机第八章-多媒体技术基础
多媒体技术基础 多媒体技术 考点 7 图形/图像处理软件 图形/图像文件格式 • BMP • windows系统下的标准位图格式 • 未经压缩 • JPEG(联合图像专家组) • 有损压缩格式,色数量 ...
- 语音处理/语音识别基础(三)- 声音的特征和声音的能量
前面分享了声音是什么,声音是如何产生,如何传播,以及如何数字化存储的.现在我们来看一下声音有哪些主要的特征(对于人来说),以及常说的声音的能量指的是什么. 本文尝试回答如下问题: 1).对于人来说, ...
- 上海大学数字媒体创意工程875多媒体技术基础考研经验分享
文章首发地址见个人博客 875多媒体技术基础 聊个两毛钱 相信点进来看的小朋友都是要考上海大学数字媒体创意工程专业的同学吧. 自己呢也是2018年报考的上海大学数字媒体专业,当年复试线320,我只考了 ...
- 云南师范大学计算机基础教学,云南师范大学841信息技术基础(含计算机文化基础、多媒体技术基础)考研复习经验...
考研是一场持久战,在云南师范大学841信息技术基础(含计算机文化基础.多媒体技术基础)考研复习的过程中,难免会遇到各种各样的问题和挑战.在进入强化冲刺阶段之后,高强度的学习和心里压力更是让很多学子身心 ...
最新文章
- 从网络上获取一张图片简单的
- xp 安装mysql数据库_Windows XP系统中安装MySQL5.5.28数据库图文教程
- 别再乱用 Prometheus 联邦了,分享一个 Prometheus 高可用新方案
- 从 Android 静音看正确的查找 bug 的姿势
- redis哨兵集群的搭建
- 征战蓝桥 —— 2016年第七届 —— C/C++A组第3题——方格填数
- SAP ABAP和Hybris Commerce的Sample数据
- React.js 小书 Lesson24 - PropTypes 和组件参数验证
- 【Flink】flink ClickHouseSink--数据写入ClickHouse
- MySQL Installer 8.0.21安装教程图文详解 转载
- Oracle数据库基础1-数据类型与约束
- 应用RSACryptoServiceProvider类轻松实现RSA算法
- 嵌入式和单片机的区别到底在哪?
- 苹果云服务器满,苹果云备份满了怎么清理
- 江南大学计算机拟录取名单,江南大学2018年法律硕士拟录取名单公示
- WEB基础之: form标签
- 「链节点活动年度总结」2019年区块链行业会议回顾
- channel estimation
- hive改表结构的两个坑
- 解决MERCURY弹出上网公告的窗口方法