一、声音
声音的本质是波动。受作用得空气发生振动,当震动频率在20-20000Hz时,作用于人的耳鼓膜而产生的感觉称为声音。声源可以是固体、也可以是流体(液体和气体)的振动。声音的传媒介质有空气。水和固体,它们分别称为空气声、水声和固体声等。噪声监测主要讨论空气声。
二、声音的发生、频率、波长和声速
频率:声源在一秒中内振动的次数,记作f。单位为Hz。
周期:声源振动一次所经历的时间,记作T,单位为s。T=1/f。
波长:沿声波传播方向,振动一个周期所传播的距离,或在波形上相位相同的相邻两点间距离,记为λ,单位为m。
声速:声波每秒在介质中传播的距离,记作c,单位为m/s。声速与传播声音的介质和温度有关。在空气中,声速(c)和温度(t)的关系可简写为:c = 331.4+0.607t常温下,声速约为345m/s。
频率f、波长λ和声速c三者之间的关系是: c = λf当物体在空气中振动,使周围空气发生疏、密交替变化并向外传递,且这种振动频率在20-20000Hz之间,人耳可以感觉,称为可听声,简称声音,噪声监测的就是这个范围内的声波。频率低于20Hz的叫次声,高于20000Hz的叫超声,它们作用到人的听觉器官时不引起声音的感觉,所以不能听到。
三、声功率、声强和声压

声压,声功率和声强描述了声音的不同方面,均可用分贝表示,但各自的分贝值代表各自的测量值,三者之间的分贝值不能直接比较。

声功率–从物体发出声音的速率,与观察声音的位置或距离无关,是声源本身的属性。建筑设备到计算机打印机等产品的噪声法规中,经常声功率,其以W为单位。不能不能直接测得,需声压进行转换测得。

声压–表示空间中特定位置的声音振幅的级别,是一个标量。在自由场中,声压大小取决于观测点相对于声源的位置和距离,单位是帕斯卡(Pa)。

声强–声强是单位面积的声功率。它表征声场内某位置的声流,声强以W/m2为单位。

声功率与声强两者有直接的关系,观察两者的单位(W与W/m²)可以发现以面积为变量,对声强求积分来得到声功率的值。
(1) 声功率(W)
声功率是指单位时间内,声波通过垂直于传播方向某指定面积的声能量。在噪声监测中,声功率是指声源总声功率。单位为W。一个物体产生了多大的声能量,这可以用声功率来表示,它指声源在单位时间内向外辐射的声能。
声功率w=声强×面积
(2) 声强(I)
是指单位时间内,声波通过垂直于传播方向单位面积的声能量。声强是矢量(有大小和方向)。声强与声压的关系为:I=p²/ρc=(ρc)2u2/ρc =Pu
某点的声强=(瞬时声压Pⅹ瞬时速度u)的平均值
(3)声压(P)
声压是由于声波的存在而引起的压力增值。声音传递时,声波传播扰动介质,使得介质内部产生的压强变化叫做声压。单位为Pa。声波在空气中传播时形成压缩和稀疏交替变化,所以压力增值是正负交替的。但通常讲的声压是取均方根值,叫有效声压,故实际上总是正值,对于球面波和平面波,
p=(ρc)u
其中p是声压,单位为Pa或N/m²;ρ是流体密度,对于海水ρ=10³kg/m³;u是质点速度,单位为m/s;ρc是介质特征阻抗,海水介质的特征阻抗ρc=1.5*10^6kg/m²s; c为声速,c=f×λ。f为频率,λ为波长。水中的声速一般取1500m/s,与水温、盐度、深度有关系。


补充:
1.声压
  当声波不存在时,空气层处于平衡状态,各处气压相等,也就是和通常所说的大气压是一样的。当声波出现时,由于声波的作用,媒质的各部分必然产生压缩与膨胀的周期性变化.从而使局部气压发生涨落变化.空气密集处压强增强.空气稀薄处压强降低,这种由声波引起的压强变化就叫作声压。一般用P表示,单位是帕(Pa).声压的大小反映了振动的强弱.同时也决定了声音的大小。
  人们正常讲话时,离开嘴巴0.5米处的声压大约是0.1帕.只有大气压的百万分之一左右。这时人们可以听到声音很响,可见人耳是相当灵敏的感觉器官。当然,声压很低时人耳是听不到的.声压低到2×10^-5帕时差不多已是人耳所能听到的最低限度了,低于这一声压人耳就无法听到了。
  在没有任何反射的自由声场中,球面波辐射的声波随着距离的增加而迅速减小.具体来说就是声压的大小与距离成反比。由于实际的声场中都存在不同程度的反射.而且实际的声源都有一定的指向性(介于球面波和平面波之间).所以实际上声压随距离而衰减的速度要比上面所讲的设得多,在室内尤其如此。
  2.声压级

人耳所能听到的声音其声压范围极其宽广,从人耳所能听到的最低声压(听阅)到感觉耳痛的最低声压(痛阔)之间相差一百万倍(106倍)。在这样宽广的范围内,用声压的绝对大小来衡量声音的强弱是很不方便的,要用具有一定绝对精度的仪器来度盆它也是十分困难的。而且从人耳分辨能力来着,主观上产生的“响度感觉”并不是正比于声压的绝对值.而是更近于与声压的对数成正比。基于这两方面的原因.我们常用声压的相对大小来表示声压的强弱,并称之为声压级。
声压级(以分贝为单位)定义为实际声压P和荃准声压P,6的比值取常用对教再乘以20,即:声压级(SPL) =20 lg(P/Pm)单位:分则dB)其中P '为参考声玉.在空气中p -般取2x10^-5帕,这个数值就是人耳对1千赫声音刚刚能觉察到其存在的声压值,也就是1千赫声音的可听周声压。一般来说低于这一声压值.人耳就再也觉察不出这声音的存在。为了让大家对声压级的大小有个数云概念,下面举几个典型的例子以供参考,见表1.1.1

3.频率
  声音引起听觉的作用.不仅取决于声压大小,而且还和它每秒钟内振动的次教即撅率有关。颇率的单位是赫兹(Hz),简称赫。例如:1秒内振动100次.它的频率就是100赫;1秒内振动11000次.它的频率就是1,000特。不同颇率的声音信号使人感觉到音调的差异,简单来说频率越高.音调也越高。
  人耳可听到的频率范围是20赫-20千赫。当然这只是一个大概的范围,每个人实际上听到的预率范围并不相同,一般来讲,育年人听到的频率范围要比老年人听到的报率范围宽.
  这是因为随着年龄的增长.人耳对高孩声的听力会逐渐降低。比如50岁左右的人,最高可听到的硕串约为13千赫;而60岁以上的人,很少能听到8千赫以上的声音。
  频率低于20赫的声波称为次声波;频率高于20千赫的声波称为超声波。次声和超声对人耳来说都是听不见的.因而,次声和超声即使振幅再大.其响度也是为零。
  声音可以是单族率的纯音,但是绝大多数声音都是由多个频率成分组合而成的复音。日常生活中遇到的语言、音乐或噪声大多是复音。其实,任何复杂的声音.都可以看作是由几个或许多个频串和振幅都不相同的简谐波的叠加.即复音可以分解为许多个纯音之和。
  如果组合起来的许多纯音都集中在高频部分,就称为高频声;集中在低频部分.就称为低频声。当然,所谓高频声和低预声都相对而言的,一般习惯上把预率低于60赫的声音称为超低音.把60-200赫的称为低音.把200-1千赫的称为中音,把1-5千赫的称为中高音,而5千赫以上的则统称为高音。
声音的大小与频率无关,它与波幅有关,也就是说声波蕴含的能量越多声音就越大。
四、 分贝
人们日常生活中遇到的声音,若以声压值表示,由于变化范围非常大,可以达六个数量级以上,同时由于人体听觉对声信号强弱刺激反应不是线形的,而是成对数比例关系。所以采用分贝来表达声学量值。所谓分贝是指两个相同的物理量(例A1和A0)之比取以10为底的对数并乘以10(或20)。N = 10lg(A1/A0) 分贝符号为"dB",它是无量纲的。式中A0是基准量(或参考量),A是被量度量。被量度量和基准量之比取对数,这对数值称为被量度量的"级"。亦即用对数标度时,所得到的是比值,它代表被量度量比基准量高出多少"级"。
五、声功率级
Lw =10lg(W/W0)
式中:Lw—声功率级(dB);W— 声功率(W);W0—基准声功率,为10-12 W。
(三) 声强级
LI = 10lg(I/I0)式中:LI —声压级(dB);I —声强(W/m2);I0 —基准声强,为10-12 W/m2。
六、 声压级(振幅)
人耳对声音强弱的变化的感受并不与声压成正比,而与声压的对数成正比。
LP = 20lg(P/P0)
式中: LP—声压级(dB);P —声压(Pa);P0—基准声压,为2×10-5Pa,该值是对1000HZ声音人耳刚能听到的最低声压。所以声压每增加一倍,声压级增大 (20Log²) 6dB,根据这个可以算出人耳朵可接受的最大声压级。由于人耳可承受的最大声压约为20Pa,而通常在空气中的参考声压是2×10-5Pa,也就是人耳的可承受的最大声压级约为120dB (20Log20/2×10-5),这也就是我们常常所说的痛阈,但这痛阈值并不是适用于所有的人,有的人由于工作环境或者天生耳部构造等原因可以达到130甚至140dB。

七、响度(N)
响度是人耳判别声音由轻到响的强度等级概念,它不仅取决于声音的强度(如声压级),还与它的频率及波形有关。响度的单位为"宋",1宋的定义为声压级为40dB,频率为1000Hz,且来自听者正前方的平面波形的强度。如果另一个声音听起来比1宋的声音大n倍,即该声音的响度为n宋。
八、采样率、位深度、采样位数、声道数
采样、量化、编码详看https://blog.csdn.net/Robin_Pi/article/details/109235946
(1)采样率
音频采样,是把声音从模拟信号转换为数字信号。采样率,就是每秒对声音进行采集的次数,同样也是所得的数字信号的每秒样本数。
采样越高,声音的还原就越真实越自然,人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求.

采样率(sampleRate), 采样率就是每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示,说的简单一点就是每秒在每个声道上采样的个数。采样就是把模拟信号数字化的过程,不仅仅是音频需要采样,所有的模拟信号都需要通过采样转换为可以用0101来表示的数字信号,示意图如下所示:

蓝色代表模拟音频信号,红色的点代表采样得到的量化数值。采样频率越高,红色的间隔就越密集,记录这一段音频信号所用的数据量就越大,同时音频质量也就越高。

(2) 位深度
位深度,也叫位宽,量化精度,上图中,每一个红色的采样点,都需要用一个数值来表示大小,这个数值的数据类型大小可以是:4bit、8bit、16bit、32bit等等,位数越多,表示得就越精细,声音质量自然就越好,当然,数据量也会成倍增大。常见的位宽有:8bit 或者 16bit。
(3)采样位数
音频在经过采样得到样本后,还需要对该样本执行两个步骤:
量化。音频量化的量化位数常用的有:
   8bit (也就是1字节) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
  16bit (也就是2字节) 可以细到 65536 个数, 这已是 CD 标准了;
  32bit (也就是4字节) 能把振幅细分到 4294967296 个等级, 实在是没必要了.
量化位数又叫做采样位数、位深度、分辨率, 它是指声音的连续强度被数字表示后可以分为多少级。N-bit的意思声音的强度被均分为2^N级。16-bit的话,就是65535级。这是一个很大的数了,人可能也分辨不出六万五千五百三十五分之一的音强差别。也可以说是声卡的分辨率,它的数值越大,分辨率也就越高,所发出声音的能力越强。这里的采样倍数主要针对的是信号的强度特性,采样率针对的是信号的时间(频率)特性这是两个不一样的概念。
二进制编码。也就是把量化所得的结果,即单个声道的样本,以二进制的码字进行存放。其中有两种存放方式:
直接以整形来存放量化结果,即Two’s complement code;
以浮点类型来存放量化结果,即Floating point encoding code。
大多数格式的PCM样本数据使用整形来存放,而在对一些对精度要求高的应用方面,则使用浮点型来表示PCM 样本数据。
(4)声道数
由于音频的采集和播放是可以叠加的,因此,可以同时从多个音频源采集声音,并分别输出到不同的扬声器,故声道数一般表示声音录制时的音源数量或回放时相应的扬声器数量。单声道(Mono)和双声道(Stereo)比较常见,顾名思义,前者的声道数为1,后者为2。
一帧应该是指持续采样时间,这个是很灵活的可以使用20ms,也可是200ms,一般来说时间越短延时就越少。
音频在量化得到二进制的码字后,需要进行变换,而变换(MDCT)是以块为单位(block)进行的,一个块由多个(120或128)样本组成。而一帧内会包含一个或者多个块。帧的常见大小有960、1024、2048、4096等。一帧记录了一个声音单元,它的长度是样本长度和声道数的乘积。FFmpeg中 AVFrame 结构体中的 nb_samples 代表的就是一帧中单个声道的音频样本数量。

2021-07-15 声音一些基本概念相关推荐

  1. 2021.07.15 周四 晴

    注意力机制问题 注意力模型(Attention Model,AM)已经成为神经网络中的一个重要概念,并在不同的应用领域进行了充分的研究.这项调查提供了一个结构化和全面的概述关于attention的发展 ...

  2. Python小白的数学建模课-15.图论的基本概念

    图论中所说的图,不是图形图像或地图,而是指由顶点和边所构成的图形结构. 图论不仅与拓扑学.计算机数据结构和算法密切相关,而且正在成为机器学习的关键技术. 本系列结合数学建模的应用需求,来介绍 Netw ...

  3. 【Doris Weekly FAQ】2021.07.05~2021.07.18

    观众朋友们: 晚上好! 欢迎收看[ Doris 近日要闻]~本次为您带来的是 2021年07月15日 - 2021年07月18日 的双周总结. Doris 社区周报每期会包含 FAQ 环节.我们会在社 ...

  4. Python 最近两条好消息:①TIOBE排名超过C和Java②新版本发布3.10.0,还有今天刚发布的《What’s New in Python(2021.10.15)》

    来自TIOBE的最新10月份统计数据显示,Python首次超越Java.JavaScript.C语言等,成为最受欢迎的编程语言.TIOBE过去20年一直在追踪编程语言的受欢迎程度,其数据来自于对25个 ...

  5. 新手如何理解一个Web应用的构建(2021.07.29更新)

    Web应用构建 ==前言== 我为什么写这篇文章? 适合什么样的人看? ==摘要== 步骤汇总 (1)网站定位与功能设定 (2)信息架构 (3)UI设计 (4)应用架构 (5)开发 (6)部署 (7) ...

  6. 使用Go开发的数字书架应用 | Gopher Daily (2021.07.05) ʕ◔ϖ◔ʔ

    每日一谚:API consumers: if it is not part of the contract, don't depend on it. Go技术生态 Myreads:一个使用Go.Rea ...

  7. 2021.07.16 总结

    2021.07.16 总结 ​ 今天状态不怎么好,几道那么容易的题就只有140分,毕竟也就打了前两道 T1 花生采摘 题目描述 鲁宾逊先生有一只宠物猴,名叫多多.这天,他们两个正沿着乡间小路散步,突然 ...

  8. 2021.07.16【普及组】模拟赛C组

    2021.07.16[普及组]模拟赛C组 文章目录 2021.07.16[普及组]模拟赛C组 前言 花生采摘 题目 解析 代码 FBI树 题目 解析 代码 火星人 题目 解析 代码 麦森数 题目 解析 ...

  9. GMOJ - 2021.07.20【普及组】模拟赛C组 - 排座椅(seat)、传球游戏(ball)、立体图(drawing)、间谍派遣、seek

    文章目录 luogu博客链接 GMOJ - 2021.07.20[普及组]模拟赛C组 - 排座椅(seat).传球游戏(ball).立体图(drawing).间谍派遣.seek T1 排座椅(seat ...

  10. Neovim开发环境搭建(2021.07.01)

    Neovim开发环境搭建(2021.07.01) 一.搭建环境 Ubuntu 21.04 Neovim 0.4.4 二.Neovim安装 # 下载 neovim,如遇网络问题可以采用 https:// ...

最新文章

  1. ida 中segment中的extern是什么
  2. 顶会ASPLOS 新成果解析:用“弹性异构”防御DNN加速器对抗攻击
  3. python第三方库安装-python第三方库安装在哪
  4. 从零点五开始用Unity做半个2D战棋小游戏(五)
  5. 创建MySql用户并给用户授权,设置mariadb默认编码,修改mariadb数据存储目录datadir...
  6. 如何用Vue实现简易的富文本编辑器,并支持Markdown语法
  7. 私有云为先 ZStack还在谋划一个更大的混合云世界
  8. 向一个数组中插入元素
  9. 转发:一个复杂系统的拆分改造实践
  10. flex 常用正则验证举例
  11. springboot+cxf框架 WebService
  12. 华为隐藏功能扩大内存代码大全_华为手机隐藏功能代码大 | 手游网游页游攻略大全...
  13. 常用分辨率、帧率、码率
  14. 《惢客创业日记》2019.03.04(周一)从创业角度看郭德纲(2)
  15. Spyder 运行时kernels启动报错
  16. JS——如何利用js实现流星雨效果?
  17. 日文图片翻译器扫描_微信如何巧变中英文翻译器?三招教你解决翻译难题
  18. 上海财经计算机专业考研,考研择校:魔都的复旦、同济、上财哪个更有前途?看网友怎么说!...
  19. ASC超算竞赛及基本思路
  20. ‘xxxx’ does not name a type报错处理方法

热门文章

  1. 【POJ P3311】【状压DP】Hie with the Pie
  2. 艰难抉择,WPS和Office哪个好?
  3. AD软件系统属性配置
  4. 翻转和旋转计算机教学,小学信息技术(上册)第15课图形翻转与旋转教学案例...
  5. 微信小程序中base64转换成图片
  6. HBU-NNDL 实验五 前馈神经网络(3)鸢尾花分类
  7. c语言求最大值 若有多个最大,二个随机变量的最大值与最小值分布的求法.pdf
  8. 2020 全国大学生数学建模竞赛C题思路+代码
  9. ATECC508A芯片开发笔记(二):开发准备之 CryptoAuthLib 库简介与移植
  10. 以喷管雷诺数,当地大气压及射流有效温度计算所需质量流量,静温