有关声音信号的那么点知识

  • 前言
  • 音频的属性讲解
  • 1. Spectrogram
  • 2.
  • 参考来源

前言

好像<语音信号处理>这本书解释很详细,但我并没有系统上过这门课程,所以自己做一些笔记.

音频的属性讲解

  • 音频 :

指人耳可以听到的声音频率在20HZ~20kHz之间的声波,称为音频。

  • 采样频率/sample rate/采样率:

指每秒钟取得声音样本的次数
采样率定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示.
采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。

  1. 由于人耳的分辨率很有限,太高的频率并不能分辨出来。 22050 的采样频率是常用的, 44100已是CD音质, 超过48000或96000的采样对人耳已经没有意义。这和电影的每秒 24 帧图片的道理差不多。
  2. 如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.
  • 采样位数/采样值:

它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,所发出声音的能力越强。
每个采样数据记录的是振幅, 采样精度取决于采样位数的大小:

  • 1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
  • 2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
  • 4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.
  • 比特率:

比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大,音质越好.

  • 比特率 =采样率 x 采用位数 x声道数.
  • 关于比特率(比特率在音频或者视频领域也称为码率)的计算,比如,采样率为44.1KHz,以16bit采样,声道数为2,那么它的音频比特率的计算为:44100162 = 1411200 bps = 1378 kbps(1k=1024),然后我们在除以8,将bit转化为Byte,所以1秒钟的数据量就是:1411200/8 = 176400 个字节(B)。
  • 通道数:

即声音的通道的数目。常有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果,当然还有更多的通道数。

  • 帧:

帧记录了一个声音单元,其长度为样本长度(采样位数)和通道数的乘积。

  • 每一帧的总时长

每一帧的总时长=每一帧的采样个数×每个采样时长

  • 每个采样的时长=(1/频率)

1. Spectrogram

声谱图

  1. 如下图所示,先对语音信号进行分帧处理,再对每一帧进行FFT变换,得到对应的Spectrum(频谱)

    可见,语音信号被分为很多帧,每帧都有对应的Spectrum,Spectrum表示频率与能量的关系.在实际使用中,频谱图有三种,即线性振幅谱、对数振幅谱(对数振幅谱中各谱线的振幅都作了对数计算,所以其纵坐标的单位是dB(分贝)。这个变换的目的是使那些振幅较低的成分相对高振幅成分得以拉高,以便观察掩盖在低幅噪声中的周期信号)、自功率谱.

  2. 如下图,我们选取一个Spectrum,将其中一帧语音的频谱通过坐标表示出来,如上图左。现在我们将左边的频谱旋转90度。得到中间的图。然后把这些幅度映射到一个灰度级表示(也可以理解为将连续的幅度量化为256个量化值)0表示黑,255表示白色。幅度值越大,相应的区域越黑。这样就得到了最右边的图。那为什么要这样呢?为的是增加时间这个维度,这样就可以显示一段语音而不是一帧语音的频谱,而且可以直观的看到静态和动态的信息。

  3. 通过以上的处理,我们会得到一个随着时间变化的频谱图,这个就是描述语音信号的spectrogram声谱图。

  4. 下图是一段语音的声谱图,很黑的地方就是频谱图中的峰值(共振峰formants)

  5. 那我们为什么要在声谱图中表示语音呢?

    首先,音素(Phones)的属性可以更好的在这里面观察出来。另外,通过观察共振峰和它们的转变可以更好的识别声音。隐马尔科夫模型(Hidden Markov Models)就是隐含地对声谱图进行建模以达到好的识别性能。还有一个作用就是它可以直观的评估TTS系统(text to speech)的好坏,直接对比合成的语音和自然的语音声谱图的匹配度即可。

2.

参考来源

音频属性讲解
音视频基本概念讲解
频谱图讲解

有关声音信号的那么点知识相关推荐

  1. 基于labview开发平台的声音信号采集及处理系统设计(任务书+lunwen+翻译及原文+vi源文件+查重报告)

    目 录 摘 要 I Abstract I 目 录 III 第1章 绪 论 1 1.1 引言 1 1.2 声音信号处理的发展及应用 2 1.3 本课题研究任务及章节安排 3 第2章 系统设计方案 4 2 ...

  2. matlab怎么把音频变成信号_matlab实现声音信号的频谱分析

    首先,我需要理清一下自己的思路 1.转化格式为wav--下载软件 2.将声音信号放到matlab里面,那些特征如何显示分析?-- 2.FFT变换是什么?--看其他人代码 3.能量分布情况又是什么?-- ...

  3. 基于labview开发平台的声音信号采集及处理系统设计

    目 录 摘 要 I Abstract I 目 录 III 第1章 绪 论 1 1.1 引言 1 1.2 声音信号处理的发展及应用 2 1.3 本课题研究任务及章节安排 3 第2章 系统设计方案 4 2 ...

  4. 信号与系统(1)---采样率对声音信号采集的影响

    本博文依托于"信号与系统"课程设计,分为三部分,本博文涉及第一部分:"采样率对声音信号采集的影响".未来会做成一个系列,欢迎大家持续关注!! 文章目录 前言 一 ...

  5. 测试录制的电话拨码声音信号在发送过程中的问题

    简 介: 对比了实际录制的手机音频信号的波形以及频谱,可以看到,录制双音频信号出现了较大的变化: 拨码的幅值降低了很多,需要放大20倍才能够与录制的双音频相当: 双音频中的高频区的分量很弱,几乎看不到 ...

  6. 根据声音信号测量距离

    很多动物依赖于声音来感知外部的环境,像夜间活动的蝙蝠.树鼩,海洋里的生物鲸鱼.海豚等.声呐定位不仅给它们追踪猎物.躲避天敌的方法,有时也可以给它们寻觅配偶提供方便. 依靠听觉定位的动物 工业革命之后, ...

  7. 信号内插matlab,声音信号的抽取和内插,MATLAB代码

    声音信号抽取和内插的MATLAB程序 %%%l为抽取倍数,m为内插倍数,mp3为音频信号, %%%此程序实现音频信号的内插和抽取,并画出处理前后的信号时域.频域图像function myhomewor ...

  8. 声音信号 dB 及 dBA 的计算方式

    对于音频采集,需要各种标准环境噪声,如安静环境.我们首先来看什么样的环境叫安静环境(国标): 这里我可以看到国标是以 dBA为单位的,那么如何算这个 dBA . 下面先说一下如何计算 dB, 而后再说 ...

  9. 硬件实现声音信号压缩

    01 信号压缩 一.为什么进行信号压缩?   对声音信号进行压缩,并不是对信号整体进行衰减, 而只是对于其中幅度超过某些阈值的部分进行衰减. 这样就可以防止由人耳朵的"遮蔽"效应, ...

最新文章

  1. c语言 石头剪刀布的小程序,C语言小程序(七)、石头剪刀布
  2. 局部响应归一化(Local Response Normalization)
  3. sublime Text 2 配置以及 Python环境搭建
  4. javascript写字技巧_【iGeek手册】如何书写更加简洁的javascript代码?
  5. 嵌入式笔录(6)单管收音机电路分析
  6. 与Netflix合作 美电视运营商推出4K频道
  7. 一年增加1.2w星,Dapr能否引领云原生中间件的未来?
  8. Spoken English-口语-单词背诵 3步法
  9. Django中的视图(view)
  10. Nginx的原理解析
  11. [u]intN_t - uint8_t, uint16_t, uint32_t, uint64_t
  12. java guava cache_java使用guava cache实现本地缓存
  13. Java/JSP中使用JDBC连接SQL Server 2005~(2008类似)
  14. 深测「小度人工智能音箱1S」:加冕的红外控制术,和掀起的一场智能大进化...
  15. 类似QQ的可隐藏的便签工具SNOTE
  16. Entry name AndroidManifest.xml collided
  17. linux下调试thread 类_linux下GDB调试
  18. 写程序关键是真正自己开始动手写,不要总是想着等全部弄懂了再写
  19. addb %al,%al
  20. 人人网2000万被卖,一代人的青春再不复返!

热门文章

  1. linux查看命令所在软件包,Linux - 查看命令所属的软件包
  2. vc 运行不了pdb文件什么鬼_PDB是什么文件_PDB文件怎么打开_PDB文件能删吗
  3. SSL证书常见错误及解决办法
  4. 《Redis系列》Redis部署
  5. 凹凸世界手游服务器维修,凹凸世界手游进不去怎么办 试试这几个解决方法
  6. leetcode 2022.04.10 招商银行专场竞赛 D.商店促销活动(dp)
  7. PAT-Top-1003 Universal Travel Sites (35分)网络流最大流
  8. RTMP协议推流,助力视频数据轻松上云
  9. 装饰模式:换装系统设计
  10. 香港上市后,李想依然缺钱