版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://bordern.blogbus.com/logs/1083961.html

专业点讲,那是频谱分析视图,如果针对语音数据的话,叫语谱图。语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。
可是为什么采用二维平面来表示三维信息呢?这个是有历史原因的。在数字技术发展以前,人们可视化研究语音数据的方法是把数据通过频率滤波器,然后各个频率的数据驱动相应的类似针式打印的设备按频率高低顺序记录在一卷纸上,信号的强弱由记录在纸上的灰度来表示。记录纸按照一定的速度旋转,即相当于在不同的时间里记录下语音数据。关于语谱图详细资料,大家可以查看其他资料。
那么我们从语谱图上到底可以看出什么信息呢?我们可以观察语音不同频段的信号强度随时间的变化情况。由于音乐信号本身频率丰富,不太容易看出规律,我们可以观察一下纯粹的语音数据的语谱图(附图)。从图中可以看到明显的一条条横方向的条纹,我们称为“声纹”,有很多应用。条纹的地方实际是颜色深的点聚集的地方,随时间延续,就延长成条纹,也就是表示语音中频率值为该点横坐标值的能量较强,在整个语音中所占比重大,那么相应影响人感知的效果要强烈得多。而一般语音中数据是周期性的,所以,能量强点的频率分布是频率周期的,即存在300Hz强点,则一般在n*300Hz点也会出现强点,所以我们看到的语谱图都是条纹状的。
尽管客观人发声器官的音域是有限度的,即一般人发声最高频率为4000Hz,乐器的音域要比人宽很多,打击乐器的上限可以到20KHz。但是,由于我们数字分析频率时,采用的是算法实现的,一般是FFT,所以其结果是由采样率决定的,即尽管是上限为4000Hz的语音数据,如果采用16Khz的采样率来分析,则仍然可以在4000Hz以上的频段发现有数据分布,则可以认为是算法误差,非客观事实。
而楼主所说mp3的18Khz以上部分色彩被砍掉是因为该Mp3采样率一般为44.1Khz,根据采样定律,它能反映的最大频率即为22Khz。而Mp3是根据人听觉心理模型对音乐数据进行了频率限定,即把音域限定在18Khz(小于22Khz)以下。那么既然Mp3实际反应的频率解析度大大低于wav,为什么人耳听不出差别呢?实际人耳能听到的最高频率为16Khz左右,所以如果限定音域时没有任何信号扭曲,人耳是分辨不出缺少了18Khz以上成分的声音的差别的。一个设计完美的音频压缩算法可以使得“CD的效果好”纯粹是心理安慰,当然任何算法都不完美^_^
但是,有些金耳朵为什么能分辨出一些高品质音乐在高频段(超出人耳感知频率)的差别呢?(倒,好像在否定前面的论点了-_-b)这是因为虽然人耳无法感知一些临近阈值的声音,比如16Khz~20Khz,但是,声音可以通过头骨、颅骨传递给大脑的听觉区,不同人的能力不同,所以16Khz~20Khz的分量还是有效果的,往往给人虚幻、空灵的感觉。大家可以去听听欧洲“小猎犬”火星探测器上播放的音乐,尽管它已经失败了。所以以后大家说聋子坏话的时候,声音不可以太大哦^_^

如何看懂音频文件谱分析图相关推荐

  1. 用python语言实现喇叭发声原理_一文看懂音频原理

    笔者博客:mwhitelab.com 笔者公众号:技术杂学铺 前言 笔者最近正好在做和声音处理有关的项目,突然对音频数字化感兴趣,想了解一下基本原理.可网上文章知识都很散.排版也不美观.因此笔者便决定 ...

  2. 一个故事看懂Linux文件权限管理

    前情回顾: 我通过open这个系统调用虫洞来到了内核空间,又在老爷爷的指点下来到了sys_open的地盘,即将开始打开文件的工作. 详情参见:内核地址空间大冒险:系统调用 open系统调用链 小说网站 ...

  3. python怎么读写文件-一文看懂Python文件的读取写入操作,建议收藏-bak文件怎么打开...

    文件的读取写入操作 读取文件read() 假设我们有一个与操作文件同级的1.txt文档with open('pi_digits.txt') as file_object: contents = fil ...

  4. XML基础(一)(只管能看懂XML文件)

    XML基础(一) 1.概述 1.1 定义(xml是个啥玩意儿?) XML(eX t ensible M arkup L anguage)俗称差妹儿或者叫额克死妹儿,专业称之为: 可拓展标记语言. (1 ...

  5. 如何看懂wsdl文件

    解释下面代码: <wsdl:service name="WeatherWS"> <wsdl:documentation xmlns:wsdl="http ...

  6. 小白也能看懂的 Web 前端入门文章(一个浏览器的自白)

    标题:一个浏览器的自白 小 C:"Nginx 大哥,你在吗?" Nginx:"Chrome 小老弟,我在呢!你准备好了吗?" 小 C:"我准备好了,开 ...

  7. 单文件浏览器_图文并茂深度解析浏览器渲染原理,包看懂超值得收藏

    在我们面试过程中,面试官经常会问到这么一个问题,那就是从在浏览器地址栏中输入URL到页面显示,浏览器到底发生了什么?这个问题看起来是老生常谈,但是这个问题回答的好坏,确实可以很好的反映出面试者知识的广 ...

  8. 一图看懂hadoop分布式文件存储系统HDFS工作原理

    一图看懂hadoop分布式文件存储系统HDFS工作原理 转载于:https://www.cnblogs.com/AlexQY/p/9856477.html

  9. 一图看懂 docx 读取、查询、修改 Ms Word docx 文件, 资料整理+笔记(大全)

    本文由 大侠(AhcaoZhu)原创,转载请声明. 链接: https://blog.csdn.net/Ahcao2008 一图看懂 docx 读取.查询.修改 Ms Word docx 文件, 资料 ...

最新文章

  1. LabVIEW图像模式匹配(基础篇—11)
  2. Hdu 4920矩阵乘法(内存访问的讲究)
  3. _tcsnicmp_wcsnicmp
  4. s6-1 传输层概述
  5. 操作系统:第四章 文件管理1 - 文件逻辑结构,物理结构,文件目录,软硬连接,文件系统
  6. LeetCode 161. 相隔为 1 的编辑距离(DP/遍历)
  7. JAVA读取本地图片并展示
  8. java反射机制深入详解_Java基础与提高干货系列——Java反射机制
  9. c++ windows下declspec
  10. html5判断用户摇晃了手机(转)
  11. java纯数字正则表达式_java正则表达式匹配所有数字的案例
  12. 重标极差法(R/S)在matlab上的实现
  13. 新增网站组网方案与解释说明 模版
  14. c语言大小写字母相互转化,(c语言)字符串的大小写字母转化函数
  15. zbb20180929 zk Zookeeper的功能以及工作原理
  16. 干货!如何在SCI论文中转述和总结别人的论文和成果
  17. 【Acm】算法之美—Crashing Balloon
  18. 2021年,我打了多少游戏
  19. 技术好却进不了大公司?程序员面试的几个小技巧请收好
  20. 苏格拉底:“认识你自己”

热门文章

  1. 收藏、学习一气呵成,2019年机器之心干货教程都在这里了
  2. RuntimeError: Error compiling objects for extension手把手带你解决(超详细)
  3. 西电春招码奴就业大纲(一)
  4. python玩转modbus
  5. 中国女性网民研究报告:读懂3.28亿“白骨精”与“白素贞”的内心
  6. Stata8图形示例及代码
  7. 推荐点书,说点学习路线...
  8. SQL 索引的一些理解
  9. 前Facebook员工揭秘硅谷公司招人“潜规则”
  10. 三篇学会MySQL数据库【基础知识】