音频特征---波形图
音频信号(Audio)是带有语音、音乐和音效的有规律的声波的频率、幅度变化的信息载体。根据声波的特征,可以把音频信息分类为规则音频和不规则声音。规则音频可视为一种连续变化的模拟信号,并使用一条连续的曲线(即声波)来表示。
当前人工智能日益成熟并在越来越多的领域获得应用,其中语音识别,音频鉴别等就是其中一个很重要的应用领域。这些核心算法的第一步都是需要将音频文件数据化,提取其中的音频特征。本文主要以其中的一个基本特征 波形为例来进行介绍。在此之前,我们首先来了解音频的一些基本概念,随后介绍如何画出波形图等特征。
一、音频基本概念
1) 通道数
又称声道数。是在采集(录制)声音时引入的概念,即用几个通道去录制声音。一般来说,单声道和双声道的音频文件较为常见。例如在声源的不同位置放置通道去录制,则可以获得多通道的音频数据。
2) 采样率
即每秒钟内采集的样本个数,每个通道分别采集。音频文件的采样率通常较高,例如44100Hz、32000Hz等。
3) 位深
又称之为 量化精度、位宽,表示一个杨本值采用多少bit来表示,用的bit越多则越接近样本的原值。例如若用3个bit表示,则只有2的3次方,也就是8个不同的值,而若用16bit、24bit或更多的bit去量化样本值,则表示的不同指就越多,从而音频听起来就更逼真。
4) 帧数
帧数也就是样本个数。对于“总帧数”要根据上下文来判断,可以是一个通道(声道)的总帧数,也可以是所有通道的总帧数。计算公式为:样本个数=文件的大小/位深精度/通道数。
5) 波形图
又称振幅图,是音频的振幅(或能量)这个维度的图形表达。波形图的横坐标一般为时间,纵坐标一般为dB(即分贝)来表示;有的时候只关心振幅的趋势,那就对振幅进行归一化为[-1,1]范围内。
二、音频波形图的绘制
音频文件大多是以mp3格式进行存储,但是mp3格式文件对于音频的压缩比例较重,因此可以考虑现将mp3文件转化为wav原始文件再提取音频特征。
首先需要安装Python的音频处理模块pydub:
pip install pydub
安装ffmpeg:
brew install ffmpeg
在Ubuntu/Debian Linux安装:
apt-get install ffmpeg
MP3转为wav的具体代码:
from os import path
from pydub import AudioSegmentsrc = "source.mp3"
dst = "target.wav"sound = AudioSegment.from_mp3(src)
sound.export(dst, format="wav")
由wav文件画出波形图的源代码:
import librosa
import matplotlib.pyplot as plt
import librosa.displayaudioFile='test.wav'
x,sr=librosa.load(audioFile)
plt.figure(figsize=(16,5))
librosa.display.waveplot(x,sr=sr)
plt.show()
显示的波形图如下:
好了,今天的内容先介绍到这里,接下来还会聊到频谱图等特征,敬请期待。
推荐一个公众号:健哥聊量化,会持续推出股票相关基础知识,以及python实现的一些基本的分析代码。欢迎大家关注,二维码如下:
相关文章列表如下:
技术炒股VS价值投资
股票基础知识----- K线形态
股票K线形态 ----早晨之星
“早晨之星”实际操作篇---通达信软件为例
牛刀小试----python+tushare进行股票分析
音频特征---波形图相关推荐
- python音频特征提取_音频特征提取方法和工具汇总
本文首发于:行者AI 绝大多数音频特征起源于语音识别任务,它们可以精简原始的波形采样信号,从而加速机器对音频中语义含义的理解.从20世纪90年代末开始,这些音频特征也被应用于乐器识别等音乐信息检索任务 ...
- 音频特征提取方法和工具汇总
本文首发于:行者AI 绝大多数音频特征起源于语音识别任务,它们可以精简原始的波形采样信号,从而加速机器对音频中语义含义的理解.从20世纪90年代末开始,这些音频特征也被应用于乐器识别等音乐信息检索任务 ...
- 音频特征于音频信号提取总结
这里写目录标题 1 语音的产生简介 2 声音特性 3. 声音的种类 计算机听觉的应用 4. 什么是音频特征 5 音频特征的类别 5.1 可以从以下几个角度区分 5.2. 常见音频特征举例 6. 音频 ...
- 数字信号处理实验三用fft对信号作频谱分析_机器学习中的音频特征:理解Mel频谱图...
如果你像我一样,试着理解mel的光谱图并不是一件容易的事.你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了.我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图. 信号 信号是一定量 ...
- 人耳识别代码_语音识别之——音频特征fbank与mfcc,代码实现与分析
语音识别中常用的音频特征包括fbank与mfcc. 获得语音信号的fbank特征的一般步骤是:预加重.分帧.加窗.短时傅里叶变换(STFT).mel滤波.去均值等.对fbank做离散余弦变换(DCT) ...
- js实现音频可视化波形图
js实现音频可视化波形图 效果如图:线条的颜色粗细也可以自己调整. 代码如下(可直接复制使用): <html lang="en"><head><met ...
- html5音频文件生成波形图代码,使用wavesurfer.js显示mp3 audio音频的波形图
by zhangxinxu from https://www.zhangxinxu.com/wordpress/?p=8290 本文可全文转载,个人网站无需授权,只要保留原作者.出处以及文中链接即可, ...
- 音频特征提取——常用音频特征
作者:桂. 链接:http://www.cnblogs.com/xingshansi/p/6815217.html 前言 主要总结一下常用的音频特征,并给出具体的理论分析及代码. 一.过零率 过零率的 ...
- 音频特征(3):各种与波相关的图的概念小结
各种与波相关的图的概念小结 这里将上两篇所写的关于波形图的一些区分做一个小结: 波形图 意义 函数图像 (1)首先区分振动图和波形图 振动图 反应介质中某一个质点随时间位移(振幅)变化的图像,就好比绳 ...
最新文章
- python 数据比对 函数_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...
- 介绍Windows Server服务器角色、角色服务和功能
- Create a PCL visualizer in Qt with QtDesigner
- java map 集合实例_Java之集合类【HashMap】【入门版,实例解析】
- 蒸汽管道图纸符号_水暖工程图纸中的符号表示
- php mysql购物系统_基于PHPMySQL 的网上购物系统设计与实现
- Tinder活号技术在YouTube上面居然有用模拟器和浏览器玩明白了使用谷歌下载的
- png在线转换icns
- Unity3D自制横版闯关游戏手册(1)
- 2毫秒c51汇编语言延时函数,单片机精确毫秒延时函数
- 羽毛球社团php,羽毛球社团的活动总结范文
- 玩转华为数据中心交换机系列 | 配置VLAN内协议报文透传示例
- const常量和基础数据类型
- 谷歌翻拉取别的分支_如何将品牌分支机构的位置添加到Google地图
- 推翻微信的,会长什么样
- 华为OJ平台题目-砝码重量
- 一份DevOps工程师职责清单,待你查阅
- 如何获得的office 365 年卡
- 我的大长腿,只有防弹级丝袜才能配得上
- 关于asm(” RPT #N || NOP”)