音频信号(Audio)是带有语音、音乐和音效的有规律的声波的频率、幅度变化的信息载体。根据声波的特征,可以把音频信息分类为规则音频和不规则声音。规则音频可视为一种连续变化的模拟信号,并使用一条连续的曲线(即声波)来表示。

当前人工智能日益成熟并在越来越多的领域获得应用,其中语音识别,音频鉴别等就是其中一个很重要的应用领域。这些核心算法的第一步都是需要将音频文件数据化,提取其中的音频特征。本文主要以其中的一个基本特征 波形为例来进行介绍。在此之前,我们首先来了解音频的一些基本概念,随后介绍如何画出波形图等特征。

一、音频基本概念

1) 通道数

又称声道数。是在采集(录制)声音时引入的概念,即用几个通道去录制声音。一般来说,单声道和双声道的音频文件较为常见。例如在声源的不同位置放置通道去录制,则可以获得多通道的音频数据。

2) 采样率

即每秒钟内采集的样本个数,每个通道分别采集。音频文件的采样率通常较高,例如44100Hz、32000Hz等。

3) 位深

又称之为 量化精度、位宽,表示一个杨本值采用多少bit来表示,用的bit越多则越接近样本的原值。例如若用3个bit表示,则只有2的3次方,也就是8个不同的值,而若用16bit、24bit或更多的bit去量化样本值,则表示的不同指就越多,从而音频听起来就更逼真。

4) 帧数

帧数也就是样本个数。对于“总帧数”要根据上下文来判断,可以是一个通道(声道)的总帧数,也可以是所有通道的总帧数。计算公式为:样本个数=文件的大小/位深精度/通道数。

5) 波形图

又称振幅图,是音频的振幅(或能量)这个维度的图形表达。波形图的横坐标一般为时间,纵坐标一般为dB(即分贝)来表示;有的时候只关心振幅的趋势,那就对振幅进行归一化为[-1,1]范围内。

二、音频波形图的绘制

音频文件大多是以mp3格式进行存储,但是mp3格式文件对于音频的压缩比例较重,因此可以考虑现将mp3文件转化为wav原始文件再提取音频特征。

首先需要安装Python的音频处理模块pydub:

pip install pydub

安装ffmpeg:

brew install ffmpeg

在Ubuntu/Debian Linux安装:

apt-get install  ffmpeg

MP3转为wav的具体代码:

from os import path
from pydub import AudioSegmentsrc = "source.mp3"
dst = "target.wav"sound = AudioSegment.from_mp3(src)
sound.export(dst, format="wav")

由wav文件画出波形图的源代码:

import librosa
import matplotlib.pyplot as plt
import librosa.displayaudioFile='test.wav'
x,sr=librosa.load(audioFile)
plt.figure(figsize=(16,5))
librosa.display.waveplot(x,sr=sr)
plt.show()

显示的波形图如下:

好了,今天的内容先介绍到这里,接下来还会聊到频谱图等特征,敬请期待。

推荐一个公众号:健哥聊量化,会持续推出股票相关基础知识,以及python实现的一些基本的分析代码。欢迎大家关注,二维码如下:

相关文章列表如下:

  • 技术炒股VS价值投资

  • 股票基础知识----- K线形态

  • 股票K线形态 ----早晨之星

  • “早晨之星”实际操作篇---通达信软件为例

  • 牛刀小试----python+tushare进行股票分析

音频特征---波形图相关推荐

  1. python音频特征提取_音频特征提取方法和工具汇总

    本文首发于:行者AI 绝大多数音频特征起源于语音识别任务,它们可以精简原始的波形采样信号,从而加速机器对音频中语义含义的理解.从20世纪90年代末开始,这些音频特征也被应用于乐器识别等音乐信息检索任务 ...

  2. 音频特征提取方法和工具汇总

    本文首发于:行者AI 绝大多数音频特征起源于语音识别任务,它们可以精简原始的波形采样信号,从而加速机器对音频中语义含义的理解.从20世纪90年代末开始,这些音频特征也被应用于乐器识别等音乐信息检索任务 ...

  3. 音频特征于音频信号提取总结

    这里写目录标题 1 语音的产生简介 2 声音特性​ 3. 声音的种类 计算机听觉的应用 4. 什么是音频特征 5 音频特征的类别 5.1 可以从以下几个角度区分 5.2. 常见音频特征举例 6. 音频 ...

  4. 数字信号处理实验三用fft对信号作频谱分析_机器学习中的音频特征:理解Mel频谱图...

    如果你像我一样,试着理解mel的光谱图并不是一件容易的事.你读了一篇文章,却被引出了另一篇,又一篇,又一篇,没完没了.我希望这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图. 信号 信号是一定量 ...

  5. 人耳识别代码_语音识别之——音频特征fbank与mfcc,代码实现与分析

    语音识别中常用的音频特征包括fbank与mfcc. 获得语音信号的fbank特征的一般步骤是:预加重.分帧.加窗.短时傅里叶变换(STFT).mel滤波.去均值等.对fbank做离散余弦变换(DCT) ...

  6. js实现音频可视化波形图

    js实现音频可视化波形图 效果如图:线条的颜色粗细也可以自己调整. 代码如下(可直接复制使用): <html lang="en"><head><met ...

  7. html5音频文件生成波形图代码,使用wavesurfer.js显示mp3 audio音频的波形图

    by zhangxinxu from https://www.zhangxinxu.com/wordpress/?p=8290 本文可全文转载,个人网站无需授权,只要保留原作者.出处以及文中链接即可, ...

  8. 音频特征提取——常用音频特征

    作者:桂. 链接:http://www.cnblogs.com/xingshansi/p/6815217.html 前言 主要总结一下常用的音频特征,并给出具体的理论分析及代码. 一.过零率 过零率的 ...

  9. 音频特征(3):各种与波相关的图的概念小结

    各种与波相关的图的概念小结 这里将上两篇所写的关于波形图的一些区分做一个小结: 波形图 意义 函数图像 (1)首先区分振动图和波形图 振动图 反应介质中某一个质点随时间位移(振幅)变化的图像,就好比绳 ...

最新文章

  1. python 数据比对 函数_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...
  2. 介绍Windows Server服务器角色、角色服务和功能
  3. Create a PCL visualizer in Qt with QtDesigner
  4. java map 集合实例_Java之集合类【HashMap】【入门版,实例解析】
  5. 蒸汽管道图纸符号_水暖工程图纸中的符号表示
  6. php mysql购物系统_基于PHPMySQL 的网上购物系统设计与实现
  7. Tinder活号技术在YouTube上面居然有用模拟器和浏览器玩明白了使用谷歌下载的
  8. png在线转换icns
  9. Unity3D自制横版闯关游戏手册(1)
  10. 2毫秒c51汇编语言延时函数,单片机精确毫秒延时函数
  11. 羽毛球社团php,羽毛球社团的活动总结范文
  12. 玩转华为数据中心交换机系列 | 配置VLAN内协议报文透传示例
  13. const常量和基础数据类型
  14. 谷歌翻拉取别的分支_如何将品牌分支机构的位置添加到Google地图
  15. 推翻微信的,会长什么样
  16. 华为OJ平台题目-砝码重量
  17. 一份DevOps工程师职责清单,待你查阅
  18. 如何获得的office 365 年卡
  19. 我的大长腿,只有防弹级丝袜才能配得上
  20. 关于asm(” RPT #N || NOP”)

热门文章

  1. 那些曾经的互联网草根牛人
  2. 基于SAE特征融合的合成孔径雷达图像的目标识别
  3. openvpen最新安卓中文版_virtualxposed
  4. “会员制营销”和“EMAIL营销”培训方案
  5. 基于jsp物流管理系统
  6. python 文件路径切分
  7. 安居客上市,难挑58大梁?
  8. 解决如何删除打印机端口及驱动
  9. Axhub Charts学习记录贴-渐变色
  10. Java——超市会员管理系统(JDBC+MySQL+Apache DBUtils)