python学习音频-机器学习利用Python进行音频数据增强

2019-09-24

机器学习利用Python进行音频数据增强

数据增强通常用于机器学习和深度学习，以便在训练产生大量数据后获得良好的性能。

在这篇文章中，我将展示如何用一些音频增强技术使用输入音频文件生成新的音频文件。首先，我们首先导入依赖库，这些库在以下先决条件部分给出。为了在给定的音频文件上应用任何技术，我们需要阅读它。要读取输入音频文件，有一个用于音乐和音频分析的" LibROSA " python包。通过使用librosa，我们将读取输入音频文件并对其应用一些效果。然后，我们将保存新的音频文件作为输出，并显示输出声音的波形。

依赖库

NumPy

Matplotlib

LibROSA

在我们导入依赖库后，我们可以开始创建一个新的"AudioAugmentation"类。这个类的第一个方法是将一个参数作为"file_path"的"read_audio_file"方法。在librosa库的帮助下，给定"wav"文件可以加载如下。

import librosa

import numpy as np

import matplotlib.pyplot as plt

class AudioAugmentation:

def read_audio_file(self, file_path):

input_length = 16000

data = librosa.core.load(file_path)[0]

if len(data) > input_length:

data = data[:input_length]

else:

data = np.pad(data, (0, max(0, input_length - len(data))), "constant")

return data

对音频文件的影响

现在，我们编写了三种方法来对给定的音频文件应用新的效果。这些方法是"add_noise"、"shift"和"stretch"。在"add_noise"方法中，我们添加了由numpy库生成的随机噪声。在"shift"方法中，我们再次使用numpy库来转换给定的音频数据。最后，"stretch"方法应用于librosa效应的time_stretch。

接下来，您可以看到这三种方法的python实现。

def add_noise(self, data):

noise = np.random.randn(len(data))

data_noise = data + 0.005 * noise

return data_noise

def shift(self, data):

return np.roll(data, 1600)

def stretch(self, data, rate=1):

input_length = 16000

data = librosa.effects.time_stretch(data, rate)

if len(data) > input_length:

data = data[:input_length]

else:

data = np.pad(data, (0, max(0, input_length - len(data))), "constant")

return data

保存生成的音频文件

为了应用这些效果，我们可以生成新的音频文件。要将它们存储到下一个研究中使用的文件夹中，我们可以使用librosa的"write_wav"功能，如下所示。

def write_audio_file(self, file, data, sample_rate=16000):

librosa.output.write_wav(file, data, sample_rate)

现在，我们可以从"AudioAugmentation"类创建一个新实例并调用它的任何方法。(在读取输入声音之后，我们在其上施加了噪音。)

aa = AudioAugmentation()

# Read cat sound

data = aa.read_audio_file("data/cat.wav")

aa.plot_time_series(data)

# Adding noise to sound

data_noise = aa.add_noise(data)

绘制时间序列

要查看生成声音的波形，我们可以使用matplotlib库编写以下方法。

def plot_time_series(self, data):

fig = plt.figure(figsize=(14, 8))

plt.title('Raw wave ')

plt.ylabel('Amplitude')

plt.plot(np.linspace(0, 1, len(data)), data)

plt.show()

最后，我们可以调用这个" plot_time_series "方法来显示生成的声音文件的波形。在下面，对于每一个声音(生的猫的声音，和音效)，都有一些带有原始波和振幅的波图。

###找了好久的文章，谢谢楼主，学习了啊

python学习音频-机器学习利用Python进行音频数据增强相关推荐

Python之ffmpeg：利用python编程基于ffmpeg将m4a格式音频文件转为mp3格式文件
Python之ffmpeg:利用python编程基于ffmpeg将m4a格式音频文件转为mp3格式文件目录利用python编程基于ffmpeg将m4a格式音频文件转为mp3格式文件 1.先下载ff ...
数据结构学习笔记：利用Python列表实现栈结构
数据结构学习笔记:利用Python列表实现栈结构利用Python列表实现栈结构.有两种实现方式: 1.将列表的末尾(rear)作为栈顶(top) 2.将列表的前端(front)作为栈顶(top) 一 ...
Python学习笔记：利用timeit计算函数调用耗时
Python学习笔记:利用timeit计算函数调用耗时一.timeit模块简介 Timer对象包含两个参数:第一个参数是你想要计时的Python语句,第二个参数运行一次来建立测试. 默认情况time ...
Python学习笔记：利用控制器跳转不同页面
Python学习笔记:利用控制器跳转不同页面程序需要用到数据库student里的学生表t_student 1.创建python项目demo02 2.创建页面index.html 3.创建控制器con ...
小猪的Python学习之旅 —— 17.Python数据分析：我主良缘交友了解下
小猪的Python学习之旅 -- 17.Python数据分析:我主良缘交友了解下标签:Python 一句话概括本文: 爬取我主良缘交友所有的妹子信息,利用Jupyter Notebook对五个方面: ...
用python做数据分析pdf_利用python进行数据分析pdf
利用python进行数据分析pdf微盘下载!<利用python进行数据分析>利用Python实现数据密集型应用由浅入深帮助读者解决数据分析问题~适合刚刚接触Python的分析人员以及刚刚接 ...
小猪的Python学习之旅 —— 19.Python微信自动好友验证，自动回复，发送群聊链接
小猪的Python学习之旅 -- 19.Python微信自动好友验证,自动回复,发送群聊链接标签:Python 一句话概括本文: 上一节利用itchat这个库,做了小宇宙早报的监测与转发, 本节新增 ...
Python学习细节总结以及python与c语言区别比较（4）
本文python学习基于廖雪峰老师的学习网站:字符串和编码 - 廖雪峰的官方网站 (liaoxuefeng.com),其内容相对完整,适合初学者学习.由于楼主之前有c语言的学习经验,在此本文仅对其中与 ...
小猪的Python学习之旅 —— 18.Python微信转发小宇宙早报
小猪的Python学习之旅 -- 18.Python微信转发小宇宙早报标签:Python 一句话概括本文: 利用itchat,监控特定信息,转发到特定微信群- 引言: 上一篇小猪的Python学习 ...

python学习音频-机器学习利用Python进行音频数据增强

python学习音频-机器学习利用Python进行音频数据增强相关推荐

最新文章

热门文章