深度学习学习7步骤

In order to train Deep Learning models, preparing and curating datasets is usually a very important step. In this story, I show how you can use Audacity a “free, open-source, cross-platform audio software” to label your data.

为了训练深度学习模型,准备和整理数据集通常是非常重要的一步。 在这个故事中,我将向您展示如何使用Audacity这个“免费,开源,跨平台的音频软件”来标记数据。

表中的内容 (Table of content)

  • Spectrogram Representation频谱图表示
  • Creating Labels创建标签
  • Exporting Labels导出标签
  • Loading Data on Python在Python上加载数据

1.频谱图表示 (1. Spectrogram Representation)

The first step, right after installing Audacity and importing an audio file, is to change to spectrogram representation as shown in the image below.

在安装Audacity并导入音频文件之后,第一步就是更改为频谱图表示形式 ,如下图所示。

Viewing the spectrogram in Audacity. Print screen by the author.
在Audacity中查看频谱图。 由作者打印屏幕。

You can then adjust the spectrogram settings in the same menu and the scale of visualization by right-clicking on the scale. In the example below, I’m selecting “Mel” option for the scale. You can read more about the meaning of Mel Spectrograms in this story by Dalya Gartzman.

然后,您可以在同一菜单中调整频谱图设置,并通过右键单击刻度来调整可视化的刻度。 在下面的示例中,我为秤选择“ Mel”选项。 您可以在Dalya Gartzman的 故事中了解有关梅尔谱图的含义的更多信息。

Changing the scale to Mel. Image by the author.
将音阶更改为Mel。 图片由作者提供。

2.创建标签 (2. Creating Labels)

To create the labels first go Edit > Labels > Add Label at Selection and check the keyboard shortcut (Ctrl+B in Windows) so that you don’t need to go back to the menu every time.

要创建标签,请首先进入“ 编辑”>“标签”>“在选择时添加标签”,然后检查键盘快捷键(在Windows中为Ctrl + B),这样就无需每次都返回菜单。

Finding the option to add a label. Image by the author.
查找添加标签的选项。 图片由作者提供。

Now that you know the keyboard shortcut select a region in the spectrogram that you want to label (click and drag) and then use the shortcut to ‘Add Label at Selection’. A label track will appear and you can type the name for your label. You can repeat this process to add as many labels as needed!

现在您已经知道键盘快捷键,在频谱图中选择要标记的区域(单击并拖动),然后使用该快捷方式“在选择时添加标签”。 标签轨道将出现,您可以键入标签的名称。 您可以重复此过程以根据需要添加尽可能多的标签!

Creating the labels. Image by the author.
创建标签。 图片由作者提供。

Note: It helps to play the clip as you are labelling. You can use the ‘space bar’ to play and pause.

注意:在贴标签时播放片段会有所帮助。 您可以使用“空格键”播放和暂停。

3.导出标签 (3. Exporting Labels)

To export the labels, go to File > Export > Export Labels.

要导出标签,请转到文件>导出>导出标签。

Exporting the labels. Image by the author.
导出标签。 图片由作者提供。

The result is a text file with each label indicating the start and end time, name of the label, and minimum and maximum frequency. A value of -1 in the frequency indicates lower than the minimum or higher than the maximum displayed.

结果是一个文本文件,每个标签指示开始和结束时间,标签名称以及最小和最大频率。 频率值-1表示低于显示的最小值或高于显示的最大值。

Example of exported labels. Image by the author.
导出标签的示例。 图片由作者提供。

4.在Python上加载数据 (4. Loading Data on Python)

After repeating the steps above for all audio files you are ready to load the data in Python! I prepared the following code to read and display a spectrogram with the respective labels. The code is also available as a Kaggle kernel.

对所有音频文件重复上述步骤之后,您就可以在Python中加载数据了! 我准备了以下代码,以读取和显示带有相应标签的频谱图。 该代码也可以作为Kaggle内核使用 。

The result is the following image of the Mel Spectrogram with the red bounding boxes corresponding to the labels in the ‘labels dataframe’ (code above).

结果是梅尔频谱图的以下图像,其中红色边框与“标签数据框”(上面的代码)中的标签相对应。

Mel spectrogram and labels. Image by the author.
梅尔光谱图和标签。 图片由作者提供。

结束语 (Final remarks)

I hope you find this story useful! Please consider joining my private mailing list in this link so that you won’t miss any of my following stories! You can read more about my Data Science journey in the following two stories!

我希望您觉得这个故事有用! 请考虑通过此链接加入我的私人邮件列表 这样您就不会错过我的以下任何故事! 您可以通过以下两个故事阅读有关我的数据科学之旅的更多信息!

Thanks for reading! Have a great day!

谢谢阅读! 祝你有美好的一天!

翻译自: https://towardsdatascience.com/how-to-label-audio-for-deep-learning-in-4-simple-steps-6a2c33b343e6

深度学习学习7步骤


http://www.taodudu.cc/news/show-863742.html

相关文章:

  • 邮件伪造_伪造品背后的数学
  • 图像匹配与OpenCV模板匹配
  • 边缘计算边缘计算edge_Edge AI-边缘上的计算机视觉推理
  • arduino 入门套件_计算机视觉入门套件
  • 了解LSTM和GRU
  • 使用TensorFlow 2.0+和Keras实现AlexNet CNN架构
  • power bi_如何将Power BI模型的尺寸减少90%!
  • 使用Optuna的XGBoost模型的高效超参数优化
  • latex 表格中虚线_如何识别和修复表格识别中的虚线
  • 构建强化学习_如何构建强化学习项目(第1部分)
  • sam服务器是什么_使用SAM CLI将机器学习模型部署到无服务器后端
  • pca 主成分分析_六分钟的主成分分析(PCA)的直观说明。
  • seaborn 教程_使用Seaborn进行数据可视化教程
  • alexnet 结构_AlexNet的体系结构和实现
  • python做作业没头绪_使用Python做作业
  • 使用Python构建推荐系统的机器学习
  • DeepR —训练TensorFlow模型进行生产
  • 通化红灯_我们如何构建廉价,可扩展的架构来对世界进行卡通化!
  • 机器学习学习吴恩达逻辑回归_机器学习基础:逻辑回归
  • 软件测试 测试停止标准_停止正常测试
  • cloud 部署_使用Google Cloud AI平台开发,训练和部署TensorFlow模型
  • 机器学习多元线性回归_过度简化的机器学习(1):多元回归
  • 机器学习与分布式机器学习_机器学习的歧义
  • 单词嵌入_单词嵌入与单词袋:推荐系统的奇怪案例
  • 自然语言处理综述_自然语言处理
  • 来自天秤座的梦想_天秤座:单线全自动机器学习
  • 数据增强 数据集扩充_数据扩充的抽象总结
  • 贝叶斯优化神经网络参数_贝叶斯超参数优化:神经网络,TensorFlow,相预测示例
  • 如何学习 azure_Azure的监督学习
  • t-sne 流形_流形学习[t-SNE,LLE,Isomap等]变得轻松

深度学习学习7步骤_如何通过4个简单步骤为深度学习标记音频相关推荐

  1. wordpress克隆站点_如何通过7个简单步骤克隆WordPress网站

    wordpress克隆站点 Generally speaking, cloning is considered an unethical practice. However, when you thi ...

  2. python学习小组分组程序_【Python】每日一练:学生学习小组分组程序

    编程题 学习小组分组程序:某课程共分4个小组,现有12名学生,要求随机分配到各组中.要求每组有且只能有3名学生. 编程要求:(1)要求使用嵌套列表保存数据:(2)要求导入随机数模块 思路分析 (1)首 ...

  3. django连接mysql步骤_使用Django连接Mysql数据库步骤

    链接mysql步骤 第一步:在终端下载pymysql文件–pip install pymysql 第二步:在gjango项目的__init__文件中添加代码 import pymysql pymysq ...

  4. wordpress启动_如何通过7个简单步骤正确地启动WordPress博客(2020)

    wordpress启动 Do you want to start a WordPress blog the right way? We know that starting a blog can be ...

  5. 开发步骤_开发客户的六个步骤

    现在很多销售人员在拜访客户的时候,显得很盲目,见了面不知道该说什么,该怎么说,只是简单的介绍下自己,然后就极力向客户推销产品,客户拒绝后,便灰溜溜的走了,灰心丧气,拜访下家就没有激情了.今天这样,明日 ...

  6. python自动生成测试报告步骤_生成HTMLTestRunner测试报告的操作步骤——Python+selenium自动化...

    HTMLTestRunner是Python标准库的unittest模块的一个扩展,具体操作如下 1.安装 环境:Window8 步骤:1)http://tungwaiyip.info/software ...

  7. 下载python步骤_下载及安装Python详细步骤

    安装python分三个步骤: *下载python *安装python *检查是否安装成功 1.下载python (1)python下载地址 (2)选择下载的版本 (3)点开download后,找到下载 ...

  8. 开发java程序的步骤_开发 Java 程序的一般步骤是:源程序编辑、 和 。_学小易找答案...

    [多选题]财务报表分析具有广泛的用途,一般包括( ). [单选题]在财务报表分析中,投资人是指( ). [单选题]阅读下列代码,选出该代码段正确的文件名( ). class A{ void metho ...

  9. uboot移植9个步骤_不知道具体的新房装修步骤?9个步骤教你吃透装修

    最近有同学准备装修新房了,不知道具体的装修步骤是怎么样的,需要花多少预算?装修时间要多久?其实这也不奇怪,很多没有装修经验的朋友对这方面都不太了解的,今天分享一般装修的流程工序,希望能给大家一下参考和 ...

最新文章

  1. 我们需要一个时期,把我们之前的愿景用实际行动实现
  2. 华硕老毛子(Padavan)——Ngrok内网穿透解决方案
  3. vmix安装无法连接远程服务器_Windows server 2012 云服务器建站教程 (1):远程连接桌面+IIS服务器安装...
  4. ubuntu 14.04安装mysql数据库
  5. C语言进制转换 十进制转换为任意进制
  6. python怎么标注折线图_利用python画折线图
  7. IM即时通讯加入“对方正在输入…”真的好吗?
  8. 惠普打印机驱动程序安装失败解决
  9. VS2010旗舰版安装步骤
  10. 互联网日报 | 滴滴正式入局货运市场;苏宁小店宣布开放加盟;钉钉推出新职业在线学习平台...
  11. 【第七周】项目6-停车场模拟
  12. 计算机显卡型号中数字含义详解,科普入门 | 那些显卡型号告诉我们的事
  13. Win10系统磁盘扩展分区与恢复分区
  14. tf.name_scope与tf.variable_scope用法区别
  15. speedoffice(word)如何给文字加粗
  16. ASP医院管理系统—病历管理系统的设计与实现
  17. iPhone出现绿屏问题怎么修复?可以尝试这些解决方案
  18. 苹果/Mac Fn功能键的作用是什么?Fn键使用小技巧有哪些
  19. 经常玩电脑正确的坐姿_细说用电脑的正确坐姿
  20. Hoeffding不等式

热门文章

  1. spring源代码系列(一)sring源代码编译 spring源代码下载 spring源代码阅读
  2. Windows Live Writer 配置报407 Proxy Authentication Required错误
  3. Elasticsearch——分词器对String的作用
  4. poj2337 欧拉路径
  5. windows2003下防火墙ISA大型实验
  6. window.onload与$(document).ready()的区别
  7. NAS优缺点完全剖析
  8. 谈SOA在国内推进状况
  9. vuecli3修改html,vue-cli3多页应用改造
  10. Weird Game CodeForces - 299C