《Deep Learning Techniques for Music Generation – A Survey》深度学习用于音乐生成——书籍阅读笔记(一)Chapter 1

关于这本书

这于关于深度学习用于音乐生成的一本调研性的英文综述书籍:其中介绍了算法音乐生成,以及深度学习技术在该领域的应用与技术,总结的很全面;如果你也希望对深度学习的算法作曲有一个深入的了解,那这本书一定不能错过噢~
这里将这本书进行了翻译和整理,便于对音乐领域不熟悉的小伙伴们阅读。

Chapter 1 介绍

1.1 简介

深度学习最近已经成为一个快速增长的领域,现在经常用于分类和预测任务,例如图像和语音识别,以及翻译。它出现在大约10年前的2006年,当时一个深度学习架构在图像分类任务中使用人工制作的特性显著优于标准技术[40]。我们可以通过以下方法来解释神经网络技术的成功和重新出现:
1.技术进步(特别是预训练和卷积);
2.大规模数据的可用性;
3.专用的计算能力。
深度学习并没有一致的定义。这是一种基于人工神经网络的机器学习(ML)技术。关键的方面和共同的基础是术语deep,这意味着有多层处理多个层次的抽象,这是一种用更简单的表示来表达复杂表示的方法。技术基础主要是神经网络,正如我们将在第5节中看到的,有许多变体(卷积网络、循环网络、自动编码器、限制的玻尔兹曼机器…)。要了解更多关于深度学习的历史和不同方面的信息,请参见最近在该领域[29]上的一本全面的书。
在深度学习中,当前努力的重要部分应用于传统的机器学习任务:分类和预测(也称为回归),作为神经网络初始DNA的证明:线性回归和逻辑回归(见Section5.1)。但是,越来越多的应用深度学习技术是内容的生成。内容可以是多种多样的:主要是图像、文字和音乐,后者是我们分析的重点。动机是使用现在广泛可用的语料库,自动学习音乐风格,并基于此生成新的音乐内容。

1.2 相关工作

据我们所知,在分析使用深度学习来生成音乐方面,只有很少的一些尝试。Graves提出了一项有趣的分析,重点是递归神经网络和文本[31]。Humphrey,Bello和LeCun提出了另一个有趣的分析,与我们分享一些关于音乐表现的问题(参见第4节),但致力于音乐信息检索(MIR)任务,如和弦识别、类型识别和情绪估计[49]。
也可以查阅一些最近的国际研讨会的主题,例如,建设性的机器学习研讨会,会议在神经信息处理系统(少量)2016年12月[16],研讨会深学习音乐,在国际联合会议上神经网络(IJCNN)2017年5月[38]。
也有各种模型和技术使用计算机生成音乐,例如,规则、语法、自动机、马尔可夫模型、图形化的模型,模型由专家或手动定义是汲取了例子。在我们专注于深度学习架构的时候,它们不会在这里得到解决。请参考一些关于计算机音乐的一般书籍,例如[88],以及算法建模和音乐的生成,例如[80]和[15]。
—————————————————————————————————

Chapter 2 Method介绍了分析方法和所考虑的四个维度(目标、表示、架构和策略),与后面四章相对应。
Chapter 3 Objective主要是回顾不同类型的音乐内容。虽然这是一个很短的章节,但我们认为这是一个有用的回顾,以避免混淆不同的生成目标(例如,旋律从头开始,对位到一个现有的旋律…),这通常会导致不同的架构和策略。
Chapter 4 Representation (音符、持续时间、和弦…)编码的不同类型的表现形式和技巧的回顾和分析。本章可被已经精通计算机音乐的读者略过。
Chapter 5 Architecture是对最常见的深度学习架构(前馈、循环、自动编码器…)的回顾。这包括一个简单的神经网络的最基本的回顾。已经精通神经网络和深度学习架构的读者可跳过这一章。
Chapter 6 Strategy是对使用深度学习架构生成音乐的各种方法(策略)进行分类的初步尝试。它来源于我们对众多系统和实验的调查,这些系统和实验将在下一章介绍和讨论。
Chapter 7 Systems是对文献中各种系统和实验的综述。根据前几章提出的分类方法对它们进行了分析、比较和分类。
Chapter 8 Analysis通过一些表格总结了上一章的调查,以帮助识别不同系统的设计决策。
Chapter 9 Other sources of inspiration走出音乐领域,介绍一些系统的例子和实验,主要是在图像生成领域,这些可能是未来音乐生成的灵感来源。
Chapter 10 Discussion讨论了前几章中提到的一些问题。

《Deep Learning Techniques for Music Generation – A Survey》深度学习用于音乐生成——书籍阅读笔记(一)Chapter 1相关推荐

  1. 【读点论文】Deep Learning Face Representation by Joint Identification-Verification,深度学习应用在优化问题上,deepid2

    Deep Learning Face Representation by Joint Identification-Verification 人脸识别的关键挑战是开发有效的特征表示,以减少个体内的差异 ...

  2. A Survey on Deep Learning Techniques for Stereo-based Depth Estimation论文阅读

    第一次校正,改正了一些错误和生硬的翻译(像机器翻译一样).一定会有一些笔误.翻译不准确甚至错误的地方.还望批评指正. 1. 摘要 估计RGB图片的深度一直以来都是棘手的问题,计算机视觉.图形学.机器学 ...

  3. 【点云系列】综述: Deep Learning for 3D Point Clouds: A Survey

    文章目录 起因 题目 摘要 1 简介 2 背景 2.1 数据集 2.2 衡量指标 3 3D形状分类 3.1基于多视角的方法 3.2基于体素的方法 3.3 基于点的方法 3.3.1逐点MLP网络 3.3 ...

  4. Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查 (IEEE TPAMI 2020)

    Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查(IEEE TPAMI 2020) 摘要 1. 引言 2. 背景 2.1 数据集 ...

  5. Deep Learning for 3D Point Clouds: A Survey 论文阅读

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Abstract:在点云深度学习中,主要包含的任务有:3D形状分类.3D目标检测和跟踪.3D点云分割. ...

  6. Data Mining 论文翻译:Deep Learning for Spatio-Temporal Data Mining: A Survey

    原文链接:[1906.04928] Deep Learning for Spatio-Temporal Data Mining: A Survey (arxiv.org) IEEE Transacti ...

  7. 综述论文翻译:A Review on Deep Learning Techniques Applied to Semantic Segmentation

    综述论文翻译:A Review on Deep Learning Techniques Applied to Semantic Segmentation 近期主要在学习语义分割相关方法,计划将arXi ...

  8. Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)

    Deep Learning for Visual Tracking: A Comprehensive Survey https://arxiv.org/pdf/1912.00535.pdf 摘要 视觉 ...

  9. Prediction of Multidrug-Resistant TB from CT Pulmonary Images Based on Deep Learning Techniques论文总结

    Prediction of Multidrug-Resistant TB from CT Pulmonary Images Based on Deep Learning Techniques 解决的问 ...

最新文章

  1. ACL 2022丨香港大学华为诺亚方舟新工作:生成式预训练语言模型的量化压缩
  2. sudo规则支持正则
  3. mac 下代码合并比较的工具(changes)
  4. 四十四、Mysql的命令和PyMysql
  5. mockjs vue ajax,mockjs在vue中的使用
  6. ubuntu rpm安装_为什么说Ubuntu是一个值得尊敬的Linux发行版
  7. 哈工大计算机组织与体系结构实验二_小猿关注 | 计算机学院组织开展“新生入学实验室安全教育”主题活动...
  8. strtof linux内核,Qt for Android使用grpc探索
  9. keepalived 多个应用_Keepalived高可用软件概述
  10. 2020美赛MCM/ICM参赛及获奖分析
  11. NOJ1060接苹果——DP
  12. 一篇文章读懂C++ 继承
  13. 天下武功唯快不破 实验吧(小结)
  14. Activities(活动)
  15. 第一章 语言处理与python
  16. 区块链的未来发展和前景会如何呢?
  17. 日常工作笔记0807
  18. Android 距离感应器和耳机状态监测(控制Audio输出通道切换)
  19. 《财富自由之路》读书笔记
  20. 怎么来解决GIS表转Excel超了65535的最大行限制

热门文章

  1. IDEA提示“程序包xxx不存在“
  2. 提示找不到 XXX.dll 解决方法
  3. 苹果微信浏览器html缓存图片吗,h5清理微信浏览器网页缓存
  4. HuTool 工具类详细介绍2 文件操作工具类
  5. 图片传输中的转码问题
  6. java 微信转账 ca_error_微信支付退款接口调用证书出现错误
  7. 2020中传计算机专硕考研经验贴
  8. 用C#开发带农历的日历
  9. 昱琛航空IPO被终止:曾拟募资5亿 郭峥为大股东
  10. bugku ctf 你必须让他停下