声明:本文翻译自《Music Data Mining》(ISBN:9781439835524),英文版权归原作者 Edited by Tao Li, Mitsunori Ogihara and George Tzanetakis 所有。中文译文版权归本作者所有,禁止转载。

译者简介:中国音乐学院 博士生(音乐科技方向)

数据挖掘策略通常建立在两个主要问题上:什么样的数据和什么样的任务。音乐数据挖掘也是如此。

¶ 哪种数据?

音乐数据收集包括各种数据类型。例如,它由音乐音频文件、标题和艺术家等元数据组成,有时甚至包括播放统计信息。针对不同的音乐数据挖掘任务,可对这些数据表示进行不同的分析和实验。

¶ 哪种任务?

音乐数据挖掘涉及到各种任务的方法,如体裁分类、艺术家/歌手识别、情绪/情感检测、乐器识别、音乐相似性搜索、音乐摘要和可视化等。不同的音乐数据挖掘任务针对不同的数据源,并尝试从不同的方面挖掘数据源。例如,音乐体裁分类的目的是利用音乐特征表示的计算分析,将音乐信号自动分类为一个单一的类别;情绪/情绪检测试图通过音乐数据的声学特征或其他方面来识别音乐作品中表现的情绪/情绪。

音乐数据管理

听众习惯于将部分音乐(如果不是全部)存储在自己的计算机中,部分原因是存储在计算机中的音乐通常比存储在“CD盒”中的音乐更容易访问。将音乐数据从最初录制的格式传输到计算机可访问的格式(如MP3)涉及收集和存储元数据的过程。传输软件通常使用外部数据库来执行此过程。不幸的是,从这些数据库中获得的数据通常包含错误,例如为同一唱片集提供了多个不同的曲目列表。鉴于此,有研究者开始提出了建立统一的数字多媒体数据库的想法。数字图书馆支持知识生产者、图书馆员、信息和知识寻求者之间的有效互动。数字图书馆的后续问题是如何有效地存储和整理音乐数据记录,使音乐爱好者能够快速找到自己感兴趣的音乐资源。

音乐索引:音乐数据管理中的一个挑战是如何利用基于数据本身不同方面的数据索引技术。对于音乐数据,可以应用内容和各种声学特性来促进有效的音乐管理。提出一种新的方法来生成小而全面的音乐描述符,以提供有效的内容音乐数据访问和检索服务。与依赖于语音分析技术的低层谱特征的方法不同,他们的方法集成了人类的音乐感知,通过 PCA 和神经网络提高了检索和分类过程的准确性。还有其他一些技术专注于索引音乐数据。例如cruples等人提出了一种创新的集成视觉方法,用于索引音乐和自动为收音机或连锁店编写个性化播放列表。具体地说,他们是根据视觉线索用艺术标准索引音乐标题,并提出了一个集成的视觉动态环境来帮助用户索引音乐标题和编辑生成的播放列表。Rauber等人提出了一个系统,根据感知到的声音相似性自动组织一个音乐集,类似于音乐的流派或风格。在他们的方法中,音频信号根据心理声学模型进行处理,以获得其特征的恒定表示。随后的聚类提供了一个直观的界面,在这个界面上相似的音乐片段被组合在一个类似于地图的图像上显示。

音乐可视化

音乐可视化可分为两类:

(一)侧重于单个音乐文档的元数据内容或声学内容的可视化;(二)旨在表示完整的音乐集合,以显示不同音乐片段之间的相关性,或根据其成对相似性将音乐片段分组为不同的簇。前者是出于一个普通用户的需求——当用户在仔细聆听音乐CD之前,能先进行浏览,以便大致捕捉音乐文档的主旨或音乐风格。后者基于这样一个理念,即音乐集合的空间结构能帮助用户找到他们感兴趣的特定歌曲,因为人们可以记住视觉体现中的位置,通过并且可以通过搜索结果以及附近出现的类似结果来进一步进行定位选择。

个别音乐可视化:单一音乐的可视化方法有很多种,其中大多数都是利用音乐的声学特性来表现音乐的录制。如Adli、Imieli´nski 和 Swami 指出的那样,与音频文件中的分析相比,MIDI 中的音乐符号分析可以提供更准确的音乐方面的信息,如调性、旋律线和节奏,而计算需求较少。此外,基于 MIDI 文件的可视化可以创建与音乐上下文密切相关的视觉模式,因为音乐信息可以显式或高效地获得。Chen等人提出了一种基于情感的音乐播放器,它基于音乐听觉刺激所诱发的情感和视觉化的视觉内容,实现视觉化(照片)与音乐的同步化。单曲音乐记录的音乐可视化的另一个例子是钢琴滚动视图,它提出了一种新的信号处理技术,通过简单的光谱域变换,提供给定复调音乐信号的钢琴滚动式显示。还有一些其他方法,比如自相似性、波形图和频谱图。任何可视化都有积极的方面和缺点,这取决于与之相关的音乐形式所承载的维度,以及捕捉相关特征的能力。可视化可以面向全局表示,也可只面向局部特征。

音乐收藏可视化:一组音乐记录的可视化通常是基于相似性的概念。实际上,通常基于二维图的图形表示问题是许多数据分析领域的典型问题。多维标度和主成分分析等技术在元素之间的距离度量(如音乐相似性)或元素映射到高维空间中的点时,用于表示复合多维数据集是众所周知的。二维可视化技术在音乐收藏中的应用必须考虑到可视化将提供给非专业用户,而不是数据分析员,他们需要一个简单而有吸引力的数据表示形式。

音频采集图形表示系统的一个例子是 Marsyas3D ,它包括集合中元素的各种可选的2D和3D表示。特别地,主成分分析被用来减少描述音色的参数空间,以获得二维或三维的表现。另一个例子是 Sonic Browser,它是一个用于浏览音频集合的应用程序,它为用户提供多个视图,包括音频对象的二维散射图,其中每个点的坐标取决于数据集的属性,以及一个图形树表示,其中树用根在中心,叶子在一个圆上。Lübbers提出的声波雷达是基于这样一个理念:即只有少数物体,称为原型歌曲,可以呈现给用户。每首原型歌曲通过 k-means 算法对集合进行聚类,并提取离聚类中心较近的歌曲。原型歌曲围绕着一个立场画在一个圆圈上。此外,Torrens等人提出不同的图形可视化视图及其相关功能,以允许用户更好地组织他们的个人音乐库,也便于以后的选择。Pampalk等人提出了一个带有音乐孤岛的系统,该系统无需手动分类就可以方便地探索音乐库。给定原始音频格式的音乐片段,他们根据心理声学模型估计他们感知到的声音相似性。随后,这些片段被组织在一个二维地图上,这样相似的片段就可以彼此靠近。

数据太多加滚动标题不动_音乐数据挖掘导引(四)相关推荐

  1. echart 时间滚动_echarts x,y轴数据太长自动滚动(每次只显示固定数量,定时滚动显示其它)...

    做项目时遇到了一个这样的echarts表,和正常的柱状图没啥区别,但是有个需求就是需要每次只显示10条数据,然后定时滚动显示其它,当滚动到最后一条数据,返回第一条一直循环,这个怎么实现查了好多的例子都 ...

  2. echarts 折线图数据太多会导致卡顿_重新定义数据图表,还有比这个更厉害的吗?...

    现在很多大厂 都 有各自的开源项目,有很多已经被用到生产环境中 ,今天分享一个我觉得很有用的开源项目. ECharts 百度开源的项目,一个使用 JavaScript 实现的开源可视化库,可以流畅的运 ...

  3. 动态加载子节点_简易数据分析 10 | Web Scraper 翻页—抓取「滚动加载」类型网页...

    这是简易数据分析系列的第 10 篇文章. 原文首发于博客园:简易数据分析 10. 友情提示:这一篇文章的内容较多,信息量比较大,希望大家学习的时候多看几遍. 我们在刷朋友圈刷微博的时候,总会强调一个『 ...

  4. java 滚动歌词_歌词数据解析、歌词滚动、歌词进度控制功能的实现(基于js-base64、lyric-parser、better-scroll),以vue项目为例...

    歌词数据解析.歌词滚动.歌词进度控制功能的实现(基于js-base64.lyric-parser.better-scroll) 1.需求分析 后台歌词接口返回的数据如下(base64字符串): W3R ...

  5. 数据科学家编程能力需要多好_我们不需要这么多的数据科学家

    数据科学家编程能力需要多好 I have held the title of data scientist in two industries. I've interviewed for more t ...

  6. 小程序scroll-view,滚动到最低_小程序滚动到底部

    小程序scroll-view,滚动到最低_小程序滚动到底部 小程序滚动条,滚到最底部解决方案1 小程序滚动到底部使用Scorll-view实现方案: scrill-view:组件要固定高度. scro ...

  7. 解决QT接受串口数据时数据更新不及时,串口数据太多导致程序界面崩溃,串口接收数据过快等问题

    1.问题背景 最近在使用上位机测试传感器接受数据是否正常,发现了很多问题,由于没有系统的学过Qt,用到什么库就学什么库,导致库中的函数很多不清晰,产生了标题中的一系列问题,经过不断的尝试,终于解决上述 ...

  8. 前端如何解决图片太多加载资源慢的问题

    前端如何解决图片太多加载资源慢的问题 使用图片服务器 使用图片懒加载 CSS sprites 使用图片服务器 把图片服务器与应用服务器分开,图片服务器采用独立域名 ,css.js和图片就可以并发请求了 ...

  9. 训练数据太少?过拟合?一文带你领略“数据增长魔法”(上)

    注意:本文是转载博客,如有侵权,请联系删除! 运行环境及其Paddle版本 [下面是我的主页链接] 来AI Studio互粉吧 https://aistudio.baidu.com/aistudio/ ...

最新文章

  1. ASP.net:添加.net(2.0C#)FCKeditor在线编辑器步骤
  2. linux常用命令笔记(持续更新)
  3. nfs配置 /etc/exports
  4. kernel和filter这两个概念在CNN中的区别以及卷积核与卷积层的关系
  5. .NET必知的EventCounters性能指标监视器
  6. java中链式调用_Java及Android中常用链式调用写法简单示例
  7. c语言三元组稀疏矩阵的转置实验报告,稀疏矩阵快速转置 数据结构实验报告
  8. js 获取相同name元素的属性值
  9. 属兔的人有什么缺点呢?
  10. 精通CSS:高级Web标准解决方案(第2版)--前言
  11. Acrobat Pro DC 教程,如何从 PDF 中提取页面?
  12. android获得cache路径,android取得当前程序File与Cache路径!
  13. EMQ压力测试及系统优化(单机11万并发连接)
  14. 《深入理解计算机系统》Lab2-Bomblab
  15. 基于python的证件照_不到20行实现Python代码即可制作精美证件照
  16. 内核参数tcp_tw_reuse=2,对高并发的服务有影响吗?
  17. 夏惊鸣:2017,战略转型的新路径
  18. Kotlin use函数的魔法
  19. 网易服务器维护中,网易:22日凌晨3点服务器维护,预计时间10小时
  20. Java实习生应具备哪些知识、能力?

热门文章

  1. Dynamics 365中的应用程序介绍
  2. VMware配置网络,主机互通,可上网
  3. 自动/持续部署Docker 的tomcat web项目(一)
  4. BUUCTF寒假刷题-Web
  5. flask处理http request的时候是多线程还是多进程?
  6. web全栈架构师所需技术栈_统一架构–一种构建全栈应用程序的简单方法
  7. summit_Chrome Dev Summit 2018的亮点
  8. 三大性质总结:原子性,有序性,可见性
  9. docker安装elasticsearch6.5.4
  10. 各种系统程序更新链接