前言

随着在线音乐商城及流媒体音乐服务的出现,数字音乐分发已经使得音乐触手可及。然而,面对突然出现的海量可收听内容,听众很容易面临信息过载的问题。因此,本次分享的主题音乐推荐系统,将为那些面临海量内容的用户提供一些引导。本文将重点介绍其中的两种音乐推荐系统:基于内容和上下文的音乐推荐。

01基于内容的音乐推荐

内容信息涵盖了任何可以用于描述音乐内容的信息,包括从音频信号中抽取的信息和外部信息源 ( 网络文档、音乐作品目录和标签 ) 提供的元数据。在本节中,我们将概述基于内容的音乐推荐算法,并根据采用的信息源对现有的算法进行分类。

1. 元数据信息

音乐元数据一般有以下几种形式:专家的人工标注 ( manual annotation )、来自协同标记服务的社会化标签 ( social tag )、应用文本检索技术从网络上自动化挖掘的标注 ( automatically mined from the Web )。尽管有研究显示这些元数据并不能比协同过滤技术取得更好的效果,但面对冷启动场景下,这些元数据可以作为协同过滤的补充或替代。

① 人工标注

人工标注包括可编辑的元数据 ( editorial metadata ),例如音乐曲风和子曲风、发行公司、发行的时间和地区、艺术家间关系、曲目、专辑以及任何相关的发行信息。此外,例如像节奏、情绪和乐器这样音乐属性的标注可以对音乐内容提供更详尽的描绘。

音乐专家或者成熟的爱好者社区提供了一些可编辑的元数据的在线数据库。这些数据库保证了数据的质量,但也因自身结构存在缺陷,比如坚持曲风分类 ( genretaxonomies )。MusicBrainz和Discogs提供大量免费的由社区整理的艺术家,唱片公司和发行信息。这些

深度学习核心技术精讲100篇(二十九)-基于内容和上下文的音乐推荐相关推荐

  1. 深度学习核心技术精讲100篇(十九)--GBDT(梯度提升树) 和 Resnet (残差网络)的原理

    残差 残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.在集成学习中可以通过基模型拟合残差,使得集成的模型变得更精确:在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强.这 ...

  2. 深度学习核心技术精讲100篇(十二)-DCGAN(对抗生成网络)算法应用及代码实现

    前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法.原来背后有一个极为有意思的算法思想--对抗生成. 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN ...

  3. 深度学习核心技术精讲100篇(十四)-一文带你看懂GPflow的前世今生

    什么是GPflow GPflow是一个高斯过程的工具包,接口部分由python实现,内部的部分计算则由Tensorflow实现. 主要特点有二个:一是使用变分推理作为近似方法,二是使用自动微分进行求导 ...

  4. 深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能

    前言 之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法--stacking.翻译成中文叫做模型堆叠,接下 ...

  5. 深度学习核心技术精讲100篇(十六)-搜索引擎Indri系列之如何建立索引 (Indexing)检索评价 (Evaluation)

    前言 在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter_file.这里的index_parameter_file是xml格式的参数文件 ...

  6. 深度学习核心技术精讲100篇(十五)-搜索引擎Indri系列之安装及使用

    前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发. 安装 下 ...

  7. 深度学习核心技术精讲100篇(十八)-巨量数据下美团是如何实现数据治理的?

    背景 大数据时代的到来,让越来越多的企业看到了数据资产的价值.将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台. 但这里要特别强调一下,如果在大 ...

  8. 深度学习核心技术精讲100篇(二十八)-由浅入深概览机器学习优化算法

    前言 学习算法一直以来是机器学习能根据数据学到知识的核心技术.而好的优化算法可以大大提高学习速度,加快算法的收敛速度和效果.本文从浅层模型到深度模型纵览监督学习中常用的优化算法,并指出了每一种优化算法 ...

  9. 深度学习核心技术精讲100篇(二十)-如何通过树模型实现梯度提升树(GBDT)+LR,随机森林(RandomForest) +LR

    前言 在讲如何通过树模型做特征工程之前,首先让我们回顾一下一个机器学习(除去深度学习项目部分)项目的大致流程: 从业务场景中抽象出问题--分类问题,回归问题,还是聚类问题等, 接下来是数据获取,数据清 ...

  10. 深度学习核心技术精讲100篇(二十四)-简单谈下深度学习在中文分词中的应用

    前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼"手快有,手慢无".不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为 ...

最新文章

  1. 用C语言写PHP扩展
  2. 浅谈单片机程序设计中的“分层思想”!
  3. 时间复杂度和空间复杂度3 - 数据结构和算法05
  4. android NDK 编译hellojni 例子文件
  5. 45. ExtJS ComboBox 下拉列表详细用法
  6. PAT乙级(1024 科学计数法)
  7. android lru进程队列,Android缓存机制——LruCache
  8. MSSQL - SQL Server2008附加数据库失败 错误号:5120
  9. 新手学vue还是react?
  10. 接口自动化持续集成实战
  11. jPList – 实现灵活排序和分页功能的 jQuery 插件
  12. Silverlight 中的通信安全访问策略
  13. 活动报名 | 前端攻城狮该怎样跳脱“围城”的焦虑
  14. 来一杯java_初级java笔试题
  15. 在某个文件夹中打开 cmd黑窗口
  16. ICG博弈_威佐夫博弈(Wythoff Game)及证明
  17. tornado、flask、c++zmq-req-rep记录
  18. 获取emf图片格式的方法
  19. 数据库应用——MySQL+ATLAS+MMM高可用集群
  20. 【杂览】01:缘分美丽的邂逅

热门文章

  1. PHP几个快速读取大文件例子
  2. 【javascript基础】8、闭包
  3. qt数据库有效插件为空的情况
  4. Time包详解二-timer和ticket.html
  5. PAT甲级1041 Be Unique :[C++题解]模拟、哈希表
  6. 创建mat二值图 matlab,OpenCV学习之路(二)——Mat对象
  7. 电脑服务器不稳定怎么办,网速不稳定怎么办? 网速不稳定的原因与解决办法-电脑教程...
  8. python 把一个列表分成等长的多个列表
  9. php不是预定义超全局变量,五、PHP知识核心 预定义变量(超全局变量/数组)
  10. Android中的相对布局