题记:推荐引擎根据的分类根据数据源,分为基于人口统计学的(用户年龄或性别相同判定为相似用户)、基于内容的(物品具有相同关键词和Tag,没有考虑人为因素),以及基于协同过滤的推荐(发现物品,内容或用户的相关性推荐,分为三个子类,下文阐述);
       根据其建立方式,分为基于物品和用户本身的(用户-物品二维矩阵描述用户喜好,聚类算法)、基于关联规则的(The Apriori algorithm算法是一种最有影响的挖掘布尔关联规则频繁项集的算法)、以及基于模型的推荐(机器学习,所谓机器学习,即让计算机像人脑一样持续学习,是人工智能领域内的一个子领域)。

推荐算法: 潜在因子(Latent Factor)算法。
       应用领域:“网易云音乐歌单个性化推荐”、“豆瓣电台音乐推荐”等。
       关键因素: 评分矩阵的UV分解的理解。

算法思想
       每个用户(user)都有自己的偏好,比如A喜欢带有小清新的、吉他伴奏的、王菲等元素(latent factor),如果一首歌(item)带有这些元素,那么就将这首歌推荐给该用户,也就是用元素去连接用户和音乐。每个人对不同的元素偏好不同,而每首歌包含的元素也不一样。我们希望能找到这样两个矩阵:

实际上你可以理解为latent factor是对用户属性和音乐属性的双重降维(相当于把高维的用户\音乐属性降维到一个k维的隐空间进行表达),将用户属性\音乐属性都使用一个k维的向量表示,最终预测出某一用户对某一音乐的评分即为这两个向量的内积。
一,,表示不同的用户对于不用元素的偏好程度,1代表很喜欢,0代表不喜欢。比如下面这样:

二,潜在因子-音乐矩阵P,表示每种音乐含有各种元素的成分,比如下表中,音乐A是一个偏小清新的音乐,含有小清新这个Latent Factor的成分是0.9,重口味的成分是0.1,优雅的成分是0.2……

       利用这两个矩阵,我们能得出张三对音乐A的喜欢程度是:张三对小清新的偏好音乐A含有小清新的成分+对重口味的偏好音乐A含有重口味的成分+对优雅的偏好*音乐A含有优雅的成分+……


       即:0.6*0.9+0.8*0.1+0.1*0.2+0.1*0.4+0.7*0=0.69
       每个用户对每首歌都这样计算可以得到不同用户对不同歌曲的评分矩阵。(注,这里的破浪线表示的是估计的评分,接下来我们还会用到不带波浪线的R表示实际的评分):

     因此我们队张三推荐四首歌中得分最高的B,对李四推荐得分最高的C,王五推荐B。
如果用矩阵表示即为:
                                                                  
       下面问题来了,这个潜在因子(latent factor)是怎么得到的呢?
    由于面对海量的让用户自己给音乐分类并告诉我们自己的偏好系数显然是不现实的,事实上我们能获得的数据只有用户行为数据。我们沿用的量化标准:单曲循环=5, 分享=4, 收藏=3, 主动播放=2 , 听完=1, 跳过=-2 , 拉黑=-5,在分析时能获得的实际评分矩阵R,也就是输入矩阵大概是这个样子:

事实上这是个非常非常稀疏的矩阵,因为大部分用户只听过全部音乐中很少一部分。如何利用这个矩阵去找潜在因子呢?这里主要应用到的是矩阵的UV分解。也就是将上面的评分矩阵分解为两个低维度的矩阵,用Q和P两个矩阵的乘积去估计实际的评分矩阵,而且我们希望估计的评分矩阵

       对于一个大型的评分矩阵X(m*n,m为用户数,n为音乐数量,矩阵中每一项便是这一用户对这一音乐的评分,显然这会是一个非常稀疏的矩阵),我们希望由这一评分矩阵得到两个分解后的矩阵U(m*k,用户属性在隐空间内的表示)与V(n*k,音乐属性在隐空间内的表示),使得U乘以transpose(V)能够尽可能地逼近矩阵X,即由抽取的用户属性\音乐属性,我们可以“尽可能地还原出”原本输入的大型评分矩阵X——这一分解便被称为”UV分解”。
       和实际的评分矩阵不要相差太多,也就是求解下面的目标函数:
                                                 
       这里涉及到最优化理论,在实际应用中,往往还要在后面加上2范数的罚项,然后利用梯度下降法就可以求得这P,Q两个矩阵的估计值。这里我们就不展开说了。例如我们上面给出的那个例子可以分解成为这样两个矩阵:

       这两个矩阵相乘就可以得到估计的得分矩阵:

       将用户已经听过的音乐剔除后,选择分数最高音乐的推荐给用户即可(红体字)。

参考文献
http://www.zhihu.com/question/26743347/answer/34714804

推荐算法(一)——音乐歌单智能推荐相关推荐

  1. 基于音乐/电影/图书的协同过滤推荐算法代码实现(基于用户推荐、基于项目推荐、基于SlopeOne算法推荐、基于SVD算法推荐、混合加权推荐)

    基于音乐/电影/图书的协同过滤推荐算法代码实现(基于用户推荐.基于项目推荐.基于SlopeOne算法推荐.基于SVD算法推荐.加权混合推荐) 一.开发工具及使用技术 MyEclipse10.jdk1. ...

  2. 在线音乐推荐网 Python+Django+Mysql开发技术 基于用户、物品的协同过滤推荐算法 个性化音乐推荐系统 音乐网站+协同过滤推荐算法 机器学习、分布式大数据、人工智能开发

    在线音乐推荐网 Python+Django+Mysql开发技术 基于用户.物品的协同过滤推荐算法 个性化音乐推荐系统 音乐网站+协同过滤推荐算法 机器学习.分布式大数据.人工智能开发 MusicRec ...

  3. 推荐算法(2):基于内容的推荐

    推荐算法(1):协同过滤总结 推荐算法(2):基于内容的推荐 推荐算法(3):利用用户标签数据 推荐算法(4)利用上下文信息 推荐算法(5)利用社交网络数据 推荐算法(6) 实例 推荐算法(7)缺失的 ...

  4. 在线新闻推荐网 Python+Django+Mysql开发技术 基于用户、物品的协同过滤推荐算法 个性化新闻推荐系统 协同过滤推荐算法在新闻网站中的运用 个性化推荐算法、机器学习、分布式大数据、人工智

    在线新闻推荐网 Python+Django+Mysql开发技术 基于用户.物品的协同过滤推荐算法 个性化新闻推荐系统 协同过滤推荐算法在新闻网站中的运用 个性化推荐算法.机器学习.分布式大数据.人工智 ...

  5. Python+Django+Mysql简单在线课程推荐系统 基于用户、项目、内容的协同过滤推荐算法 SimpleOnlineCourseCFRSPyth python实现协同过滤推荐算法实现源代码下载

    Python+Django+Mysql简单在线课程推荐系统 基于用户.项目.内容的协同过滤推荐算法 SimpleOnlineCourseCFRSPyth python实现协同过滤推荐算法实现源代码下载 ...

  6. Python+Django+Mysql个性化二手车推荐系统 汽车推荐系统 基于用户、项目、内容的协同过滤推荐算法 WebCarCFRSPython python实现协同过滤推荐算法实现源代码下载

    Python+Django+Mysql个性化二手车推荐系统 汽车推荐系统 基于用户.项目.内容的协同过滤推荐算法 WebCarCFRSPython python实现协同过滤推荐算法实现源代码下载 一. ...

  7. 个性化推荐算法实战第01章个性化推荐算法综述

    文章目录 个性化推荐算法实战第01章个性化推荐算法综述 1.什么是推荐系统? 2.个性化推荐算法在系统中所起到的作用 3.如何衡量个性化推荐算法在产品中起到的作用 4.推荐算法介绍 5.评估指标: 个 ...

  8. 【干货】网易云音乐歌单的推荐算法解析

    网易云音乐的歌单推荐算法是怎样的呢?最近有很多人关心这个问题.调查了一些网易云音乐的重度患者,小咖带你来看一些路过大神的精辟分析. 分析一: "商品推荐"系统的算法( Collab ...

  9. 网易云音乐歌单的推荐算法

    这里我想给大家介绍另外一种推荐系统,这种算法叫做潜在因子(Latent Factor)算法.这种算法是在NetFlix(没错,就是用大数据捧火<纸牌屋>的那家公司)的推荐算法竞赛中获奖的算 ...

最新文章

  1. java MD5 加密
  2. linux服务器ntp客户端配置【转】
  3. windows资源管理器进行ftp登录下载文件报“当前的安全设置不允许从该位置下载文件”...
  4. (二)Python 学习第二天--爬5068动漫图库小案例
  5. NSLog中格式符列表
  6. ubuntu下使用UVC摄像头
  7. Springboot 整合 swagger
  8. 英特尔再爆重大芯片漏洞,苹果谷歌微软相继中招!
  9. ASP.NET 2.0 中的SqlCacheDependency特性
  10. 基于ARM-LINUX的温度传感器驱动-DS18B20
  11. php UTF8 转字节数组,后使用 MD5 计算摘要
  12. [软件工程] 可行性研究
  13. 计算机显示不出桌面的文件夹,win10电脑保存文件路径不显示桌面怎么办?
  14. plc程序调试的顺序
  15. 网吧游戏更新服务器--------各种网卡参数设置
  16. 冇内容管理系统分析-js中关于array的slice和sort方法(转自JavaEye)
  17. Ubuntu虚拟机识别不了SD卡的解决办法
  18. MyBatis 学习(七):深入 Mapper XML映射文件
  19. Word无法打开该文件,因为文件格式与文件扩展名不匹配
  20. Deepin笔记本WIFI速度过慢问题

热门文章

  1. 通俗地解释下密码学中的归约证明
  2. HTML5-VScode-常用标签的样式以及复合写法
  3. PAT 甲级 1108 Finding Average (20 分)
  4. angularjs2学习教程
  5. 已知某公众号的微信号怎样获取该公众号的二维码
  6. 基于ZStack3.0.1(CC2530)和ST7735S的HAL_LCD驱动替换(一)
  7. 郑州计算机c语言培训机构,c语言入门学习选郑州哪家计算机专业学校
  8. 一文读懂GPU服务器
  9. 8卡gpu服务器是8个芯片,北京8卡GPU服务器厂商
  10. 米狗族 Android平台Qt开发入门教程