文章转自:
作者:知乎用户
链接:https://www.zhihu.com/question/26743347/answer/34714804

潜在因子(LatentFactor)算法。
这种算法是在NetFlix(没错,就是用大数据捧火《纸牌屋》的那家公司)的推荐算法竞赛中获奖的算法,最早被应用于电影推荐中。这种算法在实际应用中比现在排名第一的 @邰原朗 所介绍的算法误差(RMSE)会小不少,效率更高。我下面仅利用基础的矩阵知识来介绍下这种算法。这种算法的思想是这样:每个用户(user)都有自己的偏好,比如A喜欢带有小清新的、吉他伴奏的、王菲等元素(latent factor),如果一首歌(item)带有这些元素,那么就将这首歌推荐给该用户,也就是用元素去连接用户和音乐。每个人对不同的元素偏好不同,而每首歌包含的元素也不一样。我们希望能找到这样两个矩阵:
一,用户-潜在因子矩阵Q
表示不同的用户对于不用元素的偏好程度,1代表很喜欢,0代表不喜欢。比如下面这样:

二,潜在因子-音乐矩阵P
表示每种音乐含有各种元素的成分,比如下表中,音乐A是一个偏小清新的音乐,含有小清新这个Latent Factor的成分是0.9,重口味的成分是0.1,优雅的成分是0.2……

利用这两个矩阵,我们能得出张三对音乐A的喜欢程度是:张三对小清新的偏好音乐A含有小清新的成分+对重口味的偏好音乐A含有重口味的成分+对优雅的偏好*音乐A含有优雅的成分+……
即:0.60.9+0.80.1+0.10.2+0.10.4+0.7*0=0.69每个用户对每首歌都这样计算可以得到不同用户对不同歌曲的评分矩阵。(注,这里的波浪线表示的是估计的评分,接下来我们还会用到不带波浪线的R表示实际的评分):

因此我们队张三推荐四首歌中得分最高的B,对李四推荐得分最高的C,王五推荐B。如果用矩阵表示即为:

下面问题来了,这个潜在因子(latent factor)是怎么得到的呢?由于面对海量的让用户自己给音乐分类并告诉我们自己的偏好系数显然是不现实的,事实上我们能获得的数据只有用户行为数据。我们沿用 @邰原朗的量化标准:单曲循环=5, 分享=4, 收藏=3, 主动播放=2 , 听完=1, 跳过=-2 , 拉黑=-5,在分析时能获得的实际评分矩阵R,也就是输入矩阵大概是这个样子:
事实上这是个非常非常稀疏的矩阵,因为大部分用户只听过全部音乐中很少一部分。如何利用这个矩阵去找潜在因子呢?这里主要应用到的是矩阵的UV分解。也就是将上面的评分矩阵分解为两个低维度的矩阵,用Q和P两个矩阵的乘积去估计实际的评分矩阵,而且我们希望估计的评分矩阵

和实际的评分矩阵不要相差太多,也就是求解下面的目标函数:这里涉及到最优化理论,在实际应用中,往往还要在后面加上2范数的罚项,然后利用梯度下降法就可以求得这P,Q两个矩阵的估计值。这里我们就不展开说了。例如我们上面给出的那个例子可以分解成为这样两个矩阵:

这两个矩阵相乘就可以得到估计的得分矩阵:

将用户已经听过的音乐剔除后,选择分数最高音乐的推荐给用户即可(红体字)。在这个例子里面用户7和用户8有强的相似性:

从推荐的结果来看,正好推荐的是对方评分较高的音乐:

推荐算法——潜在因子(LatentFactor)算法相关推荐

  1. 推荐算法之潜在因子(Latent Factor)算法

    缘起: 在阅读Facebook论文DLRM时,涉及到了潜在因子(LF)算法,通过查询阅读有了初步了解:通过对稀疏矩阵(稀疏的原因是有未知值)R进行uv分解,得到u.v矩阵,再通过u\v中向量乘积估计R ...

  2. 推荐常用的排序学习算法——BPR(贝叶斯个性化排序)

    文章目录 1. 排序学习 1.1 优势 1.2 排序学习在推荐领域的作用 1.3 排序学习设计思路 1.3.1 单点法(Pointwise) 1.3.2 配对法(Pairwise) 1.3.3 列表法 ...

  3. 经典算法书籍推荐以及算法书排行【算法四库全书】

    经典算法书籍推荐以及算法书排行[算法四库全书] 作者:霞落满天   https://linuxstyle.blog.csdn.net/    https://blog.csdn.net/21aspne ...

  4. 推荐算法(二)--算法总结

    转自:https://www.jianshu.com/p/1464eab67711 推荐算法分类 1 个性化推荐 1.1 基于用户推荐(Demographic-based Recommendation ...

  5. 计算机 算法 ei 论文,计算机算法论文参考文献推荐 计算机算法专著类参考文献哪里找...

    汇总了[100个]与计算机算法相关论文参考文献,为广大毕业生和职称者推荐计算机算法论文参考文献推荐,解决在校大学生不知个计算机算法专著类参考文献哪里找等相关问题! 一.计算机算法论文参考文献范文 [1 ...

  6. 多任务进化优化算法(一)——多因子进化算法(MFEA)

    闲话:由于前段时间一直忙着写论文,所以很久没有更新了,之前的多目标优化系列我也不打算更新了,因为田野老师的PlatEMO真的很好用,代码也很规范,刚入门的同学们,我很建议你们去看看PlatEMO的源代 ...

  7. 推荐算法和机器学习系列 - 协同过滤推荐算法和余弦相似性算法

    协同过滤算法 协同过滤(CF)推荐算法通过在用户活动中寻找特定模式来为用户产生有效推荐.它依赖于系统中用户的惯用数据,例如通过用户对其阅读过书籍的评价可以推断出用户的阅读偏好.这种算法的核心思想就是: ...

  8. 推荐业务多目标建模算法介绍:MMOE、OMOE、Shared-Bottom

    在推荐业务中经常有"既要.也要.还要"的场景,比如做视频推荐业务的时候既要提升用户对于视频的点击率,也希望同时提升用户观看视频的时长.面对这样的诉求,通常需要在推荐系统中使用多目标 ...

  9. 论文研读-多因子进化算法中的自适应知识迁移MFEA-AKT

    论文研读-多因子进化算法中的自适应知识迁移MFEA-AKT Toward Adaptive Knowledge Transfer in Multifactorial Evolutionary Comp ...

最新文章

  1. 「摸鱼」神器来了,Python 实现人脸监测制作神器
  2. iOS系类教程之用instruments来检验你的app
  3. 自定义View之onMeasure()
  4. directx最终用户运行时_运维定位服务故障时,前5分钟都在忙啥?
  5. python idle 中文_Python IDLE 中文乱码问题
  6. Nginx的五大应用场景详解
  7. SpringBoot 2.1.5(36)---整合Mybatis
  8. 热点和秒杀来临前要做的5件事
  9. Web Components系列(七) ——自定义组件的生命周期
  10. unity项目对音效的优化处理
  11. 由于dns服务为启动导致的GI集群启动故障
  12. win10开始菜单应用图标丢失
  13. win11精简中文版 兼容ISO
  14. 计算机网络计算下一跳
  15. 如何让你的app在后台被干掉后优雅的启动。
  16. 最近频繁用到正则表达式,恶补一下,高手略过(零宽断言)
  17. python过去电脑网关不可用怎么办_电脑默认网关不可用怎么解决 Win7系统默认网关不可用终极解决方法...
  18. 软件测试零基础入门好学吗?
  19. c语言程序设计 大学考试题库,广东工业大学《C语言程序设计》考试复习重点题库.pdf...
  20. Linux比较常用的终端快捷键使用

热门文章

  1. react生命周期写法
  2. 模拟卷Leetcode【普通】537. 复数乘法
  3. 2021.11.11
  4. Thread wait和sleep的区别
  5. csgo为什么显示vac无法连接服务器,《csgo》vac无法验证游戏会话怎么解决 vac无法验证游戏会话解决方法介绍...
  6. 高中数学必修二平面解析几何之两直线的位置关系(归纳与整理)
  7. 当网红本人成为网红毒瘤:Vtuber的纸片人模式能够破解困局吗?
  8. 计算点在线上的投影坐标
  9. Android MVP(三)内存泄漏分析与动态代理
  10. 用计算机语言编写累加程序,用汇编语言实现如下程序:进行自然数相加(1+2+3... 汇编语言 编写程序实现自然数1到100的累加。要求用......