本文的前提:

(1)基于用户的的行为进行推荐

(2)本文只关注注册用户,只对注册用户进行推荐

(3)数据量级:Youtube每天 百万级别的视频 ,百万级别的用户,总的播放数量超过10亿

挑战:

(1)用户上载的视频经常没有元数据或元数据很少(视频的量级和用户的量级差不多)

(2)很多youtube视频时间很多(小于10分钟)User interactionsare thus relatively short and noisy.用户的交互相对就短有时会成为干扰数据。和netflix这样的网站不同,电影租借能很明确表达用户的兴趣

(3)In addition, many ofthe interesting videos on YouTube have a short life cycle going from upload toviral in the order of days requiring constant freshness of recommendation.很多视频在火之前,因为推荐需要新鲜性,这些推荐视频生命周期短

目标:

(1)匹配用户兴趣和目标视频的内容

(2)推荐的结果必须经常更新,以反应用户最近在网址上的活动(反映用户的兴趣的变化)

(3)推荐的可解释性

系统设计:

(1)总的思想是:推荐用户浏览过的videos相似的videos,以浏览过的videos作为产生推荐的种子(seed)

(2)用到的数据:因为video的元数据不完整或不正确或缺失给推荐带来了不准性和难度,所以本算法就不用这些数据。而是使用用户的浏览行为数据

(3)相似/相关的video(related video):

  • In this context, we define similar videos as those that a user is likely to watch after having watched the given seed video v.相似性定义为一起被观看的概率,概率越高,相似性或这相关度越高。
  • video vi 的相似性 video集和:Ri
  • In order to compute the mapping we make use of a well-known technique known as association rule mining [1] or co-visitation counts.用关联规则挖掘计算
  • Denoting this co-visitation count by cij , we define therelatedness score of video vj to base video vi as: 
  • global popularity,或者可以定义为其他的全局正则化项
  • We then pick the set of related videos Ri for a given seedvideo vi as the top N candidate videos ranked by their scores
    r(vi, vj ). 挑选得分最高的n部vedio作为candidate
  • For each pair of videos (vi, vj ),
    there is an edge eij from vi to vj iff vj 2 Ri, with the weight
    of this edge given by ,可以看成是图或者是矩阵的形式

(4)推荐产生

  • S:用户显示表达感兴趣的视频集合,Ri:video相关联/相似的视频集和
  • 用C1作为推荐 但是有一个问题:推荐的视频比较窄,推荐的视频和S会非常相似,推荐的相似性必须保证推荐的多样性,可能对用户来说是全新的(不同主题、不同题材的)视频比较少。因此为了解决该问题,可以把C1作为seed产生种子,产生C2,一次类推产生Cn。这样可以保证推荐的多样性。其中
  • 最终的推荐candidate为(差集,看过的不推荐):
  • 推荐的candidate的排序:三个影响因素:video quality,user specificity,diversification.
(5)推荐评价
  • 推荐指标:CTR点击率
  • 用其他两种方法和推荐算法做对比:把具有最多浏览次数的视频作为推荐,把用最多户显示标为感兴趣的视频作为推荐,用户评分最高的视频作为推荐最终的最简结果比较如图所示
  • 从上图可以显著的看出推荐算法的点击率最高,因此推荐算法是有效的
声明:本文的所有内容来自以下文章
Davidson J, Liebald B, Liu J, et al. The YouTube video recommendation system[C]//Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010: 293-296.


一篇关于youtube推荐算法的分享-基于用户行为的视频推荐相关推荐

  1. 推荐算法概述(基于用户的协同过滤算法、基于物品的协同过滤算法、基于内容的推荐算法)

    "无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程." 目前推 ...

  2. 基于内容的推荐java代码_三种推荐算法简介:基于用户的协同过滤、基于物品的协同过滤、基于内容的推荐...

    1.推荐算法 1.1.协同过滤 协同过滤是目前应用最广泛的推荐算法,它仅仅通过了解用户与物品之间的关系进行推荐,而根本不会考虑到物品本身的属性. 可分成两类: 1.基于用户(user-based)的协 ...

  3. Java+Jsp+Mysql实现简单在线图书推荐系统 个性化图书推荐系 java实现基于用户的协同过滤推荐算法 源代码下载 算法实现 Spring+Struts+Hibernate(SSH)开发框架

    Java+Jsp+Mysql实现简单在线图书推荐系统 个性化图书推荐系统(基于用户的协同过滤推荐算法) 一.项目简介 1.开发工具和实现技术 MyEclipse10,jdk1.7,mysql5.5,t ...

  4. 基于用户行为分析的推荐算法

    文章目录 基于用户行为分析的推荐算法 用户行为数据简介 用户行为分析 用户活跃度和物品流行度的分布 用户活跃度和物品流行度的关系 实验设计和算法测评 数据集 实验设计 评测指标 基于领域的算法 基于用 ...

  5. 短视频推荐算法过程分享,论如何针对推荐算法来优化短视频内容

    短视频推荐算法过程分享,论如何针对推荐算法来优化短视频内容 相信做短视频的小伙伴一定知道"短视频推荐算法",简单理解就是短视频平台都自有一套推荐机制,决定我们发布的短视频是否可以获 ...

  6. 直播 | 电商智能推荐算法技术分享

    随着信息过载时代的到来,人们逐渐习惯于从主动获取信息变成了被动接受信息,而基于智能推荐算法的内容.商品.服务分发系统,也已经逐步成为信息平台.电商等几乎所有互联网业务的标配,逐步给各个业务场景带来巨大 ...

  7. 协同过滤算法_基于用户的协同过滤推荐算法原理和实现

    (给算法爱好者加星标,修炼编程内功) 来源:Create Chen's Blog https://www.cnblogs.com/technology/p/4467895.html 在推荐系统众多方法 ...

  8. 推荐算法(2):基于内容的推荐

    推荐算法(1):协同过滤总结 推荐算法(2):基于内容的推荐 推荐算法(3):利用用户标签数据 推荐算法(4)利用上下文信息 推荐算法(5)利用社交网络数据 推荐算法(6) 实例 推荐算法(7)缺失的 ...

  9. python协同过滤可以预测吗_基于用户的协同过滤推荐算法原理-附python代码实现...

    在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单.该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤.一直到2000年,该算法都是 ...

最新文章

  1. Spring Data JPA例子[基于Spring Boot、Mysql]
  2. 怎样反制红队“硬件“攻击
  3. 【机器视觉】 dev_open_file_dialog算子
  4. 小师妹学JVM之:java的字节码byte code简介
  5. 交易机项目工作日志--2013-01-30
  6. 在家办公怎么弄?华为云DevCloud宝典一看就懂——迭代开发篇
  7. 手动挖第一桶金,10日赚3十万元
  8. AcWing135.最大子序和(单调队列DP)
  9. java idle 机制_深入springboot原理——一步步分析springboot启动机制(starter机制)...
  10. 二叉树的深度(剑指 Offer 55 - I)
  11. 如何ajax上传文件,如何实现Ajax文件上传功能
  12. DS18B20温度传感器使用详解
  13. ExpandableListView 的使用
  14. dp和px,那些不得不吐槽的故事——Android平台图
  15. maven项目关系依赖
  16. 电脑怎样查看密码?100%简单实用的方法
  17. 如何写一个好的缺陷(Defect)报告
  18. 妙用AccessibilityService黑科技实现微信自动加好友拉人进群聊
  19. 写给产品经理的第4封信:关于产品经理的十万个为什么?你为什么要做产品经理?
  20. 【bzoj 3238】差异

热门文章

  1. linux没有lsof命令
  2. 不用安装的虚拟光驱_无需任何第三方软件重新安装Windows10
  3. PaddleOCR使用笔记-文字方向分类训练、评估、推理
  4. 毕业设计-基于机器视觉的行人车辆跟踪出入双向检测计数
  5. 贝叶斯算法(关于先验概率和后验概率的理解)
  6. 面试笔记之计算机网络(1.3万字)
  7. H5和CSS3新特性总结
  8. 常见分布式文件存储介绍、选型比较、以及架构设计
  9. 在html中如何设置静音,如何用JS静音页面中的所有声音?
  10. wasm 视频解码渲染实现