YouTube 视频推荐系统为什么那么强?看了这篇文章你就知道了作为全球主流的视频平台,谷歌旗下视频网站 YouTube 的成功离不开精准的视频推荐系统。YouTube 的推荐系统有何亮点?他们解决了哪些问题?在一篇 RecSys 2019 论文中,谷歌研究者对这些问题做出了解释。来自荷兰的一位数据科学家对论文的内容进行了总结。

论文地址:https://dl.acm.org/citation.cfm?id=3346997

Youtube 的推荐系统解决了什么问题?

在 Youtube 上观看视频时,页面上会展示用户可能喜欢的视频推荐列表。该论文聚焦于以下两大目标:

1)需要优化不用的目标。他们没有定义确切的目标函数,而是将目标函数分为「参与度」(点击量、花的时间)目标和「满意度」(点赞量、踩的量)目标;

2)减少系统引入的「选择偏见」。用户通常更倾向于点开排在第一位的推荐视频,尽管后面的视频可能参与度、满意度更高。如何高效地减少这些偏见是一个亟待解决的问题。

用什么方法解决?

论文中介绍的模型着眼于两个主要的目标。他们用到了一个宽度 & 深度模型框架 。宽度模型拥有强大的记忆能力,深度神经网络拥有泛化能力,宽度 & 深度模型则综合了二者的优点。宽度 & 深度模型会为每一个定义的(参与度和满意度)目标生成一个预测。这些目标函数可以分为二分类问题(是否喜欢某个视频)和回归问题(为视频评级)。这一模型之上还有一个单独的排序模型。这只是一个输出向量的加权组合,它们是不同的预测目标。这些权重是手动调整的,以实现不同目标的最佳性能。此外,研究者还提出了结对、列表等先进的方法,以提升模型的性能,但由于计算时间的增加,这些方法没有被应用到生产中。

在宽度 & 深度模型的深层部分,研究者利用了一个多任务学习模型 MMoE。现有视频的特征(内容、标题、话题、上传时间等)以及正在观看的用户的信息(时间、用户配置文件等)被用作输入。MMoE 模型可以在不同的目标之间高效地共享权重。共享的底层(shared bottom layer)被分为多个专家层,用于预测不同的目标。每个目标函数都有一个门函数(gate function)。这个门函数是一个 softmax 函数,接收来自原始共享层和不同专家层的输入。该 softmax 函数将决定哪些专家层对于不同的目标函数是重要的。如下图 3 所示,不同的专家层对于不同目标的重要程度存在差别。如果与 shared-bottom 架构相比,不同的目标相关度更低,则 MMoE 模型中的训练受到的影响更小。

该模型的宽度部分致力于解决系统中由视频位置带来的选择偏见问题。研究者将该部分称为「浅塔」(shallow tower),它可以是一种简单的线性模型,使用简单的特征,如视频被点击时所处的位置、用户观看视频使用的设备等。「浅塔」的输出与 MMoE 模型的输出相结合,这也是宽度 & 深度模型架构的关键组成部分。

如此一来,模型将更加关注视频的位置。在训练过程中,dropout 率被定为 10%,以防止位置特征在模型中变得过于重要。如果不用宽度 & 深度模型,而是将位置添加为一个特征,模型可能根本就不会注意到这个特征。

结果

该论文的结果表明,用 MMoE 替换 shared-bottom 层可以在参与度(观看推荐视频花费的时间)和满意度(调查反馈)两个目标中提升模型的性能。增加 MMoE 中的专家层数量和乘法的数量可以进一步提升模型的性能。但由于计算上的限制,现实部署中无法实现这一点。

进一步的研究结果表明,参与度度量可以通过使用「浅塔」降低选择偏见来加以改进。与只在 MMoE 模型中添加特征相比,这是一项显著的改进。

有趣之处

  • 尽管 Google 拥有强大的计算基础设施,但在训练和成本方面仍然非常谨慎;
  • 通过使用深度 & 宽度模型,你可以在设计网络时预定义一些重要特征;
  • 当你需要多目标模型时,MMoE 模型会非常有效;
  • 即使具有强大而复杂的模型架构,大家仍在手动调整最后一层的权重,从而根据不同的客观预测确定实际排名。

原文链接:https://medium.com/vantageai/how-youtube-is-recommending-your-next-video-7e5f1a6bd6d9

YouTube视频推荐系统总结相关推荐

  1. 推荐系统——(论文阅读笔记)YouTube的视频推荐系统

    <The YouTube video recommendation system>是一篇详细介绍YouTube视频推荐的论文,在整个系统中没有复杂的算法,使用了一些简单有效的策略,这也符合 ...

  2. Google最新论文:Youtube视频推荐如何做多目标排序

    作者 | 深度传送门 来源 | 深度传送门(ID:deep_deliver) 导读:本文是"深度推荐系统"专栏的第十五篇文章,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界 ...

  3. Youtube视频推荐算法:从10页论文到4页论文的变迁

    Youtube视频推荐算法:从10页论文到4页论文的变迁 所以说豆瓣广播是个好东西,长久以来已经怠于主动关注paper的我,每次都能通过我那些专业敬业的友邻们发现有意思的文章或话题,知识因分享而伟大! ...

  4. 百度短视频推荐系统的目标设计

    导读:短视频产品最近两年蓬勃发展,百度旗下的短视频品牌-好看视频,人均使用时长70分钟,短视频播放量已超30亿,从推荐系统的角度考虑,如何设计一个推荐系统的目标,以及短视频迭代过程中沉淀的思考. 全文 ...

  5. 如何使YouTube视频连续循环播放

    Should you need a YouTube video on a continuous loop, a few methods can help you keep repeating a vi ...

  6. 在Python中使用Seaborn和WordCloud可视化YouTube视频

    I am an avid Youtube user and love watching videos on it in my free time. I decided to do some explo ...

  7. hive尚硅谷实战案例统计youtube视频热度

    hive视频热度统计案例 文章目录 hive视频热度统计案例 背景及需求描述 项目的完成 1. 数据清洗 (1) maven依赖 (2)ETLUtils-处理具体的数据清洗逻辑 (3)ETLMappe ...

  8. 开发中国最好的视频推荐系统

    最近把国内主要的视频网站翻了一遍,发现这些网站的视频推荐系统,都还做得不够好 很多甚至没有真正用心做,只是有一个能用的系统而已,完全没有质量可言 这次我们新开发的系统,一定要能有突破

  9. 如何设置计划任务程序 每6小时运行一次_如何用 Python 打造一个全自动赚钱的 YouTube 视频发布系统并月入过万(被动收益)

    前言 这篇文章将告诉你如何通过Python打造一台全自动发布YouTube视频并专区美元收益的系统. 目前我自己用的这套系统已基本稳定运行了三个月.其中一个YouTube频道从零起步到达到最低开通获利 ...

  10. 专注年轻一代,基于E-MapReduce梨视频推荐系统

    梨视频简介 梨视频是中国领先的资讯类短视频生产者,由资深媒体背景的专业团队和遍布全球的拍客网络共同创造,专注为年青一代提供适合移动端观看和分享的短视频产品. 梨视频是跨平台的.开放的新媒体公司,其视频 ...

最新文章

  1. c语言r5够用吗,泡菜说 普通人有必要买R5吗?
  2. Zookeeper (一)集群简单搭建
  3. QQ采用什么传输协议?
  4. endnote教程:参考文献出现{zhang,2020,#365} 修改方法
  5. 40.QT-QPropertyAnimationdong和QParallelAnimationGroup动画实现
  6. tomcat提高图片服务器性能,Tomcat性能调优(windows)
  7. github可以传java吗_如何在github上传本地项目代码(新手使用)----亲测使用
  8. php编写计算程序,PHP编写的小应用——计算器
  9. Blog主场转至51CTO.com
  10. log4j 配置文件参数说明
  11. OC中ACES流程色差问题解决方法!
  12. wmf和emf格式的图片有什么区别? JPG图片如何转换WMF文件?
  13. 如何制作优秀的PPT
  14. no tests ran in 0.03 seconds
  15. ThinkPad笔记本电脑网络重置之后wifi没有了
  16. Java项目服务器cpu占用过高怎么办?
  17. python io多路复用_【python】-- IO多路复用(select、poll、epoll)介绍及实现
  18. 详解DNS服务、DNS解析、DNS劫持和污染
  19. 【算法思想】数学归纳法在算法题中的应用(含例题举例)
  20. TOOLFK工具-在线汉字/字母/人民币/简繁体转换工具

热门文章

  1. 网页内容变化实时监控提醒(多个复杂的监控条件)
  2. tomcat出现404的原因_tomcat访问项目报404是什么原因?
  3. [python小工具]加减法出题器
  4. 2019你会被裁员吗?
  5. JPA学习(基于hibernate)
  6. THINKPHP官方推荐第三方插件库
  7. 电桥的原理,及非线性误差
  8. 微信小程序强制更新版本
  9. xpub ypub zpub ---- btc address
  10. opencv (五十四)ORB特征点