推荐系统入门必读的11片经典论文,包含了召回、排序、模型融合相关技术,本篇文章列举出了每篇论文的摘要,最后附上了下载链接。

01. Cheng et al. - 2016 - Wide & Deep Learning for Recommender Systems

摘要: 具有非线性特征变换的广义线性模型广泛应用于具有稀疏输入的大规模回归和分类问题。通过大量的跨产品特征转换来记忆特征交互是有效的和可解释的,而泛化则需要更多的特征工程工作。在特征工程较少的情况下,通过对稀疏特征的低维密集嵌入学习,深层神经网络可以更好地推广到不可见的特征组合。然而,当user-item交互稀疏且高阶时,嵌入的深层神经网络会过度泛化和推荐不太相关的项目。本文提出了广度和深度学习联合训练的广度线性模型和深度神经网络,以结合推荐系统记忆和泛化的优点。我们在Google Play上制作并评估了这个系统,这是一个拥有超过10亿活跃用户和超过100万个应用的商业移动应用商店。在线实验结果表明,与仅限广度和深度的应用程序相比,广度和深度的应用程序收购显著增加。我们还开放了TensorFlow中的实现。

02. Covington, Adams, Sargin - 2016 - Deep Neural Networks for YouTube Recommendations

摘要: YouTube是目前规模最大、最成熟的行业推荐系统之一。在本文中,我们对系统进行了高层次的描述,并将重点放在深度学习带来的显著性能改进上。本文根据经典的两阶段信息检索二分法进行了划分:首先,详细描述了一个深度候选生成模型,然后描述了一个分离率深度排序模型。我们还提供了设计、迭代和维护一个具有巨大用户界面影响的大规模推荐系统的实践经验和见解。

03. He et al. - 2014 - Practical Lessons from Predicting Clicks on Ads at Facebook

摘要: 在线广告只允许广告商为可测量的用户响应(如点击广告)出价和付费。因此,点击预测系统是大多数在线广告系统的核心。由于每天有超过7.5亿活跃用户和超过100万活跃广告商,预测Facebook广告的点击量是一项具有挑战性的机器学习任务。本文介绍了一个决策树与logistic回归相结合的模型,其性能比这两种方法都高出3%以上,对系统整体性能有显著影响。然后,我们将探讨一些基本参数如何影响系统的最终预测性能。毫不奇怪,最重要的是拥有正确的特性:那些捕捉用户或广告历史信息的特性支配着其他类型的特性。一旦我们有了正确的特征和正确的模型(决策树加逻辑回归),其他因素就发挥了很小的作用(尽管小的改进在规模上也很重要)。选择数据新鲜度、学习率模式和数据采样的最佳处理对模型略有改进,尽管比添加高值特征或从选择正确的模型开始要少得多。

04. Item2Vec Neural Item Embedding for Collaborative Filtering

摘要: 许多协同过滤(CF)算法是基于项目的,因为它们分析项目-项目关系以产生项目相似性。最近,自然语言处理领域的一些工作建议使用神经嵌入算法学习单词的潜在表示。其中,带负抽样(SGNS)的skip-gram也被称为Word2Vec,它在各种语言学任务中提供了最新的结果。在本文中,我们证明了基于项的CF可以在相同的神经单词嵌入框架中进行转换。受SGNS的启发,我们描述了一种为基于项的CF命名Item2Vec的方法,该方法为潜在空间中的项生成嵌入。即使用户信息不可用,该方法也能够推断项与项之间的关系。本文给出了在大规模数据集上的实验结果,证明了Item2Vec方法的有效性,并证明了它与SVD的竞争性。

05. Li et al. - 2019 - Multi-Interest Network with Dynamic Routing for Recommendation at Tmall

摘要: 工业推荐系统通常由匹配阶段和排序阶段组成,以处理用户和项目的十亿规模。匹配阶段检索与用户兴趣相关的候选项,而排名阶段根据用户兴趣对候选项进行排序。因此,最关键的能力是为两个阶段的用户兴趣建模和表示。现有的基于深度学习的模型大多将一个用户表示为单个向量,这不足以捕捉用户兴趣的变化性质。在本文中,我们从不同的角度来处理这个问题,用多个向量来表示一个用户,这些向量编码了用户兴趣的不同方面。为了在匹配阶段处理用户的不同兴趣,提出了一种动态路由的多兴趣网络。具体地说,我们设计了一个基于胶囊路由机制的多兴趣提取层,用于聚类历史行为和提取不同兴趣。此外,我们还开发了一种称为标签感知注意的技术来帮助学习多向量的用户表示。通过对来自天猫的多个公共基准和一个大型工业数据集的大量实验,我们证明MIND可以获得比最先进的推荐方法更好的性能。目前,MIND已经部署在移动天猫应用的主页上处理主要的在线流量。

06. Linden, Smith - 2003 - Amazon.com Recommendations Item-to-Item Collaborative Filtering

摘要: 针对传统的协同过滤(collaborative filtering, CF)推荐模型中利用单一的总体评分进行相似性计算,但总体评分不能准确反映用户对物品喜好的问题,提出基于多方面评分的景点协同推荐算法。该算法综合利用用户对景点在景色、趣味性、性价比三个方面的评分计算用户或景点之间的相似性,进而计算目标用户对目标景点的总体评分。试验结果表明:在相似性计算中引入景点在这三个方面的评分信息后,推荐结果的均方根误差、平均绝对误差、覆盖率、准确率和F-度量指标都得到了改善。

07. Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations

摘要: 许多推荐系统从一个非常大的语料库中检索和评分条目。处理数据稀疏性和幂律项分布的一个常用方法是从其内容特征中学习项表示。除了许多基于矩阵分解的内容感知系统外,我们还考虑了一个使用双塔神经网络的建模框架,其中一个塔(项目塔)编码多种项目内容特征。训练这两个塔模型的一般方法是优化从随机小批量抽样的批内负片计算出的损失函数。然而,批内损失会受到抽样偏差的影响,严重影响模型的性能,特别是在分布高度偏斜的情况下。本文提出了一种新的基于流数据的项目频率估计算法。通过理论分析和仿真表明,该算法能够在不需要固定词汇量的情况下工作,并且能够产生无偏估计,并且能够适应词汇量的变化。然后,我们应用抽样偏差修正的建模方法为YouTube推荐建立一个大规模的神经检索系统。该系统被用来从一个拥有数千万视频的语料库中检索个人化的建议。通过对两个真实数据集的ofine实验,证明了采样偏差校正的有效性。我们还进行了现场A/B测试,以表明神经检索系统可以提高YouTube的推荐质量。

08. he_Use_MMR_Diversity_Based_LTMIR_1998

摘要: 文本检索和摘要中的文本查询相关性与信息新颖性。最大边缘相关(MMR)准则在对检索到的文档重新排序和选择合适的优先段落进行文本摘要时,力求在保持查询相关性的同时减少冗余。初步结果表明,MMR多样性排序在文献检索和单文档摘要中具有一定的优势。后者由最近的总结系统评估总结会议的结果证实。然而,最明显的优势在于构建非冗余的多文档摘要,其中MMR结果明显优于非MMR段落选择。

09. Zhou et al. - 2018 - Deep Interest Network for Click-Through Rate Prediction Guorui

摘要: 点击率预测是在线广告等工业应用中的一项重要任务。最近有人提出了基于深度学习的模型,它们遵循类似的嵌入和MLP范式。在这些方法中,首先将大规模稀疏输入特征映射到低维嵌入向量,然后以分组的方式变换成固定长度的向量,最后串接在一起,输入到多层感知器(MLP)中,学习特征之间的非线性关系。这样,不管候选广告是什么,用户特征都被压缩成一个固定长度的表示向量。固定长度向量的使用将成为一个瓶颈,这给嵌入MLP方法从丰富的历史行为中有效地获取用户的多样化兴趣带来了困难。本文提出了一种新的模型:深度兴趣网络(Deep Interest Network,简称DIN),该模型通过设计一个局部激活单元来解决这一难题,从而自适应地学习用户兴趣从历史行为到特定广告的表现,这种表现向量随广告的不同而变化,大大提高了模型的表达能力。此外,我们还开发了两种技术:小批量感知正则化和数据自适应激活函数,这两种技术可以帮助训练具有数亿参数的工业深网络。通过对两个公共数据集以及一个阿里巴巴真实生产数据集(样本量超过20亿)的实验,证明了提出的方法的有效性,与目前最先进的方法相比,该方法获得了更好的性能。目前,在阿里巴巴的在线展示广告系统中,DIN已经被成功地解除了部署,为主要流量服务。

10. Rendle - 2010 - Factorization machines

摘要: 本文将支持向量机(SVM)的优点与因子分解模型相结合,提出了一种新的模型类——因子分解机(FM)。与支持向量机一样,FMs是一种处理任何实值特征向量的通用预测器。与支持向量机相比,FMs使用因子化参数来建模变量之间的所有交互。因此,即使在支持向量机失败的情况下,它们也能够估计出具有巨大稀疏性的问题(如推荐系统)中的交互作用。研究表明,FMs的模型方程可以在线性时间内求解,从而可以直接对FMs进行优化。因此,与非线性支持向量机不同的是,该方法不需要进行对偶形式的变换,而且不需要任何支持向量就可以直接估计模型参数。我们展示了与支持向量机的关系以及FMs在稀疏环境下进行参数估计的优势。

另一方面,有许多不同的因子分解模型,如矩阵因子分解、并行因子分析或特殊模型,如SVD++、PITF或FPMC。这些模型的缺点是不适用于一般的预测任务,只适用于特殊的输入数据。并分别推导了各任务的模型方程和优化算法。我们证明FMs可以通过指定输入数据(即特征向量)来模拟这些模型。这使得FMs在因子分解模型中即使对没有专家知识的用户也很容易应用。

11. McMahan et al. - 2013 - Ad click prediction

摘要: 预测广告点击率(CTR)是一个大规模的学习问题,是数十亿美元在线广告行业的核心。我们提出了一个案例研究和主题的选择,从最近的实验中,在一个部署的中心预测系统的设置。这些改进包括对传统的基于FTRL近端在线学习算法(具有良好的稀疏性和收敛性)的有监督学习环境的改进,以及每坐标学习速率的使用。

我们还探讨了现实系统中出现的一些挑战,这些挑战最初可能出现在传统机器学习研究领域之外。其中包括节省内存的有用技巧、会话和可视化性能的方法、为预测概率提供置信度估计的实用方法、校准方法和自动管理特征的方法。最后,我们还详细说明了一些对我们没有好处的方向,尽管在文献中其他地方有令人鼓舞的结果。本文的目的是强调在这种工业环境下,理论和实际工程之间的密切关系,并展示在复杂动态系统中应用传统机器学习方法所面临的挑战的深度。

链接: 下载链接.

​关注本公众号后,后台回复「推荐系统论文」也可下载这11篇论文!

11篇推荐系统入门必读经典论文(附下载链接)相关推荐

  1. 600页!分享珍藏很久的《推荐系统学习手册》(附下载链接及入门经验)

    这是之前学习推荐系统时的学习资料,非常全面,包含经典模型的解析及代码实现.模型的评估.最新工业界论文解读等等,全网仅此一份!该手册有PDF版本和Markdown版本,总计有600多页! 资料领取方式: ...

  2. 700页!分享珍藏很久的《推荐系统学习手册》(附下载链接及入门经验)

    这是之前学习推荐系统时的学习资料,非常全面,包含经典模型的解析及代码实现.模型的评估.最新工业界论文解读等等,全网仅此一份!该手册有PDF版本和Markdown版本,总计有700多页! 资料领取方式: ...

  3. 【干货】推荐系统解构.pdf(附下载链接)

    今天给大家带来姚凯飞老师所做的分享<推荐系统解构.pdf>,本分享共包含如下四大部分: 1.推荐概述: 2.关键因素建模: 3.推荐流程拆解: 4.系统&全局生态. 本PPT已收录 ...

  4. 今天,公司架构师跟我分享多年的私货 | 进阶之路必读书籍(附下载链接)

    HTML与CSS 初级 <Head First HTML与CSS(第2版)>豆瓣评分:9.3 入门经典,初始获得信息的好途径.帮助读者逐步构件小的知识点,再结合一本整体的类别逻辑型的书,就 ...

  5. 【实践】数据科学在搜索、广告、推荐系统的应用实践.pdf(附下载链接)

    今天给大家带来前Twitter数据科学家.现快手搜索分析负责人王建强先生所做的分享<数据科学在搜索.广告.推荐系统的应用实践.pdf>.关注数据科学及相关应用的伙伴们别错过了!(到小程序省 ...

  6. 【实践】图片主题模型在推荐系统的应用实践.pdf(附下载链接)

    今天给大家带来搜狐视频王超先生所做的分享<图片主题模型在推荐系统的应用实践.pdf>.本次分享主要包含如下三大部分: 1.推荐系统与内容理解: 2.基于目标检测的图片主题模型: 3.基于特 ...

  7. 【实践】腾讯PCG数据中台DEVOPS和AIOPS实践.pdf(附下载链接)

    猜你喜欢 0.[免费下载]2021年11月热门报告盘点1.预训练模型在华为信息流推荐中的应用与实践2.一站式数据开发平台在有赞的实践3.美团搜索排序架构及优化实践4.面向广告主的猜你喜欢推荐实践5.腾 ...

  8. 【实践】预训练模型在华为信息流推荐中的应用与探索.pdf(附下载链接)

    猜你喜欢 0.[免费下载]2021年11月热门报告盘点1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器学习平台演进5 ...

  9. 【实践】一站式数据开发平台在有赞的最佳实践.pdf(附下载链接)

    猜你喜欢 0.[免费下载]2021年11月热门报告盘点1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器学习平台演进5 ...

最新文章

  1. 从U盘无人值守安装linux操作系统
  2. qt 提高图片加载速度
  3. 运算符优先级和结合性
  4. webpack — 概述 (2)
  5. DataFrame的多dtype创建方法
  6. wordpress url index.php,WordPress对URL的路由解析过程详解
  7. Hadoop Yarn源码 - day1
  8. FW:Data Mining UrlScan 3.0 Logs using LogParser 2.2
  9. nmon和nmon analyser使用方法
  10. 获取文件夹下所有文件名(window+linux)
  11. 堪比熊猫烧香!中国新型蠕虫病毒大爆发!电脑瞬间报废
  12. 项目经理:什么是矩阵型组织结构?
  13. 题解 P2919 【[USACO08NOV]守护农场Guarding the Farm】
  14. 梁宁增长思维30讲笔记 - 模式
  15. Istio 1.4 部署指南
  16. ultravnc中文版,不能错过的5款ultravnc中文版
  17. 简单介绍一下HBase、Cassandra、Voldemort、Redis、VoltDB、MySQL(转)
  18. Linux初探之如何查看帮助文档自学命令
  19. 光谱仪器专题篇(10),光谱仪器之遥感光谱仪故障处理
  20. Frequency Dependence(天线参数的依赖性)side lones(旁瓣)

热门文章

  1. MOSFET和IGBT栅极驱动器电路的基本原理的学习(1)
  2. HX=JE,HX-JE芯片,无感4.9V升压ic电路图PDF应用技术
  3. Vue-vue-cli的安装
  4. P3518 [POI2011]strongbox
  5. 2021年美赛C题翻译、思路及感受
  6. 基于html5+Java+MySQL的健身俱乐部网站设计与实现 文档+任务书+开题报告+答辩PPt+项目源码及数据库文件
  7. [512大地震]今日图说:四川汶川地震涌现出的16个最牛
  8. 英特尔 SST 技术
  9. h61 nvme硬盘_一盒在手,说走就走-ORICO M.2双盘位移动硬盘盒评测
  10. imshow中的 cmap=plt.cm.gray_r 是调整颜色,附颜色大全