当新用户或新项目进入内容平台时，就会出现冷启动（Cold Start）问题。

以协同过滤这样的经典推荐系统为例，假设每个用户或项目都有评级，这样我们就可以推断出类似用户/项目的评级，即使这些评级没办法调用。但是，对于新进入的用户/项目，实现这一点很困难，因为我们没有相关的浏览、点击或下载等数据，也就没办法使用矩阵分解技术来“填补空白”。

不过，研究人员已经提出了各种方法来解决冷启动问题。在这篇文章中，我们会简单介绍一些解决推荐系统中冷启动问题的方法，至于这些方法在实践工作中是否奏效，尚无定论。

精华版

•基于代表性：使用有代表性的项目和用户子集；

•基于内容：使用诸如文本、社交网络等的辅助信息；

•老虎机：考虑新项目中的EE问题（Exploration&Exploitation）；

•深度学习：使用黑盒子。

详细版

基于代表性

如果没有足够的用户和项目信息，我们可以更多地依赖那些能够“代表”项目和用户的用户。这就是基于代表性的方法背后的哲学。

代表性用户的兴趣偏好线性组合能与其他用户的无限接近。例如，基于代表性的矩阵因子分解（RBMF，Representative Based Matrix Factorization），其实是矩阵因子分解方法的扩展，其附加约束条件是m个项应该由k个项的线性组合表示，如下面的目标函数所示：

有了这个附加约束条件，就有了类似于标准MF方法的重建误差。当新用户进入平台时，要求新用户对这k个项进行评级，并用它来推断其他m-k项的评级。这种方法通过让用户对某些项目进行额外评级，从而改进对新用户的推荐。经过改进的RBMF只需要一部分新用户对这些项目评级，而不是所有的新用户。

优点

•用少数代表性用户来表达新用户，更具可解释性；

•是MF的简单扩展。

缺点

•需要改进UI和前端逻辑，以要求用户对代表项进行评级。

基于内容

在推荐系统中还有许多未充分利用的辅助信息。

近年来，电子商务和社交网络之间的界限越来越模糊。许多电子商务网站支持社交登录机制，用户可以使用他们的社交网络账号登录，例如微信、微博、QQ帐户。用户还可以在微博上直接分享他们购买的新产品，其中包含指向产品网页的链接。

那如何在CF方法中处理这些内容呢？经典的CF方法以重建误差为目标，基本上是矩阵填充，从而很难利用这些辅助信息。因此，研究人员提出了将矩阵重建目标和基于内容的目标相结合的混合方法。这些方法并非特定的冷启动，感兴趣的读者可以进一步探讨。

优点

•可以包含各种内容信息；

•是MF的简单扩展。

缺点

•通过深层方法解决，具有不同的缺点，目标函数变得杂乱无章。

•出现大量的功能工程，需要考虑是否在数据库中插入用户/项目功能。

老虎机问题（Bandit）

冷启动问题可以重新定义并转换为老虎机问题。什么是老虎机（Bandit）问题？一个典型的例子如下：

一个赌徒，要去摇老虎机，一排老虎机外表一模一样，但是每个老虎机吐钱的概率可不一样，他不知道每个老虎机吐钱的概率分布是什么，那么每次该选择哪个老虎机才可以做到收益最大化呢？

老虎机问题和冷启动问题又有什么关系呢？我们可以这样类比：以电子商务平台为例，每天有k个新物品进入平台，我们可以把这k个项看作是具有不同回报（收入、利润）的老虎机。但由于它们是新产品，因此无权访问购买它们的用户数量。推荐哪些项目就像选择要用哪台老虎机一样。

在老虎机问题上，我们会非常关心EE （exploration vs exploitation）问题。如果发现一个销量非常好的新商品，我们希望向用的展示的次数也更多（Exploitation）；但与此同时，我们还想展示其他没有展示过的东西，因为它们有可能比已经展示过的商品（Exploration）更受欢迎。

解决老虎机问题有很多方法：

•Epsilon-Greedy算法：这是最简单的一种，选一个（0,1）之间较小的数作为epsilon；每次以概率epsilon做一件事：所有臂中随机选一个；每次以概率1-epsilon 选择截止到当前，平均收益最大的那个臂。epsilon的值可以控制对Exploit和Explore的偏好程度。越接近0，越保守，只想花钱不想挣钱。

•UCB算法：UCB算法全称是Upper Confidence Bound（置信区间上界），它的算法步骤如下：

初始化：先对每一个臂都试一遍；

按照如下公式计算每个臂的分数，然后选择分数最大的臂作为选择：

观察选择结果，更新t和Tjt。其中加号前面是这个臂到目前的收益均值，后面的叫做bonus，本质上是均值的标准差，t是目前的试验次数，Tjt是这个臂被试次数。

这个公式反映一个特点：均值越大，标准差越小，被选中的概率会越来越大，同时哪些被选次数较少的臂也会得到试验机会。

•Thompson sampling算法：这种算法简单实用，因为它只要一行代码就可以实现。简单介绍一下它的原理，要点如下：

每个臂是否产生收益，其背后有一个概率分布，产生收益的概率为p。

我们不断地试验，去估计出一个置信度较高的“概率p的概率分布”就能近似解决这个问题了。

怎么能估计“概率p的概率分布”呢？答案是假设概率p的概率分布符合beta(wins, lose)分布，它有两个参数: wins, lose。

每个臂都维护一个beta分布的参数。每次试验后，选中一个臂，摇一下，有收益则该臂的wins增加1，否则该臂的lose增加1。

每次选择臂的方式是：用每个臂现有的beta分布产生一个随机数b，选择所有臂产生的随机数中最大的那个臂去摇。

上下文老虎机问题

上下文老虎机问题是老虎机问题的一般化，更接近现实世界的情况。唯一的区别是，除了动作（例如，要显示的项目）和奖励（例如销售）之外，还有上下文（例如项目描述、图片、用户点击的次数）。通过利用这些上下文，我们可以更好地估计奖励。例如，在上面的UCB中，我们可以向奖励函数添加上下文特征的线性组合。在TS中，我们可以使似然函数除了取决于奖励和行动之外，还取决于上下文。

优点

•易于实现：与复杂的机器学习方法相比，简单的Bandit算法非常容易实现；

•良好的理论保证：由于其简单性，已经对平均情况和最坏情况的奖励进行了大量的理论分析。

缺点

•太过简单？

深度学习

这里把深度学习视为解决冷启动问题的一大类，但其实使用深度学习的方式非常多样化，以下只是其中的一些方法：

DropoutNet：

基本思路很简单，但很有效果。具体方法是，在训练基于深度学习的推荐系统（如多层的协同过滤）时，我们可以随机舍去某些项目和用户的评级，使其对新项目具有鲁棒性。与神经网络训练中的标准dropout相反，神经网络训练会舍去特征，而DropoutNet会舍去节点。这样做可以减少神经网络对某些评级的依赖，更普遍地适用于评级较少的项目/用户。这种方法的优势是可以与任何基于神经网络的推荐系统一起使用，同时还适用于用户和物品的冷启动。

基于会话的RNN：

这种方法试图把每个用户会话反馈到RNN中，具体来说，它训练了GRU （Gated Recurrent Unit）的变体，其中输入是会话的当前状态，输出是会话中下一个事件的项目。在只有少数用户会话可用的小型电子商务网站中，这种方法很有用。

优点

•如果能够找到适合当前目的的特定域的模型，则有可能显著提高推荐性能。

缺点

•实施和调整模型花费时间；

•部署深层模型可能需要更多时间，具体情况取决于当前的堆栈；

•具体效果无法保证。

原文链接：Tackling the Cold Start Problem in Recommender Systems

以上内容由第四范式先荐编译，仅用于学习、交流，版权归原作者所有。

先荐是一款赋能媒体的AI产品，是集内容上传、内容管理、内容分发、推荐干预、前端渲染于一体的一站式推荐服务可视化平台，支持PC、WAP、APP全平台接入，帮助媒体从0到1搭建推荐系统，显著提升用户活跃、留存、观看时长等重要业务指标，在减少技术成本投入的同时，大幅提高媒体运营效率，从而实现业务智能化转型。目前已服务人民日报、环球网、花瓣网、果壳网、段友、36氪、简书等三百余家内容平台，其中在环球网web端的兴趣推荐项目上，实现了点击率58%的提升，同时访问量和营收分别增长了69%、20%。

如何解决推荐系统中的冷启动问题？相关推荐

关于推荐系统中的冷启动问题探讨(Approaching the Cold Start Problem in Recommender Systems)...
本文翻译自:https://medium.com/@InDataLabs/approaching-the-cold-start-problem-in-recommender-systems-e225e ...
使用联邦学习解决推荐系统中的隐私泄露问题
推荐系统中的安全问题 <A NOVEL PRIVACY-PRESERVED RECOMMENDER SYSTEM FRAMEWORK BASED ON FEDERATED LEARNING> ...
推荐系统中的冷启动问题
转载:https://www.jianshu.com/p/97e46f933010 冷启动问题的定义推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,对于BAT这类大公司来说,它们已经积 ...
区块链在个性化推荐系统中的应用研究综述
区块链在个性化推荐系统中的应用研究综述许小颖, 陈熙, 陈源, 谢永靖华南理工大学工商管理学院摘要:区块链作为一种新兴技术,以其去中心化.难以篡改.匿名性和可追溯性等特点,为个性化推荐系统的改进 ...
推荐系统中的数据稀疏和冷启动问题
原文链接:RS:推荐系统中的数据稀疏和冷启动问题如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题. 冷启动问题主要分为三类: (1) 用 ...
从0到1详解推荐系统中的嵌入方法，原理、算法到应用都讲明白了
(图片由AI科技大本营付费下载自视觉中国) 作者丨gongyouliu 编辑丨lily 来源 | 大数据与人工智能(ID:) 前言作者曾在这篇文章中提到,矩阵分解算法是一类嵌入方法,通过将用户行为矩 ...
在推荐系统中，我还有隐私吗？联邦学习：你可以有
2020-11-19 15:38:41 机器之心分析师网络作者:仵冀颖编辑:H4O 在推荐系统无所不在的网络环境中,用户越来越强烈地意识到自己的数据是需要保密的.因此,能够实现隐私保护的推荐系统的 ...
推荐系统中基于深度学习的混合协同过滤模型
近些年,深度学习在语音识别.图像处理.自然语言处理等领域都取得了很大的突破与成就.相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段. 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应 ...
推荐系统中所使用的混合技术介绍
from:http://blog.csdn.net/u010140338/article/details/45014307 推荐系统中所使用的混合技术介绍在推荐系统实际运用中,各种混合技术是其中一项 ...
何向南教授团队最新综述：对话推荐系统中的进展与未来挑战
©作者|高崇铭.雷文强等来源|社媒派SMP 背景介绍推荐系统为工业界带来了巨大的收益.大多数推荐系统都是以静态的方式工作,即从用户历史的交互中来推测用户的兴趣爱好从而做出推荐.然而,这样的方式有缺 ...

如何解决推荐系统中的冷启动问题？

精华版

详细版