推荐系统之召回策略浅析
召回 & 排序
目前业界推荐系统普遍采用召回+排序的两阶段模型,如下图所示。所谓召回(matching)
,指的是从全量信息集合中触发尽可能多正确的结果,并将结果返回给排序
作为输入。相比搜索系统,推荐系统最大的不同在于用户没有明确的Query输入,即用户自身的需求是不明确的,推荐系统需要做的就是根据用户画像、内容画像等各种信息为用户推荐他可能感兴趣的内容,达到延长用户停留时间的作用。由于没有明确的Query,推荐系统中的召回面对的是全量信息池,需要从整个信息集合中挑选出尽可能多的相关结果,剔除相关性较弱的结果,降低排序阶段的工作量。
排序(ranking)
则是指对多路召回渠道的内容进行统一打分排序,选出少量的最优结果。召回
阶段的主要职责是从千万量级的候选物品中,采取简单模型将推荐物品候选集合快速筛减到千级别甚至百级别,这样将候选集合数量降下来,之后的排序阶段就可以上一些复杂模型,细致地对候选集进行个性化排序。我觉得英文matching
的描述更相对贴切,易于理解。
多路召回策略
基于内容匹配的召回
内容匹配即将用户画像和内容画像进行匹配,基于内容的匹配召回率较高,但准确率较低,比较适合冷启动的语义环境。以微博feed流为例,有基于兴趣标签、兴趣Topic、兴趣实体的召回策略。
基于协同过滤的召回
基于领域的协同过滤
UserCF - 基于用户的协同过滤
UserCF即发现与用户相似的其他用户,然后基于用户的浏览记录做相互推荐。ItemCF - 基于项目的协同过滤
ItemCF中的项目依业务场景而定,可以是信息流产品中的“内容”或者电商场景中的商品,通过计算项目之间的相似性,再根据用户的历史偏好进行类似物品推荐。
基于模型的协同过滤
Model-based的协同过滤是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好信息进行预测推荐。常用的比如隐语义模型中的矩阵分解(matrix factorization,MF)和LDA等。其他还有基于贝叶斯网络以及基于SVM的协同过滤。
基于流行度/热度的召回
内容的流行程度,也称之为热度,最常见的就是将榜单中热度最高的内容推荐给用户,比如微博热搜,电商中的Top N商品等。
基于场景上下文的召回
所谓上下文(Context)即用户行为发生的时间、地点以及使用的设备,有些行为是近乎实时的,比如刷新微博的时间,以及美团/滴滴对地理位置极其敏感的应用,这种变化需要在召回阶段就体现出来,上下文特征具有非常强的动态性。
Reference
- 推荐策略之召回
- 推荐系统召回四模型之:全能的FM模型
推荐系统之召回策略浅析相关推荐
- 推荐系统遇上深度学习(三十九)-推荐系统中召回策略演进!
推荐系统中的核心是从海量的商品库挑选合适商品最终展示给用户.由于商品库数量巨大,因此常见的推荐系统一般分为两个阶段,即召回阶段和排序阶段.召回阶段主要是从全量的商品库中得到用户可能感兴趣的一小部分候选 ...
- JAVA召回算法_推荐系统召回策略之多路召回与Embedding召回
图1. 推荐系统整体架构 推荐系统学习笔记系列链接: 1. 多路召回 1.1 概述 所谓的"多路召回策略"就是指采用不同的策略.特征或者简单模型,分别召回一部分候选集,然后再把这些 ...
- 推荐系统学习笔记召回策略之基于协同过滤召回
基于协同过滤的召回 1. 概述 2. 基于近邻的协同过滤算法 3. 相似度计算方法 4. 协同过滤算法的进化-矩阵分解 图1. 推荐系统整体架构 推荐系统学习笔记系列链接: 推荐系统学习笔记--特征工 ...
- 基于Elastic Search的推荐系统“召回”策略
当我们打开一个资讯APP刷新闻时,有没有想过,系统是如何迅速推送给我们想看的内容?资讯APP背后有一个巨大的内容池,系统是如何判断要不要将某条资讯推送给我们的呢?这就是今天想跟大家探讨的问题--推荐系 ...
- 推荐系统——召回策略中的融合
目录 一.多路召回的融合策略 二.长短混推 三.多模态数据的融合利用 四.多任务学习 五.长短期融合 一.多路召回的融合策略 为保证召回的多样性和覆盖率,通常都会采用多路召回,然后融合的策略. 但如何 ...
- 推荐系统召回策略之多路召回与Embedding召回
多路召回与Embedding召回 1. 多路召回 1.1 概述 1.2. 多说一点 1.3. 融合排序与策略 2. Embedding召回 2.1 概述 2.2 Embedding召回的常见方法 2. ...
- 对比学习视角:重新审视推荐系统的召回粗排模型
省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 对比学习在快手推荐系统中的应用实践 机器学习在B站推荐系统中的应用实践 小红书推荐系统中台应用实践 微信视频号实 ...
- 推荐系统的召回算法(一)—— 协同过滤法(基于用户)
姗姗来迟的第二篇博客,最近在了解有关推荐系统方面的基本知识和算法,先总结其中一类经典常用的算法--协同过滤法.网上已有很多介绍其原理的好文章,所以本文用较多篇幅来写一些自身对算法实现的理解和疑惑, ...
- 复盘:推荐系统—— 负采样策略
复盘:推荐系统-- 负采样策略 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的 (1)自己的科研 ...
最新文章
- pandas 读取写入保存文件
- 如何在Docker容器中挂载主机目录
- VR游戏制作中“延迟”的优化方法
- python中对列表浅复制深复制另类的理解方式
- ArcGIS实验教程——实验三十六:ArcGIS Python脚本的巧妙使用
- 0x123C语言,and esp, 0xfffffff0
- 自制公众平台Web Api(微信)
- 库克回应 iPhone 11 系列不支持 5G;哈啰 App 被下架;Flutter 1.9 稳定版发布 | 极客头条...
- iOS开发之基础面试题
- Gson日期格式异常-com.google.gson.JsonSyntaxException
- # 畸变矫正_拒绝拍照边缘畸变 坚果Pro 3 Smartisan OS v7.2.0系统体验
- 在英文邮件中,如何在开头对收件人进行称呼?
- [计算机网络]十四、网卡的三种模式
- win10 wifi图标不见了 解决办法
- Using TensorFlow backend. Traceback (most recent call last): File train.py, line 9, in module
- Self-Attention与Transformer
- switchyomega规则列表备份_详细资料|switchyomega设置教程详细介绍_234游戏网
- signature=e4198950218cedc4f710fd00a321e40b,杜鸣心与《水草舞》
- Maven 打包成第三方jar包且把pom依赖包打入进来的方法
- 【Mac】anaconda创建虚拟环境+jupyter虚拟环境配置
热门文章
- 在unity中使用Newtonsoft.Json
- 说说微信红包算法,为什么你总是抢的那么少?
- iphone快捷指令蚂蚁森林能量_如何快速偷取蚂蚁森林能量?这有一个捷径……
- 软件测试怎么学习 ?50本关于软件测试的书籍,拿走!
- 特征值是否重根与特征向量及基础解系的关系
- java中向上的尖括号是什么,什么lt; Tgt; (尖括号)在Java中是什么意思?
- Linkerd or Istio?哪个Service Mesh框架更适合你?
- 登录交换机与网络操作系统Commware未修改版本
- python爬取图片并保存到本地
- 电脑音量100后还嫌小怎么办