搜索推荐系统中的召回

  • 1. 召回简介
  • 2. 召回指标
  • 3. 召回策略
    • 3.1 基于内容匹配的召回
    • 3.2 基于协同过滤的召回

1. 召回简介

谈召回离不开搜索推荐,通过用户搜索或者系统推荐获取客户想要的内容,从而提高用户的体验,提高商品转化率。当你浏览电商网站的时候是如何得到你想要的内容,搜索或者推荐,一是输入关键字通过搜索召回+排序的方式获取你想要的内容,或者是系统基于用户画像与内容画像通过算法模型推荐召回+排序的方式获取你想要的内容。

什么是召回,召回(match)就是指从全量的信息中尽可能多的获取相关的信息,召回这个词不太准确,匹配更好。比如电商的推荐召回就是根据用户画像以及商品画像进行匹配,当用户打开推荐的时候会从商品库中根据召策略获取一组与用户相关度较高的商品,商品库中存中商品数量很大,不可能把所有商品都推给用户,而是根据召回策略先匹配一部分商品,再把这部分商品排序返回给用户,既提升了排序效率又提高了用户体验。

下边这个召回排序流程图很好的反应了其工作流程及作用。

2. 召回指标

召回策略的评估主要根据两个评价指标:召回率和准确率。
召回率(Recall)= 系统检索到的相关内容 / 系统所有相关的内容总数
准确率(Precision)=系统检索到的相关内容 / 系统所有检索到的内容总数。

以搜索为例,系统中关于云平台的数据总共有4个,百度云,阿里云,华为云,腾讯云,权重都是1。用户通过搜索云平台得到百度云,古人云。
系统检索到的相关内容 :百度云。
系统所有相关的内容总数:百度云,阿里云,华为云,腾讯云。
系统所有检索到的内容总数:百度云,古人云。
召回率(Recall)=系统检索到的相关内容 / 系统所有相关的内容总数=1/4=25%
准确率(Precision)=系统检索到的相关内容 / 系统所有检索到的内容总数=1/2=50%

3. 召回策略

召回策略主要包含两大类,即基于内容匹配的召回和基于系统过滤的召回。

3.1 基于内容匹配的召回

内容匹配即将用户画像与内容画像进行匹配,又分为基于内容标签的匹配和基于知识的匹配。

1.基于内容标签的召回
例如,A用户的用户画像中有一条标签是“杨幂的粉丝”,那么在他看了《绣春刀2》这部杨幂主演的电影后,可以为他推荐杨幂主演的其他电影或电视剧,这就是“基于内容标签的匹配”。

2.基于知识的召回
“基于知识的匹配”则更进一步,需要系统存储一条“知识”——《绣春刀2》是《绣春刀1》的续集,这样就可以为看过《绣春刀2》的用户推荐《绣春刀1》。基于内容匹配的召回较为简单、刻板,召回率较高,但准确率较低(因为标签匹配并不一定代表真的感兴趣),比较适用于冷启动的语义环境。

3.2 基于协同过滤的召回

如果仅使用上述较简单的召回策略,推荐内容会较为单一,目前业界最常用的基于协同过滤的召回,它又分为基于用户、基于项目和基于模型的协同过滤。

1.基于用户的协同过滤(UserCF)
基于用户(User-based)的协同推荐是最基础的,它的基础假设是“相似的人会有相同的喜好”,推荐方法是,发现与用户相似的其他用户,用用户的浏览记录做相互推荐。

2.基于项目的协同过滤(ItemCF)
基于项目(Item-based)的协同过滤中的“项目”可以视场景定为信息流产品中的“内容”或者电商平台中的“商品”,其基础假设是“喜欢一个物品的用户会喜欢相似的物品”计算项目之间的相似性,再根据用户的历史偏好信息将类似的物品推荐给该用户。

3.基于模型的协同过滤(ModelCF)
基于模型的协同过滤推荐(Model-based)就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测推荐。

总体来说,基于协同过滤的召回即建立用户和内容间的行为矩阵,依据“相似性”进行分发。这种方式准确率较高,但存在一定程度的冷启动问题。

在实际运用中,采用单一召回策略的推荐结果实际会非常粗糙,通用的解决方法是将规则打散,将上述几种召回方式中提炼到的各种细小特征赋予权重,分别打分,并计算总分值,预测CTR。

例如,根据内容匹配召回策略,用户A和内容甲的标签匹配度为0.6,同时,根据协同过滤召回策略,应该将内容甲推荐给用户A的可能性为0.7,那么就为0.6和0.7这两个数值分别赋予权重(这个权重可能会根据算法的具体情况来确定),得出总分,用它来预测用户可能点击的概率,从而决定是否返回该结果。

搜索推荐系统中的召回相关推荐

  1. 搜索推荐中的召回匹配模型综述(二):基于表示学习的深度学习方法

    " 本文是搜索推荐中的召回匹配模型综述系列的第二篇,上一篇为搜索推荐中的召回匹配模型综述(一)--传统方法. 本文主要介绍了搜索推荐中基于representation learning的深度 ...

  2. 在广告/搜索/推荐系统中 对展示结果打散的通用鲁棒算法

    摘要:之所以同时提到广告/搜索/推荐三个系统,是因为这三者有一定的相似性,即通过一次请求(基于上下文.用户场景.关键词等)给用户呈现一篮子元素,这些元素包括如文章.商品.活动.专辑.音乐.视频等等.这 ...

  3. 推荐系统中的召回算法大致梳理(非完整)

    推荐系统中的召回算法大致梳理(非完整) 定义 推荐策略中的两个关键问题分别是"召回"和"排序". "召回match"是指从全量信息中触发尽可 ...

  4. 搜索推荐中的召回匹配模型综述(一):传统方法

    Part0 搜索推荐中的匹配模型综述 本文主要启发来源SIGIR2018的这篇综述性slides<Deep Learning for Matching in Search and Recomme ...

  5. 推荐系统中的召回和排序

    在推荐系统中一般会分为召回和排序两个阶段: 召回 召回的目标是从千万级甚至亿级的候选中召回几千个item,召回一般由多路组成,每一路会有不同的侧重点(优化目标),如在广告中成熟期广告和冷启动广告分为两 ...

  6. 搜索推荐中的召回匹配模型综述(三):基于匹配函数学习的深度学习方法

    Part0 基于match function learning的深度学习方法 对比representation learning的方法,基于match function learning最大的特点是, ...

  7. 推荐系统中的召回算法--协同过滤

    工业界通用推荐系统架构: Match&Rank 定义:Match基于当前user(profile.history)和context,快速在全库中找到TopN最相关的Item,给Rank来做小范 ...

  8. 聊一聊搜索推荐中的 Position Bias

    作者 | Chilia 哥伦比亚大学 NLP搜索推荐 整理 | NewBeeNLP 在搜索推荐系统中,Bias可以说无处不在.之前我们整理过搜索.推荐.广告中的曝光偏差问题,今天来看看 positio ...

  9. 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机

    自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索.推荐以及算法相关工作.多年来主要从事推荐系统以及机 ...

最新文章

  1. MongoDB【最新版V2.6】- 发行说明
  2. ViewPager留两边 显示左右两边的视图
  3. Linux网卡命名规则
  4. 12-思科防火墙:ASA会话超时
  5. Vue检测当前是否处于mock模式
  6. C#使用Monitor类、Lock和Mutex类进行多线程同步
  7. VRRP的基本配置(以H3C模拟器为例)
  8. SSLOJ 1298.网站计划
  9. 自动生成光纤测试资料的软件,光缆测试资料生成模板
  10. AirServer第三方投屏软件v7.3.0中文版 (Airplay终端实用工具)
  11. 华为HG8245光纤猫获得超级用户密码
  12. 5A成绩通过PMP,备考经验总结——姜飞
  13. Android Studio||动态改变xml图片位置+背景/旋转+平移/AnimationSet/java读取drawable图
  14. 排序算法 之希尔排序及时间复杂度分析
  15. PHP编写投屏功能,win10如何投屏到电视
  16. 2018拼多多校招【大整数相乘】Python解法
  17. python控制台打印文字logo
  18. 一种有趣的隐写技术(图转声,声转图)
  19. MAC 10.14安装第三方软件的方法
  20. 【STM32】芯片自锁、No Cortex-M SW Device Found/HardFault_Handler无法下载等问题的解决办法

热门文章

  1. 石英表和机械表的区别
  2. 【买卖股票的最佳时机】
  3. Web3.0时代,公关营销化的阵痛和蝶变
  4. 销售人员面试题之市场问题
  5. 写给理工科人看的乐理(五)调性
  6. oracle中时间差转秒,oracle计算时间秒数差
  7. ILOG CPLEX OPL 编程手册,使用心得与简单例子
  8. NTC 100k的温感度采集。
  9. JS实现电话号码校验-----座机:区号-号码、或11位手机号
  10. redHat 下配置 vnc 远程控制服务