什么是推荐系统?

  • 01 什么是推荐系统
  • 02 推荐系统应用场景
  • 03 推荐系统的分类
    • 1. 基于内容的推荐
    • 2. 基于协同过滤的推荐
      • 基于用户的协同过滤
      • 基于项目的协同过滤
      • 基于模型的协同过滤
    • 3. 混合推荐方法
      • 推荐结果混合
      • 推荐算法的混合
  • 04 搜索与推荐的区别
    • 1. 按照用户意图是否明确,我们可以将两者进行区分
    • 2. 两者个性化区别
    • 3. 评价标准不同
    • 4. 马太效应和长尾理论

作者:大数据DT
来源:大数据DT

导读:什么是推荐系统?跟搜索引擎有哪些区别?

用户在意图明确的情况下,能够通过关键词进行搜索。那么,当用户不了解自己真正想要什么的时候,系统该如何给出用户可能想要的结果,满足用户的需求呢?推荐系统能够解决这类问题。

比如用户在找喜欢的音乐,但又没有具体的歌名或者歌手时,很难在短时间内找到真正合适的音乐,这时候就需要分析用户历史行为,进而找出用户可能感兴趣的音乐推荐给用户,这就是推荐系统所需要完成的事情。

01 什么是推荐系统

推荐系统是能找出用户和物品之间联系的信息过滤系统。推荐系统主要有两个显著的特征。

  • 主动性:从用户角度考虑,前文提到的搜索引擎都是为了解决信息过载问题而存在的,需要用户提供明确的需求。

    • 当用户无法准确描述自己的需求时,搜索引擎就不能够为用户提供精确的服务了。
    • 而推荐系统不需要用户提供明确的需求,能够自主地通过分析用户和物品之间的关联数据进行建模,为用户提供可能感兴趣的信息。
  • 个性化:推荐系统能够挖掘冷门信息推荐给用户。热门物品通常能够代表大多数人的喜好,冷门物品往往只能代表少数人的个性化需求,但冷门物品所带来的收益可能超过热门物品,所以挖掘长尾冷门信息是推荐系统的方向。

总之,推荐系统推荐的物品通常来说不是对用户有帮助的,就是用户自己感兴趣的。

02 推荐系统应用场景

与搜索系统不同的是,推荐系统主要利用用户的行为数据,分析用户的行为日志,从而提供不同的推荐页面,提高用户的满意度以及网站的点击率和转化率。

常见的推荐系统的推荐形式主要有三种:个性化推荐、相关推荐、热门推荐。

  • 个性化推荐:经常以“猜你喜欢”“发现”等形式在首页出现;

  • 相关推荐:经常以“相关推荐”“看了又看”等形式放在内容详情页;

  • 热门推荐:按照各类数据的统计结果进行推荐。

推荐系统的常见应用场景包括:电子商务、个性化广告、音乐和电影、求职等。

电商领域的推荐系统有很广泛的应用场景。推荐系统可以帮助很多用户在淘宝、天猫上完成消费。相关的推荐功能非常多。以“淘宝”为例,其主要推荐功能有:相关商品、店铺推荐、买了还买、看了还看、猜你喜欢等。

淘宝首页“猜你喜欢”的产品、商品详情页中“看了又看”的产品、订单详情页“你可能还喜欢”展示如图2-3所示。

▲图2-3

淘宝的推荐算法中有基于内容推荐的成分,如推荐系统需要给用户和商品打标签,通过算法匹配推荐商品给用户;还有基于协同思想的方法,根据某顾客以往的购买行为或者通过具有相似购买行为的客群的购买行为给顾客推荐可能喜欢的商品。

在海量音乐中,如何找出我们自己喜欢的音乐呢?

推荐系统在这其中扮演着重要的角色。以网易云音乐为例,网易云音乐的主要推荐场景有:每日推荐、歌单推荐、电台推荐等。

“私人FM”和“每日歌曲推荐”是综合了用户听歌记录、收藏的歌曲、歌单、歌手、收看的MV以及本地歌曲等多种因素,再经过多重计算之后给出的相关推荐结果。

网易云音乐还设置了“每日推荐”条目,以便收集用户的每日行为数据,不断地完善和丰富用户画像。“歌单”和“电台”的推荐功能也是一致的,主要收集用户的偏好和行为数据。

同时,网易云音乐的推荐应用中设置了用户自己打标签的功能,即当系统推荐不准确时,用户可以自行标记。

03 推荐系统的分类

推荐系统具有不同的分类方法。常见的分类方法有:按照推荐结果因人而异分类、按照推荐方法分类、按照推荐模型构建方式分类。因为推荐算法是整个推荐系统中最核心部分,所以推荐系统还可以依据推荐算法分类。基于此,推荐系统可以分为基于内容的推荐、基于协同过滤的推荐以及混合推荐方法。

1. 基于内容的推荐

基于内容的推荐策略始于信息检索领域,是搜索领域的重要研究方向。

这种方法利用用户已经选择的对象,从候选集中找出与用户已选对象相似的对象作为推荐结果。

这一推荐策略是首先提取推荐对象的内容特征,并和用户模型中的用户兴趣匹配。匹配度较高的对象就可以作为推荐结果推荐给用户。

计算推荐对象的内容特征和用户模型中兴趣特征两者之间的相似性是内容推荐策略中的关键步骤。一般采用的最简单的方法为计算两个向量的夹角余弦值。

基于内容的推荐策略的主要部分就是用户特征的描述以及推荐对象内容特征的提取。

目前,文本信息的特征提取方法已经趋于成熟,但多媒体信息的特征提取技术还需要进一步探索。

图2-6是基于内容的推荐,用户A喜欢具有A、B特征的商品A,而商品C也是A、B类型的,商品C和商品A相似,于是商品C被推荐给用户A。

基于内容的推荐策略

优点有:

  • 简单有效,推荐结果较为直观,可解释性强;

  • 没有新推荐对象的冷启动问题;

  • 简单的分类方法就能够支持该策略。

缺点有:

  • 受推荐对象特征提取能力的限制,对图像、视频、声音等多媒体资源的特征提取以及文本资源的提取不够全面;

  • 很难推出新颖的推荐结果,惊喜度指标较低,难以发现用户新的兴趣点;

  • 存在新用户的冷启动问题,因为很难发现新用户的兴趣爱好,无法和推荐对象的内容特征进行匹配。

2. 基于协同过滤的推荐

目前,基于协同过滤的推荐是推荐系统中应用最广泛、最有效的推荐策略。它于20世纪90年代出现,促进了推荐系统的发展。协同过滤的基本思想是聚类。

比如,如果周围很多朋友选择了某种商品,那么自己大概率也会选择该商品;或者用户选择了某种商品,当看到类似商品且其他人对该商品评价很高时,则购买这个商品的概率就会很高。

协同过滤又分为三种:基于用户的协同过滤、基于项目的协同过滤、基于模型的协同过滤。

基于用户的协同过滤

1)基于用户的协同过滤的基本思想是首先找到与目标用户兴趣相似的用户集合,然后找到这个集合中用户喜欢并且没有听说过的物品推荐给目标用户。

图2-7是基于用户的协同过滤的实现逻辑。

用户A喜欢商品A和商品C,用户C喜欢商品A、商品C和商品D,用户A和用户C具有相似的兴趣爱好,因此把商品D推荐给用户A。


▲图2-7 基于用户的协同过滤

基于项目的协同过滤

2)基于项目的协同过滤的基本思想是基于所有用户对推荐对象的评价的推荐策略。

如果大部分用户对一些推荐对象的评分较为相似,那么当前用户对这些推荐对象的评价也相似。然后,将相似推荐对象中用户未进行评价的商品推荐给用户。

总之,基于项目的协同过滤就是根据用户对推荐对象的评价,发现对象间的相似度,根据用户的历史偏好将类似的商品推荐给该用户。

图2-8是基于项目的协同过滤的实现逻辑。

用户A喜欢商品A和商品C,用户B喜欢商品A、商品B和商品C,用户C喜欢商品A,通过这些用户的喜好可以判定商品A和商品C相似,喜欢商品A的用户同时也喜欢商品C,因此给喜欢商品A的用户C也推荐了商品C。

▲图2-8 基于项目的协同过滤

基于模型的协同过滤

3)基于模型的协同过滤的基本思想是基于样本用户的喜好信息训练一个推荐模型,然后根据实时的用户喜好信息进行推荐。

其和上述两种协同推荐的不同点在于先对已有数据应用统计和机器学习的方法得到模型,再进行预测。常用的方法有机器学习方法、统计模型、贝叶斯模型和线性回归模型等。

基于协同过滤推荐

优点有:

  • 可以使用在复杂的非结构化对象上;

  • 能够发现用户新的兴趣爱好,给用户带来惊喜;

  • 以用户为中心的自动推荐,随着用户数量的增加,用户体验也会越来越好。

缺点有:

  • 存在冷启动问题,即在没有大量用户数据的情况下,用户可能不满意获得的推荐结果;

  • 存在稀疏性问题,即用户大量增长的同时,评价差异性会越来越大,推荐对象也越来越多,导致大量的

  • 荐对象没有经过用户评价,部分用户无法获得推荐结果,部分推荐对象无法被推荐。

3. 混合推荐方法

各种推荐方法都会存在优缺点。在实际应用中,我们可以采用推荐策略的组合方式,即混合推荐方法。

目前,使用最多的混合推荐方法就是把基于内容的推荐和协同过滤推荐组合。根据应用场景的不同,组合的方式也不尽相同,主要有两种混合方式。

推荐结果混合

将多种推荐方法产生的结果通过某种方式进行混合计算而产生最终的推荐结果。

如何从多个推荐结果中选出推给用户的最终结果成为混合推荐的关键。

常见的机制是投票机制,即使用一定的标准对多个结果进行判断,选择其中之一。

推荐算法的混合

以某一种推荐策略作为框架,混合另外的推荐策略,如基于协同过滤推荐的框架混合基于内容的推荐策略。

04 搜索与推荐的区别

搜索和推荐都是用户解决信息过载的有效手段,能够帮助用户快速准确地定位到想要的信息。

互联网上搜索和推荐这两种方式大量并存,它们之间到底有怎样的区别呢?

1. 按照用户意图是否明确,我们可以将两者进行区分

搜索引擎是一种用户意图明确的信息检索方式,用户能够提供查询关键词,指引搜索引擎查询相关内容。

这个过程是用户主动发起的。反之,当用户意图不够明确时,推荐系统就能够满足用户此时的需求。

比如音乐播放器根据用户的喜好和历史行为给出用户推荐列表,电商平台根据购买、浏览等记录给出用户可能喜欢的商品列表,这些都是用户在意图不明确的时候被动接受的内容。也正是因为推荐系统不需要明确的搜索内容,所以能够满足用户难以用文字表述的需求。

2. 两者个性化区别

当用户在输入想要检索的内容时,搜索引擎展示的结果基本固定,个性化程度较低。

推荐系统的个性化程度较高,因为推荐并没有一个标准的答案。

推荐系统可以根据每位用户的历史观看行为、评分记录等生成一个当下对用户最有价值的结果,这也是推荐系统独特的魅力。

3. 评价标准不同

搜索质量的重要评价标准是能否帮用户快速找到准确的结果,因此搜索引擎的排序算法需要尽量把最好的结果放到前面。总而言之,“好”的搜索算法需要让用户获取信息的效率更高,停留时间更短。

搜索引擎常用的评价指标有:归一化折损累计增益(nDCG)、精准度–召回率(Precision-Recall)等。

而推荐系统则希望用户被所推荐的内容吸引,停留更长的时间,有更多的持续性动作。对用户兴趣挖掘的越深,推荐的成功率也就越高。

推荐系统的评价面要更加宽泛,推荐结果的数量也更多,出现的位置、场景也更加复杂。

对于Top N推荐,MAP或CTR是普遍的评价方法;对于评分预测问题,RMSE或MAE是常见量化方法。

4. 马太效应和长尾理论

由于用户使用搜索引擎是为了快速找到结果,因此绝大部分用户的点击集中在排列较靠前的结果上,而排列靠后的结果以及翻页后的内容很少被关注。这就是著名的马太效应,即热门物品受到更多的关注,冷门物品则越被遗忘的现象。

长尾理论是指冷门物品的种类远远高于热门物品的种类。在电商领域,如果这些长尾物品被充分挖掘,其带来的价值可能会超过热门物品所带来的价值。

推荐系统能够发现被“遗忘”的非热门的物品,将长尾资源盘活和利用,引起用户的注意,挖掘用户的兴趣,提供给用户更多的选择。而且,依赖热门内容可能会导致潜在客户的流失。

什么是推荐系统?应用场景有哪些?相关推荐

  1. 推荐系统多场景联合建模经验

    1.前言 设计范式(Design Pattern)是各位码农都应该熟悉的概念.Design Pattern针对软件开发普遍存在的各种问题,提出可复用解决方案.同时,Design Pattern也为程序 ...

  2. 详解TF-Ranking:Google开源的排序框架,应用于邮件检索、推荐系统等场景

    今天分享的是一个有关LTR框架的介绍,LTR是Learning-To-Rank,解决的是排序问题.排序问题在人工智能领域应用很广,比如在Gmail里搜索一个关键词,返回最匹配的邮件.再比如进入Goog ...

  3. 设计理财产品推荐系统场景

    理财产品推荐系统 1. 场景设计 2. 解决方案 3. 业务概述 4. 代码落地 5. 测试 1. 场景设计 场景:理财产品推荐系统 背景:某金融公司提供各种理财产品,每个产品有不同的收益.风险.投资 ...

  4. 赠书 | 从阿里到Facebook,一线大厂这样做深度学习推荐系统

    本文内容节选自<深度学习推荐系统>一书. 由美国Roku推荐系统架构负责人.前Hulu高级研究员王喆精心编著,书中包含了这场革命中一系列的主流技术要点:深度学习推荐模型.Embedding ...

  5. 推荐系统发展的六大影响因子 | 深度

    作者丨gongyouliu 来源 | 大数据与人工智能(ID: ai-big-data) 随着科学技术的进步,移动互联网快速发展,手机越来越便宜,拥有智能手机不再是一件遥不可及的事情,互联网用户规模已 ...

  6. 如何正确应用推荐系统!

    推荐系统活动 内容:推荐系统应用.人工智能数据基础 深度学习技术的飞速发展,加速了人工智能在互联网领域.以及传统行业的商业落地等等.其中推荐系统发展较快,是因为与商业变现有着密不可分的联系.抖音依靠推 ...

  7. 在推荐系统中,我还有隐私吗?联邦学习:你可以有

    2020-11-19 15:38:41 机器之心分析师网络 作者:仵冀颖 编辑:H4O 在推荐系统无所不在的网络环境中,用户越来越强烈地意识到自己的数据是需要保密的.因此,能够实现隐私保护的推荐系统的 ...

  8. python进阶项目设计_推荐系统进阶:设计和构建推荐系统流程综述(1)

    内容目录推荐系统应用场景概述 为什么需要推荐? 推荐系统的目标? 推荐系统的工作? 推荐系统的基本模型 构建推荐系统的方法 相关参考? 1.推荐系统概述以及它们如何提供有效形式的定向营销 推荐系统 推 ...

  9. ACM Computing Surveys 2021:基于会话推荐系统的最新长文综述

    ©作者|Shoujin Wang 单位|麦考瑞大学博后 研究方向|机器学习.推荐系统 编者按:基于会话的推荐系统, 作为一种新兴的推荐系统范式,正方兴未艾,大量的新技术和新方法层出不穷.这篇综述给读者 ...

最新文章

  1. mybatis的缓存简说
  2. [HEOI2017] 相逢是问候
  3. FMPEG结构体分析:AVStream
  4. 【2015沈阳现场A】
  5. 计算机操作日志文件,查看电脑操作记录(LastActivityView)
  6. c++ 32位有符号的整数_【LeetCode】字符串分类字符串转换整数 (atoi)
  7. 统计SQL2005中数据库中的每张表的记录数
  8. 机器学习理论《统计学习方法》学习笔记:第五章 决策树
  9. [(IBUF driven by I/O terminal ) is unplaced after IO placer?
  10. ajax包含mysql吗_php 实例ajax与mysql怎么只查询出一条数据?
  11. 解决debian下看flash视频很卡的问题
  12. iOS 核心动画 Core Animation浅谈
  13. 由查找算法工程的类图分析组合模式
  14. mysql如何管理事务管理_浅谈MySQL事务管理(基础)
  15. 取消ajax请求时页面闪烁,基于JQuery的$.ajax方法进行异步请求导致页面闪烁的解决办法...
  16. nodejs脚本后台运行
  17. 个人CTF入门训练过程WriteUp
  18. ansys18.0安装教程
  19. RenderDoc塞尔达荒野之息抓帧分析
  20. linux系统显卡显存容量,Linux 查看显卡显存大小

热门文章

  1. 【SAP-PS笔记】项目报工之CATS与PS的集成
  2. mysql 单选题_智慧树初识数据库—Mysql单选题答案
  3. 尼葛洛庞帝:《数字化生存》
  4. 金风科技澳洲首座20兆瓦光伏电站将于2017年投产
  5. windows中cmd进入文件夹操作及相对路径
  6. layer.photos 点击图片放大查看
  7. 【开源框架】Android之史上最全最简单最有用的第三方开源库收集整理,有助于快速开发
  8. android开发学习之路——连连看之加载图片(三)
  9. 华硕php55超频,无意之中用了华硕自带的超频BIOS,终于内存插满16G也能稳定432了,不过顺序很重要...
  10. 向安卓模拟器中添加图片并显示