认知流行度

流行度(popularity)

  • 内容的流行程度,也称之为热度,最常见的是将榜单中热度的内容推荐给用户(微博热搜,TopN商品)
  • 基于流行度的推荐是围绕流行度计算产生的推荐模型(不仅是TopN)
  • 解决冷启动问题 => 根据流行度来推荐商品的算法,也就是什么内容吸引用户,就给用户推荐什么内容
  • 解决冷启动问题 => 根据流行度来推荐商品的算法,也就是什么内容吸引用户,就给用户推荐什么内容

流行度的衡量

  • 流行度有多种度量的方式,可粗可细
  • 一段时间内的:总数Count,相对值Ratio,可能性Possibility
  • 某个item被用户反馈的次数,用户热度/用户总数,比如点击率、观看率,完播率

影响流行度的因素

  • 时间因素:电影上映的阶段(上映前,前3天,上映中期,尾声);用户使用的时间(早上,中午,晚上)
  • 空间因素:用户所在的位置,比如某个电影在南方和北方票房的差别,地域属性;某个餐厅在不同位置的流行度
  • 社会心理的因素:一个商品,歌曲是否流行,未必代表它本身质量好坏,与从众心理也有关,社会心理学家阿西曾经做过验证从众心理的实验,结果表明测试者中大约有2/3到3/4的人都具有从众行为 => 从众心理是普遍现象。
  • 个性VS群体:环境压力,个体容易受到群体的影响,在群体中个性会被淹没,群体思想将会占主导地位。除此之外经济利益最大化,群体行为采用该群体利益最大化的方式,节省分析成本,直接follow群体行为。

从数据集中了解流行度的趋势

  • 在MovieLens数据集中,5分和1分所占比例很小,但对于系统来说价值最大
    (Youtube中5分和1分的价值最大)。
  • 高流行度的item所占比例很小
  • 低流行度的item评分差异大(越不流行=>自己的喜好来判断)
  • 高流行度的item评分差异小(越流行=>群体的喜好影响力大)
  • 高中低评分的电影,评分随时间变化的趋势相似
  • 评分随时间的变化趋势,都是先升高再降低=> 评分趋势随时间的变化规律很重要
  • 高流行度的item,评分波动越小,反之低流行度的item,评分波动大=> 用户的从众心理

冷启动问题

  • 当用户行为信息不足时,采用非个性化推荐
  • 算法本质,什么内容吸引用户,就给用户推荐什么内容
  • 但同时也需要有代表性和区分性,即不能太大众化或老少皆宜 => 无法区分用户的兴趣
  • 多样性,用户兴趣的可能性很多,为了匹配兴趣的多样性 => 提供具有较高覆盖率的启动item集合(这些物品能覆盖主流的用户兴趣)

流行度VS个性化推荐

  • 长尾理论,市场上冷门产品所占据的共同市场份额不低于热门产品所占据的市场份额。因为热门商品需求很高,但数量少。相反,单个冷门商品需求少,但数据量巨大
  • 流行度较高的item,较少体现用户个性
  • 流行度较低的item,更能代表用户个性(兴趣),计算用户相似度更准确,所以,=> 我们在计算相似度推荐的时候,可以推荐相似度高,但不流行的item

流行度对于推荐结果的影响

  • 在推荐系统中,推荐度不仅仅与用户和item的交互次数有关,还得考虑item的流行度。
  • 所以,需要引入权重因子,对热度较高的item进行相应的惩罚。
    weight  − r ( i ) = 1 log ⁡ ( 1 + i t e m _ p o p ( i ) ) \text { weight }_{-} r(i)=\frac{1}{\log (1+i t e m\_p o p(i))}  weight −​r(i)=log(1+item_pop(i))1​
  • 进行TopN推荐的时候,既考虑反馈次数,也要考虑流行度的降权影响
    即 n u m ( i ) ∗ w e i g h t _ r ( i ) num(i) * weight\_r(i) num(i)∗weight_r(i),然后进行TopN推荐

考虑推荐系统本身的特性

  • Netflix研究表明,新用户在冷启动阶段更倾向于热门排行榜的,老用户会更加需要长尾推荐。
    => 对于新用户,采用非个性化推荐(基于流行度的推荐)
    => 对于老用户,可以考虑高流行度对商品推荐的降权影响,挖掘长尾
  • 对于不同业务,推荐的着重点也相应不同。例如电商网站,比如唯品会特卖,目标是打造爆款;而婚恋网站,比如世纪佳缘,目标是让更多人活跃起来
  • 推荐系统本身也具有脆弱性,很多人会利用该漏洞制造热门item,增加自身流量。原因是协同过滤的原理就是挖掘相似的用户,通过他们的行为进行推荐。
  • 推荐系统需要多项指标进行评估,包括精准率,多样性,新颖度,覆盖率等,避免一位的基于流行度进行推荐,产生信息茧房。

RS推荐系统-基于流行度的推荐相关推荐

  1. 《推荐系统笔记(十五)》流行度以及基于流行度的推荐

    基于流行度的推荐是围绕着流行度的计算给出的推荐.那么,如何定义流行度呢? 流行度有很多定义或者计算方法,比如, 简单统计一段时间内的物品的购买次数, 或者更加复杂的基于概率论的计算方法 无论流行度计算 ...

  2. 推荐系统-基于内容的推荐算法(Content-Based)

    基于内容的推荐算法(Content-Based) 简介 基于内容的推荐方法是非常直接的,它以物品的内容描述信息为依据来做出的推荐,本质上是基于对物品和用户自身的特征或属性的直接分析和计算. 例如,假设 ...

  3. 推荐系统--基于图的推荐算法

    基于图的模型(graph−basedmodel )是推荐系统中的重要内容.在研究基于图的模型之前,首先需要将用户行为数据表示成图的形式.这里我们将用户行为数据用二分图表示,例如用户数据是由一系列的二元 ...

  4. 推荐系统 - 基于标签的推荐算法

    标签在我们日常生活中很常见,打标签作为一种重要的用户行为,蕴含了很多用户兴趣信息,因此深入研究和利用用户打标签的行为可以很好地指导我们改进个性化推荐系统的推荐质量.举个例子,下图是酷我音乐的标签,有了 ...

  5. 图神经网络 推荐系统,基于神经网络的推荐

    1.如何在浏览器使用synaptic.js训练简单的神经网络推荐系统 Internet Explorer (6.0)从顶部的菜单中选择 " 工具" . 选择 " Inte ...

  6. python推荐系统-python 新闻推荐系统(基于新闻内容推荐)

    # -*- coding:utf-8 -*- __version__ = '1.0.0.0' """ @brief : 基于新闻的内容推荐系统 @details: 详细信 ...

  7. 推荐系统-------------基于UGC的推荐

    用户用标签描述对物品的看法,所以用户生成标签(UGC)是联系用户和物品的纽带,也是反应用户兴趣的重要数据源. 一个用户标签行为的数据集一般有一个三元组(用户,物品,标签)的集合组成,其中一条记录(a, ...

  8. 基于特征的推荐算法【转】

    http://in.sdo.com/?p=2779 推荐算法准确度度量公式: 其中,R(u)表示对用户推荐的N个物品,T(u)表示用户u在测试集上喜欢的物品集合. 集合相似度度量公式(N维向量的距离度 ...

  9. ML之RS:基于用户的CF+LFM实现的推荐系统(基于相关度较高的用户实现电影推荐)

    ML之RS:基于用户的CF+LFM实现的推荐系统(基于相关度较高的用户实现电影推荐) 目录 输出结果 实现代码 输出结果 实现代码 #ML之RS:基于CF和LFM实现的推荐系统 import nump ...

最新文章

  1. Nature Human Behavior:大脑对不公平的反应有助预测抑郁症
  2. 检查人物身上指定物品位置是否佩带指定物品名称
  3. C++阶段01笔记02【数据类型(整型、sizeof关键字、实型(浮点型)、字符型、转义字符、字符串型、布尔类型 bool、数据的输入)】
  4. Linux命令修复方法,在Linux终端运行sudoedit -s /命令看未修复和已修复的效果
  5. CEdit CRichEdit 使用技巧(转)
  6. saltstack returners
  7. Linux系统管理_ACL访问控制-Redhat Enterprise 5
  8. UVA10258 ZOJ1837 Contest Scoreboard【结构排序】
  9. Spring 单元测试(Junit)
  10. mybatis基础_动态代理开发
  11. [网安实践II] 实验2. 密码学实验
  12. uchome数据字典
  13. 新手如何做抖音直播带货?新号如何快速获取直播推荐流量?
  14. [题]走廊泼水节——#最小生成树kru
  15. ABBYY FineReader Engine OCR 软件开发工具包深度解析
  16. 去除水晶报表小数点最后多余的0
  17. 每次打开EXCEL文件都会出现一个空白sheet1窗口
  18. 读书笔记:汇编语言 第三版 王爽 清华出版社 章六 章七 章八 章九 章十
  19. Javascript获取元素的xpath
  20. 江苏学生考计算机要多少分录取,江苏高考多少名可以上211 最低要考多少分

热门文章

  1. 蓝桥杯-----世纪末的星期
  2. JAVA学习33_Java 设计模式面试题
  3. Wiki: Web Collaboration
  4. php计件工资,宇阳计件工资管理系统
  5. linux跟踪内存检测原理,wooyun/Linux下基于内存分析的Rootkit检测方法.html at master · exitmsconfig/wooyun · GitHub...
  6. c语言pdb文件,VISUAL c+中的pdb文件及其作用
  7. 电脑开机密码忘记了怎么办?使用优盘重装系统
  8. 商业在用《蝙蝠对冲套利EA系统》及源码均出售--外汇多货币对冲ea策略对冲策略对冲套利对冲源码稳定盈利ea源码MQL源码
  9. 如何才能成为一个合格的项目负责人?
  10. similartext php,使用PHPsimilartext计算两个字符串相似度,similartext_PHP教程