ItemCF,基于物品的协同过滤算法
转载自 ItemCF,基于物品的协同过滤算法
ItemCF:Item Collaboration Filter,基于物品的协同过滤
算法核心思想:给用户推荐那些和他们之前喜欢的物品相似的物品。
比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。
==>该算法认为,物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B。
基于物品的协同过滤算法主要分为两步:
一、计算物品之间的相似度;
二、根据物品的相似度和用户的历史行为给用户生成推荐列表;
下面分别来看这两步如何计算:
一、计算物品之间的相似度:
我们使用下面的公式定义物品的相似度:
其中,|N(i)|是喜欢物品i的用户数,|N(j)|是喜欢物品j的用户数,|N(i)&N(j)|是同时喜欢物品i和物品j的用户数。
从上面的定义看出,在协同过滤中两个物品产生相似度是因为它们共同被很多用户喜欢,两个物品相似度越高,说明这两个物品共同被很多人喜欢。
这里面蕴含着一个假设:就是假设每个用户的兴趣都局限在某几个方面,因此如果两个物品属于一个用户的兴趣列表,那么这两个物品可能就属于有限的几个领域,而如果两个物品属于很多用户的兴趣列表,那么它们就可能属于同一个领域,因而有很大的相似度。
举例,用户A对物品a、b、d有过行为,用户B对物品b、c、e有过行为,等等;
依此构建用户——物品倒排表:物品a被用户A、E有过行为,等等;
建立物品相似度矩阵C:
其中,C[i][j]记录了同时喜欢物品i和物品j的用户数,这样我们就可以得到物品之间的相似度矩阵W。
在得到物品之间的相似度后,进入第二步。
二、根据物品的相似度和用户的历史行为给用户生成推荐列表:
ItemCF通过如下公式计算用户u对一个物品j的兴趣:
其中,Puj表示用户u对物品j的兴趣,N(u)表示用户喜欢的物品集合(i是该用户喜欢的某一个物品),S(i,k)表示和物品i最相似的K个物品集合(j是这个集合中的某一个物品),Wji表示物品j和物品i的相似度,Rui表示用户u对物品i的兴趣(这里简化Rui都等于1)。
该公式的含义是:和用户历史上感兴趣的物品越相似的物品,越有可能在用户的推荐列表中获得比较高的排名。
下面是一个书中的例子,帮助理解ItemCF过程:
至此,基础的ItemCF算法小结完毕。
下面是书中提到的几个优化方法:
(1)、用户活跃度对物品相似度的影响
即认为活跃用户对物品相似度的贡献应该小于不活跃的用户,所以增加一个IUF(Inverse User Frequence)参数来修正物品相似度的计算公式:
用这种相似度计算的ItemCF被记为ItemCF-IUF。
ItemCF-IUF在准确率和召回率两个指标上和ItemCF相近,但它明显提高了推荐结果的覆盖率,降低了推荐结果的流行度,从这个意义上说,ItemCF-IUF确实改进了ItemCF的综合性能。
(2)、物品相似度的归一化
Karypis在研究中发现如果将ItemCF的相似度矩阵按最大值归一化,可以提高推荐的准确度。其研究表明,如果已经得到了物品相似度矩阵w,那么可用如下公式得到归一化之后的相似度矩阵w':
最终结果表明,归一化的好处不仅仅在于增加推荐的准确度,它还可以提高推荐的覆盖率和多样性。
用这种相似度计算的ItemCF被记为ItemCF-Norm。
以上内容参考自《推荐系统实践》
ItemCF,基于物品的协同过滤算法相关推荐
- [推荐算法]ItemCF,基于物品的协同过滤算法
[推荐算法]ItemCF,基于物品的协同过滤算法 标签: ItemCF基于用户的协同过滤算法 2015-03-09 15:11 4144人阅读 评论(1) 收藏 举报 本文章已收录于: 分类: ...
- 推荐算法 itemcf java_推荐系统之基于物品的协同过滤算法(ItemCF)
推荐系统之基于物品的协同过滤算法(ItemCF) 发布时间:2018-03-04 16:55, 浏览次数:1778 , 标签: ItemCF 推荐系统之基于物品的协同过滤算法(ItemCF) 前端时间 ...
- 推荐系统实践(二)----基于物品的协同过滤算法(ItemCF)
上一篇博客我简单讲了一下基于用户的协同过滤算法,这里我们一起来学习一下另一种:基于物品的协同过滤算法.基于物品的协同过滤算法是目前业界应用最多的算法,亚马逊.Netflix.Hulu.YouTub ...
- 基于物品的协同过滤算法ItemCF
基于物品的协同过滤算法ItemCF 基于item的协同过滤,通过用户对不同item的评分来评测item之间的相似性,基于item之间的相似性做出推荐.简单来讲就是:给用户推荐和他之前喜欢的物品相似的物 ...
- Hadoop案例之基于物品的协同过滤算法ItemCF
Hadoop案例之基于物品的协同过滤算法ItemCF 转载自:http://blog.csdn.net/qq1010885678/article/details/50751607?locationNu ...
- 使用Spark DataFrame实现基于物品的协同过滤算法(ItemCF)
简书不支持Markdown Math语法,请移步https://glassywing.github.io/2018/04/10/spark-itemcf/ 简介 当前spark支持的协同过滤算法只有A ...
- 【推荐系统】基于物品的协同过滤算法
基于物品的协同过滤算法 目前业界应用最多的算法. 给用户推荐和他们之前喜欢的物品相似的物品. 其主要通过分析用户的行为记录计算物品之间的相似度.物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都 ...
- 基于物品的协同过滤推荐算法_《推荐系统实践》3.基于物品的协同过滤算法
基于物品的协同过滤算法(item-based collaborative filtering,以下简称ItemCF)算法思想:给用户推荐那些和他们之前喜欢的物品相似的物品. 不过,ItemCF算法并不 ...
- 【推荐系统】{2} —— 基于物品的协同过滤算法
协同过滤(英语:Collaborative Filtering,简称CF),简单来说是利用某兴趣相投.拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人透过合作的机制给予信息相当程度的回应(如评分) ...
最新文章
- C - Catch That Cow POJ - 3278
- 将字符串转换为DateTime
- ORACLE 日期查询
- 【Android 应用开发】 Android APK 反编译 混淆 反编译后重编译
- R语言switch语句报错Error: duplicate ‘switch‘ defaults
- 《zabbix中文支持》-4
- Nginx源码分析 - 主流程篇 - 模块的初始化(12)
- Windows Mobile 获得 MAC,IP,IMEI,IMSI
- jsp访问web-inf下的spring配置文件
- java messagelistener_MessageListenerAdapter
- 下行文格式图片_正确的公文格式图片.doc
- halcon模板匹配快速入门
- 晨光文具去年赚5亿,连2000元都拿来理财
- mcafee 8.5i杀毒软件规则配置
- 教程 | 10分钟成为简笔画达人 6(POP字体+简笔技法)
- 金仓数据库KingbaseES ksql工具用户指南及参考--2. Ksql快速启动
- s/μs/ns/ps与Hz/KHz/MHz/GHz换算关系
- Click Once使用总结
- c语言表达式 amp amp,amp;amp;在C语言中是什么意思
- HTC-quietly brilliant(谦和卓越)
热门文章
- 字符串匹配经典题目——KMP算法(Leetcode题解-Python语言)
- 创新视角下的复盘 | 2021/08/01-2021/09/30
- [Java基础]Lambda表达式和匿名内部类的区别
- [蓝桥杯2019初赛]迷宫-bfs+存储路径
- 激光炸弹(二维前缀和问题)
- 莫比乌斯,欧拉函数题目练习(完结)
- P6282 [USACO20OPEN] Cereal S 思维
- Educational Codeforces Round 75 (Rated for Div. 2) E2. Voting (Hard Version) 贪心
- P1972 [SDOI2009]HH的项链
- H - Prince and Princess 计蒜客 - 42402