reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering
中英译本及下载:http://blog.sina.com.cn/s/blog_586631940100pduh.html
以下是摘要笔记:
算法应当结合用户的习惯,用户特点的分类
观影习惯是比较单一 还是比较分散
这是不同的
一、推荐的宗旨:推荐应该要帮助顾客找到和发现新的、相关的、有趣的商品。
Recommendations should help a customer find and discover new, relevant, and interesting items.
二、解决推荐问题有三个通常的途径:传统的协同过滤,聚类模型,以及基于搜索的方法。
推荐算法
大多数推荐算法,都始于先找出一个顾客集合,他们买过和评级过的商品,与当前用户买过和评级过的商品有重叠。算法把来自这些相似顾客的商品聚集起来,排除该用户已经购买过或评级过的商品,并向该用户推荐其余的商品。
这些算法有两个最常见的版本:协同过滤和聚类模型。其他算法——包括基于搜索的方法以及我们自己的商品到商品协同过滤——都集中于寻找相似的商品,而不是相似的顾客。针对用户所购买和评级的每一件商品,算法试图找到相似的产品,然后聚集这些相似的商品,并给予推荐。
1.传统的协同过滤
利用协同过滤来产生推荐,很耗计算,如果降维,则会影响品质。
2.聚类模型
算法的目标是,把该用户分配到含有最相似顾客的细分人群里,然后,算法再利用该细分顾客人群的购买和评级,来生成推荐。
较之协同过滤,聚类模型有更好的在线可扩展性和性能、复杂和昂贵的聚类计算会离线运行。然而,推荐品质却是低的
3.基于搜索的方法
基于搜索或内容的方法,将推荐问题视为相关商品的搜索,如果该用户只有少数购买或评级,基于搜索的推荐算法在计算量和性能上都不错。然而,对于有数千次购买的用户,要以针对所有商品的查询为基础也不太可行,若使用子集则又降低了品质。
三、电子商务推荐算法的环境挑战:
• 大型零售商有海量的数据,以千万计的顾客,以及数以百万计的登记在册的不同商品。
• 许多应用要求结果实时返回,在半秒之内,还要产生高质量的推荐。
• 新顾客很典型,他们的信息很有限,只能以少量购买或产品评级为基础。
• 较老的顾客信息丰沛,以大量的购买和评级为基础。
• 顾客数据不稳定:每一次交互都可提供有价值的顾客数据,算法必须立即对新的信息作出响应。
商品到商品的协同过滤
把推荐作为一种定向营销工具。(每有一个用户,就有一个用户的个性化商店)
它如何工作
协同过滤的变种,将商品分类,而不是用户
对于非常大的数据集,一个可扩展的推荐算法必须离线运行最昂贵的计算。而现有方法达不到这样的要求:
• 传统的协同过滤只做很少或不做离线计算,其在线计算量取决于顾客和登记在册商品的数量。在大数据集的情况下,这样的算法不可行,除非使用维度降低、抽样或区隔——所有这些都降低了推荐的品质。
• 聚类模型能离线运行大量的计算,但推荐品质相对较差。出于改进,可以增加人群细分的数量,但这会使在线的用户-细分人群的分类变得昂贵。
• 基于搜索的模型离线建立起关键词、范畴、作者索引,但不能提供符合兴趣、定向内容的推荐。对于购买和评级很多的顾客来说,这些算法的扩展性不佳。
商品到商品协同过滤的可扩展性和性能的关键是,它离线建立耗时巨大的相似商品表格。该算法的在线部分——针对当前用户的购买和评级来寻找相似的商品——计算量独立于商品目录的规模或顾客的总数;仅仅取决于该用户买过或评级过多少个商品。因此,甚至是对于超大数据集,算法也很快速。由于该算法能推荐高度关联的相似商品,推荐的品质就很出色10。与传统的协同过滤不同,该算法在用户数据有限的情况下也能运行良好,在少至2到3件商品的基础上,产生高品质的推荐。
连接:
http://blog.sina.com.cn/s/blog_586631940100pduh.html
http://www.xysay.com/amazon-item-to-item-collaborative-filtering-207.html
转载于:https://www.cnblogs.com/lance-/p/3935327.html
reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering相关推荐
- 【推荐系统论文精读系列】(一)--Amazon.com Recommendations
文章目录 一.摘要 二.推荐算法 三.传统协同过滤 四.聚类模型 五.基于搜索方式 六.基于物品的协同过滤 七.怎样工作? 八.可扩展性 九.总结 References 论文名称:Amazon.com ...
- 协同过滤(Collaborative Filtering):UserCF and Item CF
具体的学习资料可以参考王喆老师的<深度学习推荐系统>,已经梳理好了知识体系,我也将按照这个路线再次梳理一遍,同时做一些拓展和加深理解 一.前言 系统过滤曾是多年前推荐系统领域的应用最广泛的 ...
- Android --- RecyclerView 水平滑动时,一个 item 一个 item 的滑动,禁止滑动到一半停止
使用RecyclerView水平滑动显示item,一个item占整个屏幕宽度, 所以基本写法水平滑动不会一个item一个item的显示完整,而是各自显示一部分.因此这个不是我们想要的结果.效果就是像广 ...
- 【RS】Amazon.com recommendations: item-to-item collaborative filtering - 亚马逊推荐:基于物品的协同过滤...
[论文标题]Amazon.com recommendations: item-to-item collaborative filtering (2003,Published by the IEEE C ...
- android listview item 展开动画,android的ListView点击item使item展开的做法的实现代码
本文介绍了android的ListView点击item使item展开的做法的实现代码,分享给大家,具体如下: 效果图: 原理是点击item的时候,重新measure list的各个item的高度 li ...
- Code Style Guidelines for Contributors Reading Notes
Reading Notes: 1.You must handle every Exception in your code in some principled way. (if you are co ...
- 【PTA-python】第7章-1 词频统计 (30 分)--sys.stdin.read()读入到特定字符截至,双重排序条件key=lambda item:(-item[1], item[0])
第7章-1 词频统计 分析 双重排序条件:字典序,数字降序 题目 解法 自解 参考代码截断到`#`输入的代码 分析 遇到含有回车的无效输入,while循环如何处理.同过input()字符串不断串联起来 ...
- 《深度学习之TensorFlow》reading notes(3)—— MNIST手写数字识别之二
文章目录 模型保存 模型读取 测试模型 搭建测试模型 使用模型 模型可视化 本文是在上一篇文章 <深度学习之TensorFlow>reading notes(2)-- MNIST手写数字识 ...
- RRAM/ Near Memory Computing (NMC) Survey - Reading Notes 0707
Reading Notes of Resistive Random Access Memory – Day 2 Chapter 3 RRAM Characterization and Modeling ...
最新文章
- 近期苹果、Facebook等科技巨头股价缘何不断下跌?
- ogg 11.2 for mysql_配置ogg异构mysql-oracle 单向同步
- 挺起你作为一个中国人的脊梁骨
- 数据结构拾遗(3) --红黑树的设计与实现(下)
- JQuery如何与数据库交互
- Qt 信号-槽的同步与异步处理
- MySQL8.0忘记密码了如何修改密码
- MSP430 PIN 操作寄存器
- Django 2.0 报错解决方案----持续更新中
- VC dxgi 截屏保存bmp文件
- 用c语言实现香农编码,单链表实现香农编码(C++)——二牛原创
- 中华石杉Java面试突击第一季笔记二(分布式搜索引擎)
- 不规则数据排序 Python sort sorted
- xd使用技巧_adobe xd高级技巧
- bandit-Python代码审计工具
- 虚拟机包OVF和OVA的区别
- 关于ES2020语法2345加速浏览器不兼容问题
- 错过就要多花 200 元,Unite 2017 Shanghai 五折抢票倒计时!
- 学linux好找工作吗?未来可以从事什么岗位?
- Qt的工程组织-.pro、.pri、.prf、.prl