中英译本及下载:http://blog.sina.com.cn/s/blog_586631940100pduh.html

以下是摘要笔记:

算法应当结合用户的习惯,用户特点的分类

观影习惯是比较单一 还是比较分散

这是不同的

一、推荐的宗旨:推荐应该要帮助顾客找到和发现新的、相关的、有趣的商品。

Recommendations should help a customer find and discover new, relevant, and interesting items.

二、解决推荐问题有三个通常的途径:传统的协同过滤,聚类模型,以及基于搜索的方法。

推荐算法
大多数推荐算法,都始于先找出一个顾客集合,他们买过和评级过的商品,与当前用户买过和评级过的商品有重叠。算法把来自这些相似顾客的商品聚集起来,排除该用户已经购买过或评级过的商品,并向该用户推荐其余的商品。

这些算法有两个最常见的版本:协同过滤聚类模型。其他算法——包括基于搜索的方法以及我们自己的商品到商品协同过滤——都集中于寻找相似的商品,而不是相似的顾客。针对用户所购买和评级的每一件商品,算法试图找到相似的产品,然后聚集这些相似的商品,并给予推荐。

1.传统的协同过滤

利用协同过滤来产生推荐,很耗计算,如果降维,则会影响品质。

2.聚类模型

算法的目标是,把该用户分配到含有最相似顾客的细分人群里,然后,算法再利用该细分顾客人群的购买和评级,来生成推荐。

较之协同过滤,聚类模型有更好的在线可扩展性和性能、复杂和昂贵的聚类计算会离线运行。然而,推荐品质却是低的

3.基于搜索的方法
基于搜索或内容的方法,将推荐问题视为相关商品的搜索,如果该用户只有少数购买或评级,基于搜索的推荐算法在计算量和性能上都不错。然而,对于有数千次购买的用户,要以针对所有商品的查询为基础也不太可行,若使用子集则又降低了品质。

三、电子商务推荐算法的环境挑战:
• 大型零售商有海量的数据,以千万计的顾客,以及数以百万计的登记在册的不同商品。
• 许多应用要求结果实时返回,在半秒之内,还要产生高质量的推荐。
• 新顾客很典型,他们的信息很有限,只能以少量购买或产品评级为基础。
• 较老的顾客信息丰沛,以大量的购买和评级为基础。
• 顾客数据不稳定:每一次交互都可提供有价值的顾客数据,算法必须立即对新的信息作出响应。

商品到商品的协同过滤

把推荐作为一种定向营销工具。(每有一个用户,就有一个用户的个性化商店)

它如何工作

协同过滤的变种,将商品分类,而不是用户

对于非常大的数据集,一个可扩展的推荐算法必须离线运行最昂贵的计算。而现有方法达不到这样的要求:
• 传统的协同过滤只做很少或不做离线计算,其在线计算量取决于顾客和登记在册商品的数量。在大数据集的情况下,这样的算法不可行,除非使用维度降低、抽样或区隔——所有这些都降低了推荐的品质。
• 聚类模型能离线运行大量的计算,但推荐品质相对较差。出于改进,可以增加人群细分的数量,但这会使在线的用户-细分人群的分类变得昂贵。
• 基于搜索的模型离线建立起关键词、范畴、作者索引,但不能提供符合兴趣、定向内容的推荐。对于购买和评级很多的顾客来说,这些算法的扩展性不佳。
商品到商品协同过滤的可扩展性和性能的关键是,它离线建立耗时巨大的相似商品表格。该算法的在线部分——针对当前用户的购买和评级来寻找相似的商品——计算量独立于商品目录的规模或顾客的总数;仅仅取决于该用户买过或评级过多少个商品。因此,甚至是对于超大数据集,算法也很快速。由于该算法能推荐高度关联的相似商品,推荐的品质就很出色10。与传统的协同过滤不同,该算法在用户数据有限的情况下也能运行良好,在少至2到3件商品的基础上,产生高品质的推荐。

连接:

http://blog.sina.com.cn/s/blog_586631940100pduh.html

http://www.xysay.com/amazon-item-to-item-collaborative-filtering-207.html

转载于:https://www.cnblogs.com/lance-/p/3935327.html

reading notes -- Amazon.com Recommendations: Item-to-Item Collaborative Filtering相关推荐

  1. 【推荐系统论文精读系列】(一)--Amazon.com Recommendations

    文章目录 一.摘要 二.推荐算法 三.传统协同过滤 四.聚类模型 五.基于搜索方式 六.基于物品的协同过滤 七.怎样工作? 八.可扩展性 九.总结 References 论文名称:Amazon.com ...

  2. 协同过滤(Collaborative Filtering):UserCF and Item CF

    具体的学习资料可以参考王喆老师的<深度学习推荐系统>,已经梳理好了知识体系,我也将按照这个路线再次梳理一遍,同时做一些拓展和加深理解 一.前言 系统过滤曾是多年前推荐系统领域的应用最广泛的 ...

  3. Android --- RecyclerView 水平滑动时,一个 item 一个 item 的滑动,禁止滑动到一半停止

    使用RecyclerView水平滑动显示item,一个item占整个屏幕宽度, 所以基本写法水平滑动不会一个item一个item的显示完整,而是各自显示一部分.因此这个不是我们想要的结果.效果就是像广 ...

  4. 【RS】Amazon.com recommendations: item-to-item collaborative filtering - 亚马逊推荐:基于物品的协同过滤...

    [论文标题]Amazon.com recommendations: item-to-item collaborative filtering (2003,Published by the IEEE C ...

  5. android listview item 展开动画,android的ListView点击item使item展开的做法的实现代码

    本文介绍了android的ListView点击item使item展开的做法的实现代码,分享给大家,具体如下: 效果图: 原理是点击item的时候,重新measure list的各个item的高度 li ...

  6. Code Style Guidelines for Contributors Reading Notes

    Reading Notes: 1.You must handle every Exception in your code in some principled way. (if you are co ...

  7. 【PTA-python】第7章-1 词频统计 (30 分)--sys.stdin.read()读入到特定字符截至,双重排序条件key=lambda item:(-item[1], item[0])

    第7章-1 词频统计 分析 双重排序条件:字典序,数字降序 题目 解法 自解 参考代码截断到`#`输入的代码 分析 遇到含有回车的无效输入,while循环如何处理.同过input()字符串不断串联起来 ...

  8. 《深度学习之TensorFlow》reading notes(3)—— MNIST手写数字识别之二

    文章目录 模型保存 模型读取 测试模型 搭建测试模型 使用模型 模型可视化 本文是在上一篇文章 <深度学习之TensorFlow>reading notes(2)-- MNIST手写数字识 ...

  9. RRAM/ Near Memory Computing (NMC) Survey - Reading Notes 0707

    Reading Notes of Resistive Random Access Memory – Day 2 Chapter 3 RRAM Characterization and Modeling ...

最新文章

  1. 近期苹果、Facebook等科技巨头股价缘何不断下跌?
  2. ogg 11.2 for mysql_配置ogg异构mysql-oracle 单向同步
  3. 挺起你作为一个中国人的脊梁骨
  4. 数据结构拾遗(3) --红黑树的设计与实现(下)
  5. JQuery如何与数据库交互
  6. Qt 信号-槽的同步与异步处理
  7. MySQL8.0忘记密码了如何修改密码
  8. MSP430 PIN 操作寄存器
  9. Django 2.0 报错解决方案----持续更新中
  10. VC dxgi 截屏保存bmp文件
  11. 用c语言实现香农编码,单链表实现香农编码(C++)——二牛原创
  12. 中华石杉Java面试突击第一季笔记二(分布式搜索引擎)
  13. 不规则数据排序 Python sort sorted
  14. xd使用技巧_adobe xd高级技巧
  15. bandit-Python代码审计工具
  16. 虚拟机包OVF和OVA的区别
  17. 关于ES2020语法2345加速浏览器不兼容问题
  18. 错过就要多花 200 元,Unite 2017 Shanghai 五折抢票倒计时!
  19. 学linux好找工作吗?未来可以从事什么岗位?
  20. Qt的工程组织-.pro、.pri、.prf、.prl

热门文章

  1. C#操作sql通用类 SQLHelper
  2. 如何开展软件架构之概念架构
  3. PHP foreach 小结
  4. matplotlib一些常用知识点的整理,
  5. npy一维数组如何对给出的索引进行反选
  6. Java 8 新特性之Stream API
  7. 拿什么拯救你,我的面试之——从零打卡刷Leetcode(No.003)
  8. cell 各自的高度不同的时候
  9. 10个关于linux中Squid代理服务器的实用面试问答
  10. Redis(1):简介