http://bbs.aliyun.com/read/154433.html?spm=5176.7189909.0.0.gzyohy&fpage=2

看到主办方之前发的一篇文章里提到,这个购买行为 和 传统的评分过滤问题 还是很不一样的。

但为什么亚马逊 会使用 item-cf等协同过滤算法呢?

这里用item-cf算法为什么会这么差?

难道亚马逊 和天猫上的购买行为 有差别?

协同过滤的关键是要知道用户的显性反馈,即评分。
这个数据集根本就没有给评分,即便是利用购买来做评分,利用binary rate来做,正负例比例失调,购买带来的信息太少。
其他行为作为隐形反馈很难合理的加进SVD++进去。
总体的来说,同样是购物网站,因为数据集的不同,模型好坏不一样。
关于为啥淘宝不用那个好评中评差评来做rate,上淘宝的人都知道,一个差评和中评的影响太大,就算不是很满意也不会打中评的。
个人见解。

因为目标不同。评价推荐算法好坏的指标很多,这次是以用户最终购买来衡量。CF只说明你对这个可能有兴趣,看过耐克,给你推荐阿迪、NB或者别的,当然是有兴趣点击的,但是最终会不会买?不知道。第一步是兴趣的转化,比如点击,比如收藏,这之后还有购买转化。如果只是把源数据处理完,用经典算法或者已有的Toolkit跑一遍,调调参数拿到好的结果,竞赛无论是过程或者结果的意义都没那么大了。

用户的行为差异很大,从哪里看出来?数据里反映出来。

协同过滤是推荐的思想,对应也产生了一些想法。推荐的话,一般你买过的就不会给你推荐了。
但是预测你是否购买,和推荐的问题有些区别的。比如你上个月买过某品牌的零食,你这个月可能还会买相同的东西。还是要对观察数据,看看哪些特征有助于你预测。

亚马逊是推荐你去购买,所以只要推荐的商品是你可能感兴趣的就行。而我们做的是要去预测用户是否会购买,这个问题就大了,用户即使感兴趣也不一定会购买,你可以想想:亚马逊给你推荐了那么多图书,你买了几本它推荐的呢?

转:[大数据竞赛]协同过滤在这个问题上是否work相关推荐

  1. 大数据毕业设计 协同过滤商品推荐系统设计与实现

    文章目录 1 简介 2 常见推荐算法 2.1 协同过滤 2.2 分解矩阵 2.3 聚类 2.4 深度学习 3 协同过滤原理 4 系统设计 4.1 示例代码(py) 5 系统展示 5.1 系统界面 5. ...

  2. 开始报名啦!——第二届融360“天机”金融风控大数据竞赛火热来袭

    炎炎夏日正好是提升数据分析能力,成为数据科学家的好机会.由融360和统计之都共同主办的第二届融360"天机"金融风控大数据竞赛开始报名啦!不论你是什么学校什么专业,只要你对大数据和 ...

  3. AI大数据竞赛平台和网站

    http://2021全国大学生大数据竞赛含金量如何? - DataCastle数据城堡的回答 - 知乎 https://www.zhihu.com/question/490822570/answer ...

  4. 2022-2023赛季高职大数据竞赛-赛规任务剖析

    2023年高职大数据省赛,任务详解与参考实现. 2022-2023赛季高职大数据竞赛-赛规说明 2022-2023赛季高职大数据竞赛-赛规任务剖析 2022-2023赛季高职大数据竞赛(样题解析)-离 ...

  5. 广州成立大数据产业协同创新联盟

    "广州市大数据产业协同创新联盟"日前在广州成立,利用大数据"产学研资用"等企业和机构,希望建立"用数据决策.用数据管理"等管理机制并辅助提升 ...

  6. 在Kaggle上赢得大数据竞赛的技巧和窍门

    在Kaggle上赢得大数据竞赛的技巧和窍门 解决方案 平台 数据 应用 方法 阅读1906  原文:The tips and tricks I used to succeed on Kaggle  作 ...

  7. 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...

    阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!          天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...

  8. 大数据+社会化协同 菜鸟不菜成老师

    随着"双11"活动成为常态,价格虽然仍是吸引用户的重要因素,但将不再起决定性作用.消费者会越来越重视质量.售后和物流问题.今年双十一的事实已经证明,阿里旗下菜鸟网络的大数据+社会化 ...

  9. 赛后总结:第四届工业大数据竞赛注塑成型

    赛后总结:第四届工业大数据竞赛注塑成型 原文首发于我的公众号 前言 以第四届工业大数据竞赛虚拟量测任务为例,介绍大家的思路.自己代码乱写,导致不知道最后要复现的是哪个,加上工作上各种人员优化,就没有进 ...

最新文章

  1. 利用Powershell和ceye.io实现Windows账户密码回传
  2. boost::math::boost::math::interpolators::cardinal_cubic_b_spline用法的测试程序
  3. 无穷级数求和7个公式_大家看,用反证法判别级数敛散性(送微积分同学)!...
  4. 七大排序的个人总结(二) 归并排序(Merge
  5. context.Request.Files超过了最大请求长度
  6. 系统请求从桌面计算机还原所有数据,电脑怎么一键还原
  7. 工具类与工具函数 —— 素数相关
  8. mysql数据库无法启动_Mysql数据库无法启动问题的解决方案
  9. SRA 案例:关于华为开发者联盟基础服务文档内容的改进建议(华为开发者联盟文档深度体验官)
  10. UCOSII操作系统(一)--基础知识
  11. EXCEL中去掉单元格首尾空格,保留字符串中间空格
  12. HyperLynx(三十二)高速串行总线仿真(四)
  13. AR培训丨零基础制作第一个AR应用——AR绘本
  14. 人话解读LGPLv3
  15. 基于kettle实现数据采集
  16. 4个小故事,分分钟看懂人民币汇率
  17. Buddy 内存管理机制(下)
  18. wsdl地址是什么意思?是否可以通过浏览访问?为什么别人可以通过浏览器访问,我的不行 ,求高手解答
  19. 论PMI-ACP敏捷项目管理认证考前培训必要性
  20. 干货 | StarRocks在携程大住宿智能数据平台的应用

热门文章

  1. STM32固件库的安装与介绍
  2. python字典按value逆序排序_python 对字典按照value进行排序的方法
  3. pandas 删除 csv 中 unnamed 列
  4. python 打包wheel文件,自己的SDK包
  5. 二十八、顺序存储二叉树
  6. 【多标签文本分类】Improved Neural Network-based Multi-label Classification with Better Initialization ……
  7. 【文本分类】深入理解embedding层的模型、结构与文本表示
  8. 【文本分类】基于改进CHI和PCA的文本特征选择
  9. 如何创建 java虚拟机_Java虚拟机如何创建对象?
  10. Java新旧代码的比较_比较java新旧I/O的性能——以复制大文件为例