//2015年4月30日

//未完成

预处理:

刷点击用户

重复记录

一、模型跑不出分层,我们自己来分层

模型一:预测重复购买的 18/12548

模型二:对已买过的商品 43/43720

模型三:对已交互的,新品 124/302800

模型四:前一天加购物车的 51/1027

二、正例从何而来

全正例

三、业务熟练

发现加很多购物车的用户第二天的确买了很多,但他们买的不是昨天加购物车的商品

冲动型客户

用户分类:看了再买,买了再买

有些类型的商品可被同时购买多件

对从未在商品子集上购买商品,但在商品全集上购买过的用户的处理

12-12的数据怎么办

计算转化率时要去掉

如何利用前几天的购物车

一个人很多购物车,会买哪个?

四、观察算法结果

在此商品上行为多反而概率低。

新品的存在,且新品占了大部分

五、一些数据

504

商品:

160件已交互-36件以前被买过,124件以前没被买过-7件属于二次购买,143件不属于

344件未交互-94件以前被买过,250件以前没被买过

商品类:

213件不属于二次购买,47件属于二次购买,144件未交互品牌

58/1232

去掉当天购买的58/1033

+从未买过用户 47/954

去掉当天购买同类的58/930

当天已买过 4/100

大用户,转化率低于 4/100

转化率低于 10/281

几天购物车

50-64-67

阿里天池大数据竞赛(杂)相关推荐

  1. 阿里天池大数据竞赛——口碑商家客流量预测 A2

    阿里天池大赛koubeiyuce1 2017年二月份,天池大数据比赛,口碑商家客流量预测,参赛地址及详情: https://tianchi.shuju.aliyun.com/competition/i ...

  2. 9个比赛7进top10,阿里天池大数据竞赛思路分享

    向AI转型的程序员都关注了这个号

  3. 阿里天池大数据竞赛第一名,如何用AI检测肺癌

    向AI转型的程序员都关注了这个号

  4. 阿里天池大数据竞赛(一)用ODPS提取特征

    //2015年4月30日 提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征. 而在ODPS上却不一样,一条语句可以提取很多特征. 如提取最近1.2.3.4天四种行为的数量 重点是dec ...

  5. 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...

    阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!          天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...

  6. AI比赛-NER:“万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战

    大赛概况 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作.通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础.挑战旨在通过抽 ...

  7. 【TIANCHI】天池大数据竞赛(学习赛)--- 淘宝用户购物行为数据可视化分析

    目录 前言 一.数据集的来源和各个字段的意义 二.数据分析 1.引入库 2.读入数据 3.查看数据数量级 4.PV(Page View)/UV访问量 5.漏斗模型 6.用户购买商品的频次分析. 7.A ...

  8. 天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节

    癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望.而肺癌,在我国作为发病率.死亡率最高的一类癌症,伤害着无数家庭.在我国每年都有近60万人死于肺癌.然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节 ...

  9. 阿里天池大数据之移动推荐算法大赛总结及代码全公布

    移动推荐算法比赛已经结束了一个多星期了,现在写一篇文章来回顾一下自己的参赛历程. 首先,对不了解这个比赛的同学们介绍一下这个比赛(引用自官网): 赛题简介 2014年是阿里巴巴集团移动电商业务快速发展 ...

  10. 利用hive完成阿里天池大数据音乐预测比赛数据处理工作

    hive shell 创建外表,指定目录 CREATE EXTERNAL TABLE IF NOT EXISTS songs2 ( sid string, aid string, ptime stri ...

最新文章

  1. 逼格高又实用的 Linux 命令,运维同仁一定要懂
  2. IT兄弟连 JavaWeb教程 jQuery中其他AJAX支持的函数
  3. 【Matlab 图像】图像基础操作
  4. java线程实现方式
  5. Error querying database.Cause:java.sql.SQLSyntaxErrorException:ORA-00911:invalid character
  6. linux UID,GID,EUID,EGID,SUID,SGID
  7. LeetCode MySQL 1132. 报告的记录 II
  8. squid反向代理网站配置示例
  9. 转: 如何挑选适合的前端框架
  10. oracle 访问adf 慢,ORACLE ADF 问题总结
  11. 文件大小超过配置限制(2560000),代码洞察功能不可用怎么办?
  12. android TTS语音播报
  13. 微信小程序云开发实现微信小程序订阅消息服务通知教程
  14. 消费心理学(02):沉没成本
  15. android原生系统裁剪
  16. 小米MiSans字体安装教程
  17. 熟悉Hive 实验2
  18. licenses.licx文件
  19. 学生选课系统E-R图以及登录,选课流程图
  20. matlab getprmdflt,DFLT40A-7中文资料

热门文章

  1. VScode:禁止VScode自动升级
  2. [1]数学建模基础入门知识
  3. 0基础小白,如何入门数学建模?
  4. Maven之(五)Maven仓库
  5. 论文解读:Structural Optimization Makes Graph Classification Simpler and Better
  6. PostgreSQL - 官方手册、中文手册及Github项目地址
  7. 一起来学习Windows Mobile 6.5
  8. 驱动精灵修复服务器,驱动精灵一键修复系统组件工具
  9. Sopcast软件中凤凰卫视频道列表代码
  10. 别人口中的“蓉叶云库”