阿里天池大数据竞赛(杂)
//2015年4月30日
//未完成
预处理:
刷点击用户
重复记录
一、模型跑不出分层,我们自己来分层
模型一:预测重复购买的 18/12548
模型二:对已买过的商品 43/43720
模型三:对已交互的,新品 124/302800
模型四:前一天加购物车的 51/1027
二、正例从何而来
全正例
三、业务熟练
发现加很多购物车的用户第二天的确买了很多,但他们买的不是昨天加购物车的商品
冲动型客户
用户分类:看了再买,买了再买
有些类型的商品可被同时购买多件
对从未在商品子集上购买商品,但在商品全集上购买过的用户的处理
12-12的数据怎么办
计算转化率时要去掉
如何利用前几天的购物车
一个人很多购物车,会买哪个?
四、观察算法结果
在此商品上行为多反而概率低。
新品的存在,且新品占了大部分
五、一些数据
504
商品:
160件已交互-36件以前被买过,124件以前没被买过-7件属于二次购买,143件不属于
344件未交互-94件以前被买过,250件以前没被买过
商品类:
213件不属于二次购买,47件属于二次购买,144件未交互品牌
58/1232
去掉当天购买的58/1033
+从未买过用户 47/954
去掉当天购买同类的58/930
当天已买过 4/100
大用户,转化率低于 4/100
转化率低于 10/281
几天购物车
50-64-67
阿里天池大数据竞赛(杂)相关推荐
- 阿里天池大数据竞赛——口碑商家客流量预测 A2
阿里天池大赛koubeiyuce1 2017年二月份,天池大数据比赛,口碑商家客流量预测,参赛地址及详情: https://tianchi.shuju.aliyun.com/competition/i ...
- 9个比赛7进top10,阿里天池大数据竞赛思路分享
向AI转型的程序员都关注了这个号
- 阿里天池大数据竞赛第一名,如何用AI检测肺癌
向AI转型的程序员都关注了这个号
- 阿里天池大数据竞赛(一)用ODPS提取特征
//2015年4月30日 提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征. 而在ODPS上却不一样,一条语句可以提取很多特征. 如提取最近1.2.3.4天四种行为的数量 重点是dec ...
- 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...
阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你! 天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...
- AI比赛-NER:“万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战
大赛概况 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作.通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础.挑战旨在通过抽 ...
- 【TIANCHI】天池大数据竞赛(学习赛)--- 淘宝用户购物行为数据可视化分析
目录 前言 一.数据集的来源和各个字段的意义 二.数据分析 1.引入库 2.读入数据 3.查看数据数量级 4.PV(Page View)/UV访问量 5.漏斗模型 6.用户购买商品的频次分析. 7.A ...
- 天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节
癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望.而肺癌,在我国作为发病率.死亡率最高的一类癌症,伤害着无数家庭.在我国每年都有近60万人死于肺癌.然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节 ...
- 阿里天池大数据之移动推荐算法大赛总结及代码全公布
移动推荐算法比赛已经结束了一个多星期了,现在写一篇文章来回顾一下自己的参赛历程. 首先,对不了解这个比赛的同学们介绍一下这个比赛(引用自官网): 赛题简介 2014年是阿里巴巴集团移动电商业务快速发展 ...
- 利用hive完成阿里天池大数据音乐预测比赛数据处理工作
hive shell 创建外表,指定目录 CREATE EXTERNAL TABLE IF NOT EXISTS songs2 ( sid string, aid string, ptime stri ...
最新文章
- 逼格高又实用的 Linux 命令,运维同仁一定要懂
- IT兄弟连 JavaWeb教程 jQuery中其他AJAX支持的函数
- 【Matlab 图像】图像基础操作
- java线程实现方式
- Error querying database.Cause:java.sql.SQLSyntaxErrorException:ORA-00911:invalid character
- linux UID,GID,EUID,EGID,SUID,SGID
- LeetCode MySQL 1132. 报告的记录 II
- squid反向代理网站配置示例
- 转: 如何挑选适合的前端框架
- oracle 访问adf 慢,ORACLE ADF 问题总结
- 文件大小超过配置限制(2560000),代码洞察功能不可用怎么办?
- android TTS语音播报
- 微信小程序云开发实现微信小程序订阅消息服务通知教程
- 消费心理学(02):沉没成本
- android原生系统裁剪
- 小米MiSans字体安装教程
- 熟悉Hive 实验2
- licenses.licx文件
- 学生选课系统E-R图以及登录,选课流程图
- matlab getprmdflt,DFLT40A-7中文资料
热门文章
- VScode:禁止VScode自动升级
- [1]数学建模基础入门知识
- 0基础小白,如何入门数学建模?
- Maven之(五)Maven仓库
- 论文解读:Structural Optimization Makes Graph Classification Simpler and Better
- PostgreSQL - 官方手册、中文手册及Github项目地址
- 一起来学习Windows Mobile 6.5
- 驱动精灵修复服务器,驱动精灵一键修复系统组件工具
- Sopcast软件中凤凰卫视频道列表代码
- 别人口中的“蓉叶云库”