文章导览

目标定义

数据获取

数据抽样

探索性分析

数据清洗

用户行为分析

用户消费行为分析

漏斗分析

用户行为和商品种类分析

用户价值度RFM模型分析

1、目标定义

以淘宝APP2014年11月18日-12月18日近1200万+条数据,近1万用户为数据集,探索用户的行为模式。具体指标包括日PV、uv分析,付费率分析、复购情况分析、漏斗流失分析和用户价值RFM分析。

2、数据获取

阿里天池比赛项目:User Behavior Data on Taobao App

网址链接:数据集-阿里云天池

3、数据抽样

选取全部样本

4、探索性分析      

4.1分析方向:

查看数据类型、字段、大小、缺失情况,异常情况等

代码实现:

4.2分析结果

4.2.1数据集共有1200+万条左右数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共计6列字段,列字段分别是:

user_id:用户ID,脱敏      整数型

item_id:商品ID,脱敏      整数型

behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示)     整数型

user_geohash:地理位置(加密处理过且有缺失) 字符串型

item_category:品类ID(商品所属的品类)  整数型

time:用户行为发生的时间       字符串型

4.2.2地理位置字段加密处理过,且有缺失。该列数据用不到,可直接删除

4.2.3 time列日期和小时些在一块了,应该隔开成两列,并且改变数据类型。

4.2.4 查看describe属性,未发现异常值

5、数据清洗

缺失值处理

日期列处理

代码展示:

6、用户行为分析

6.1 日访问量、日访客量变化

结果显示如上图所示,

  1. 在双十二期间,pv和uv访问量达到峰值。并且可以发现,uv和pv两个访问量数值差距比较大。
  2. 平时日访问量37万左右,双十二日访问量达到70万,增长近一倍。访客量在双十二也增长一倍左右。
  3. 同时,因为数据集总人数大约是10000人左右,因此,通过nv值可以分析出双十二期间淘宝用户的日活跃大概是45%浮动。

小时访问量分析

  1. 图表显示:pv和uv在凌晨0-5点期间波动情况相同,都呈下降趋势,访问量都比较。
  2. 同时在晚上18:00左右,pv波动情况比较剧烈,相比来看uv不太明显,因此晚上18:00以后是淘宝用户访问app的活跃时间段

7、用户消费行为分析

定义活跃用户:该天有访问行为的人

定义付费用户:该天有付费行为的人

定义复购行为:一个月内两天以上有购买行为,一天多次不算。

7、1 购物(付费)次数探析

购物(付费)次数分析

  1. 付费用户该月平均购物次数 13.5次,最高809次购物,中位数是8次。
  2. 图表分析,大多数人的购物次数在10次一下。

7.2 该月人均消费变化(付费用户)

因为本数据集中没有消费金额,因此在计算过程中用消费次数代替消费金额

人均消费次数=消费总次数/消费人数

上图显示:

付费用户的人均消费在2.35 次每人每天。双十二达到顶峰人日均3.75 次。

上图为活跃用户的日人均消费次数

上图显示,淘宝活跃用户(有过操作行为的用户)平均每天消费次数比较低,在0.5次左右,双十二期间达到最高值,有2.0左右。

7.3 计算复购率

复购率 = 复购人数/消费人数

计算结果显示:该月用户的复购率是87.1%。

8、漏斗分析

漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。

一般用户逛淘宝的行为流程:

首页-浏览商品/搜索品类-加入购物车-生成订单-开始支付-支付成功

本案例漏斗模型:点击-收藏-加购物车-支付

8.1 流失率分析

代码展示:

上表得出数据:总点击量:11550581;加入购物车量:242556;收藏量:343564;购买量:120205点击量-加入购物车量 流失率:97.9\%;收藏量-加入购物车量 流失率:28.4\%;加入购物车量-购买量 流失率:50.6\%通过流失率情况的计算和分析,重视每一环节流失率可能发生的情况。

8.2 不同商品品类的转化率分析

转化率 = 点击量 / 支付量

上图可以看出,大多数的商品转化率在0.1左右。

9、用户价值度RFM模型分析

RFM的含义:

R(Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。

F(Frequency):客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。

M(Monetary):客户在最近一段时间内交易的金额。M值越大,表示客户价值越高,反之则表示客户价值越低。

RFM分析就是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。

上表显示:

对于22用户,为重点用户需要关注;对于21这类忠诚度高而购买能力不足的,可以可以适当给点折扣或捆绑销售来增加用户的购买频率。对于12这类忠诚度不高而购买能力强的,需要关注他们的购物习性做精准化营销。

【数据分析实战】淘宝用户行为模式分析相关推荐

  1. MySQL数据项目分析实战——淘宝用户行为分析

    MySQL数据项目分析实战--淘宝用户行为分析 一.项目背景 二.项目目标 2.1分析目的 2.2分析维度 三.数据的收集与整理 3.1数据来源 3.2数据说明 3.3理解数据 3.4导入数据 四.数 ...

  2. 使用MySQL进行数据分析——以淘宝用户数据为例

    使用MySQL进行数据分析--以淘宝用户数据为例 1. 背景介绍 本文主要是练习使用 mysql 进行数据分析,结合 excel 进行可视化分析,数据来源为阿里云天池的淘宝用户数据集,本数据集(Use ...

  3. 大数据实战 --- 淘宝用户行为数据分析

    目录 开发环境 数据描述 功能需求 数据准备 数据清洗 用户行为分析 找出有价值的用户 开发环境 Hadoop+Hive+Spark+HBase 启动Hadoop:start-all.sh 启动zoo ...

  4. 【入门数据分析】淘宝用户行为分析

    前言 分析目的:本文基于淘宝1年的交易数据对其用户行为进行多角度分析,对相关问题进行解释并提供建议. 分析工具:MySQL.excel 主要模型:AARRR模型 一.分析问题和思路 本文采用淘宝电商的 ...

  5. Python数据分析案例—淘宝用户行为分析

    赛题与数据 一.项目背景 本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析 ...

  6. 数据分析项目-淘宝用户数据分析

    分析思路 1. 分析用户在使用淘宝APP时的行为,确定相关指标,确定用户流失环节. 2. 分析用户在不同时间段的行为趋势变化. 3. 通过对部分商品的用户行为分析,提出针对不同类型用户的调整建议. A ...

  7. MYSQL数据分析项目 - 淘宝用户行为分析

    目录 一.项目简要 1 数据背景 2 项目目标 3 分析思路 二.数据说明 1 取样说明

  8. 数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析

    数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析 淘宝行为分析Tableau可视化展示 数据分析实战之淘宝用户行为分析(5) - 数据分析报告 数据分析实战之淘宝用户行为分析(4) - 用 ...

  9. 【数据分析实战经验】淘宝用户行为分析①-AARRR、RMF模型(数据量:百万级,工具mysql)

    电商平台的用户行为分析,能一定程度的推动运营.产品等迭代,提供决策支持. 数据集来源: 阿里云池 样本量: 3835331 方法工具: 本文用2017年11月至12月的淘宝用户行为,AARRR模型及R ...

最新文章

  1. OpenStack Ocata Release Notes
  2. 云安全趋势:IaaS?谢了,我要 PaaS
  3. (转)解决multiple definition of的方法
  4. 周五话分析 | 方法论难落地?来个量身定制版本吧(AARRR模型)
  5. 将项目依赖也打到jar包中
  6. day38 19-Spring整合web开发
  7. Educational Codeforces Round 81 (Rated for Div. 2) B. Infinite Prefixes 数学
  8. 网络基础2-3(TCP协议,三次握手,四次挥手,TIME_WAIT状态的作用,TCP如何保证可靠传输,TCP连接中状态转化,滑动窗口,流量控制,快速重传,拥塞窗口,延迟应答,捎带应答,粘包问题)
  9. Java第一次上机实验源代码
  10. java堆栈类在哪个包里_Java堆栈Stack类的使用
  11. python的十大算法_Python十大排序算法
  12. S19王者荣耀服务器维护,王者荣耀:S19新赛季更新,她没上线惨遭重做,英雄调整,界面优化...
  13. c语言三角函数乘法怎么表示,这个图里的三角函数 要怎么用c语言打出来
  14. 51单片机控制电机正反转
  15. 64位操作系统安装PLSQL Developer
  16. 两个实用型教学网站:菜鸟教程与W3School,估计是国内做得做好的了
  17. python的输入来源包括文件输入_【python】文件的输入和输出
  18. 【每日一题】一起冲击蓝桥杯吧——Day6【蓝桥真题一起练】
  19. one-hot向量形式
  20. 参考美团大众点评合并,掌握APP推广妙招

热门文章

  1. 2023年湖北助理工程师在哪里申报?助理工程师的五大作用你知道吗
  2. AndroidStudio中Files under the “build“ folder are generated and should not be edited的解决方法
  3. 陈立杰的励志演讲. 充满动力地走下去吧!
  4. 雷达扫描定位 android,Android仿微信雷达扫描
  5. 墙裂推荐6个优质公众号
  6. 彩票,双色球,模拟开奖小项目
  7. [STM32F1]STM32 低功耗待机模式与RTC周期唤醒
  8. 音视频流媒体————基本概念
  9. 2021年真无线蓝牙耳机排名:人气排名前十的蓝牙耳机推荐
  10. 计算机视觉--KNN算法和稠密SIFT实现图像识别(手势识别)