一、案例背景

基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、小时PV、小时UV、不同用户行为的PV、用户购买次数分布、用户购买频次分布、活跃用户消费情况等。通过本案例,可以基本看看Power BI都能分析达到怎么样的效果。

二、数据来源及结构

阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。

数据下载地址:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46

数据结构:

user_id:用户ID

item_id:商品ID

behavior_type:用户行为类型(包含1点击、2收藏、3加购物车、4支付)

user_geohash:地理位置

item_category:商品类别ID

time:记录时间

三、数据导入及整理

从阿里天池网站下载文件后,解压得到csv文件,直接通过“获取数据”功能,即可导入csv文件。

整个数据文件大小500M+,我的家用电脑导入大概花了2分钟。(酷睿i5,16G内存,500G固态硬盘)

筛选并查看各列数据,数据还是比较规整的,没有发现异常值,因此也没进行数据清洗了。

打开查询编辑器,通过 “添加列-提取” 功能,添加日期、小时两列,用作后面日期、小时维度分析使用。

完成数据整理后,应用查询更改。由于数据量相对较大,应用查询更改,也还是花费了一些时间。我的家用电脑用了大概5分钟时间。

四、数据分析

(1)每日PV、UV走势分析

使用折线图,将“日期”/“小时”列作为轴,将"user_id"列作为值,得出下面趋势图。

可以直观看出,在双12当天,PV、UV均达到峰值。在整个双12期间,用户活跃程度大概有45%的浮动。

(2)每小时PV、UV走势分析

构建折线图方法与(1)类似。

从图形直观看出,PV、UV曲线走势基本一致。但是发现晚上18点之后,PV快速十分增长,但是UV增长不太明显。

看得出来哈,即使白天时间要上班、上学,双12期间很多人还是克制不住要上上淘宝。

(3)不同行为的每小时PV趋势分析

使用折线图,将“小时”列作为轴,将"user_id"列作为值,将“behavior_type”作为图例,得出下面趋势图。

行为“1点击” 明显比其他行为的PV高得多,说明大家都在刷。

行为“2加入购物车” 比 行为“3添加收藏” 的PV要多,让用户收藏进行复购还是难些呀。

比较上下两个图,四种行为的趋势还是很一致的。

(4)用户购买次数分析

先使用下面公式构建新表,按不同的购买次数对用户进行分类汇总。

表 = SUMMARIZE(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),tianchi_mobile_recommend_train_user[user_id],"购买次数分类",count('tianchi_mobile_recommend_train_user'[behavior_type]))

添加用户数量的度量值。

用户数量 = count('表'[购买次数分类])

使用柱状图、矩阵进行可视化,构建方法与前面几点类似。

从购买次数看,大多数用户还是比较克制的,购买次数在20以下的占了绝大多数。

(5)不同购买频次客户的贡献度分析

由于原始数据中,没有每笔订单的金额,只能对不同购买频次的客户,分类计算总购买次数,以分析不同类别客户的贡献度。

构建总购买次数度量值。

总购买次数 = sum('表'[购买次数分类])

这就很明显地发现了几个“剁手族”的贡献了,有6个客户购买次数达到了200次以上。

(6)每天购买总数、购买频次分析

购买次数度量值

购买次数 = SUMX(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),1)

平均购买次数度量值

平均购买次数 = DIVIDE(SUMX(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),1),CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4)))

每天的购买总数、购买频次的趋势基本一致,都在双12当天达到峰值,且在双12当天远远大于其他时间。

(7)活跃用户消费情况分析

构建活跃用户消费率度量值

活跃用户消费率 = DIVIDE(CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4)),CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=1)))

在双12当天,打开过淘宝的人,超过一半都下单消费了,这转换率高得离谱呀。

而且即使在其他时间,每天都保持有超过20%的转化。

五、总结

在上述所有的分析中,除了整理数据时加载较慢以外,其他所有分析中,所构建的表、度量值、可视化图形等,Power BI都是秒速完成的。在数据量超过1200万的级别,这样的响应速度,还是很不错的了。

从Power BI的可视化界面,可以很快就完成了整个数据分析的全流程,包括数据的导入、清理、度量值编写、模型构建、可视化表达、指标分析等,也从分析结果中快速得到一些商业洞察,十分具有实际应用价值。

Power BI应用案例:淘宝用户行为分析实战相关推荐

  1. Python数据分析案例—淘宝用户行为分析

    赛题与数据 一.项目背景 本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析 ...

  2. 淘宝用户行为分析MySQL

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 淘宝用户行为分析MySQL 一.数据清洗 二.总体情况 1.UV.PV.人均浏览次数 2.复购率.跳失率 三.用户行为分析 1.行为转 ...

  3. 阿里天池:淘宝用户行为分析项目

    数据来源:阿里天池 - 淘宝用户商品行为数据 (在这里仅选用表名为 "tianchi_mobile_recommend_train_user" 中的数据,用作淘宝用户行为分析) 项 ...

  4. Python项目实战 —— 04. 淘宝用户行为分析

    Python项目实战 Python项目实战--目录 Python项目实战 -- 04. 淘宝用户行为分析 一.背景 二.解题思路 三.数据分析 3.1 数据清洗 3.2 数据分析 3.2.1 用户整体 ...

  5. MySQL—淘宝用户行为分析

    文章目录 一.项目背景 二.结论先行 2.1用户行为漏斗转化分析 2.2时间维度分析用户行为 2.3商品维度分析用户行为 2.4RFM模型用户价值分析 三.数据分析 3.1数据来源 3.2数据说明 3 ...

  6. 数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析

    数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析 淘宝行为分析Tableau可视化展示 数据分析实战之淘宝用户行为分析(5) - 数据分析报告 数据分析实战之淘宝用户行为分析(4) - 用 ...

  7. 淘宝用户行为分析项目

    淘宝用户行为分析项目 说明:项目通过jupter notebook.使用pandas,numpy,matplotlib,seaborn等第三方库对数据进行不同维度上的分析. 一.项目背景 本数据报告以 ...

  8. MySQL数据项目分析实战——淘宝用户行为分析

    MySQL数据项目分析实战--淘宝用户行为分析 一.项目背景 二.项目目标 2.1分析目的 2.2分析维度 三.数据的收集与整理 3.1数据来源 3.2数据说明 3.3理解数据 3.4导入数据 四.数 ...

  9. 数据分析案例之淘宝用户行为分析完整报告

    一.项目背景 UserBehavior为淘宝用户行为的数据集,数据集包括了2017年11月25日至2017年12月3日之间,有大约82万随机用户的用户行为(行为包括点击pv,购买buy,加购物车cha ...

  10. 案例三:淘宝用户行为分析

    一.项目背景 本项目基于淘宝app平台数据,通过相关指标对行为进行分析,探索消费者相关行为模式 分析方法: 用户行为分析:日pv和日uv分析,时pv和时uv分析,不同行为类型用户的pv分析用户消费行为 ...

最新文章

  1. [case19]聊聊eureka的TaskDispatcher
  2. 提高工作效率:15个有用的项目管理工具
  3. slice(),substring()和substr()的异同
  4. elasticsearch 嵌入式_Elasticsearch 开箱指南
  5. python语法大全-python基本语法
  6. workerman介绍
  7. python2必须安装步骤_Python入门-第三方库的安装及环境配置(2)
  8. Spring Cloud Gateway介绍(一)
  9. [bzoj4881][Lydsy2017年5月月赛]线段游戏
  10. tts android,Android系统自带的TTS实现语音播报
  11. 【简单思考】noip模拟赛 NTR酋长
  12. DSP28335学习——系统初始化
  13. SCI写作攻略——附带常见英语写作句式
  14. Pytorch 残差网络 ResNet
  15. ubuntu开机自启动python程序
  16. 《平凡的世界》造就不平凡的人生 --路遥
  17. android 11源码OTA升级封装及U盘检测
  18. 现在编程主要用什么软件
  19. CSS笔记(美化超链接)
  20. Python零代码小游戏 · FreeGames

热门文章

  1. NetCore EF 使用scaffold-dbcontext导致deps.json] does not exist的解决办法
  2. LODOP打印分页出现空白页
  3. VMWare安装Deepin系统
  4. axure 自学入门教程
  5. 英语cowbezoar牛黄CowBezoar单词
  6. 腾讯云开发者实验室是什么?如何学习其中的153个实验案例?
  7. 解决9341系列LCD,使用杜邦线等连接线,造成白屏问题
  8. python中的xbari表示_R语言实现Xbar-R控制图
  9. 文件夹怎么打包压缩?压缩包太大如何缩小?
  10. 免安装mysql_免安装版的Mysql