Power BI应用案例:淘宝用户行为分析实战
一、案例背景
基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、小时PV、小时UV、不同用户行为的PV、用户购买次数分布、用户购买频次分布、活跃用户消费情况等。通过本案例,可以基本看看Power BI都能分析达到怎么样的效果。
二、数据来源及结构
阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。
数据下载地址:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46
数据结构:
user_id:用户ID
item_id:商品ID
behavior_type:用户行为类型(包含1点击、2收藏、3加购物车、4支付)
user_geohash:地理位置
item_category:商品类别ID
time:记录时间
三、数据导入及整理
从阿里天池网站下载文件后,解压得到csv文件,直接通过“获取数据”功能,即可导入csv文件。
整个数据文件大小500M+,我的家用电脑导入大概花了2分钟。(酷睿i5,16G内存,500G固态硬盘)
筛选并查看各列数据,数据还是比较规整的,没有发现异常值,因此也没进行数据清洗了。
打开查询编辑器,通过 “添加列-提取” 功能,添加日期、小时两列,用作后面日期、小时维度分析使用。
完成数据整理后,应用查询更改。由于数据量相对较大,应用查询更改,也还是花费了一些时间。我的家用电脑用了大概5分钟时间。
四、数据分析
(1)每日PV、UV走势分析
使用折线图,将“日期”/“小时”列作为轴,将"user_id"列作为值,得出下面趋势图。
可以直观看出,在双12当天,PV、UV均达到峰值。在整个双12期间,用户活跃程度大概有45%的浮动。
(2)每小时PV、UV走势分析
构建折线图方法与(1)类似。
从图形直观看出,PV、UV曲线走势基本一致。但是发现晚上18点之后,PV快速十分增长,但是UV增长不太明显。
看得出来哈,即使白天时间要上班、上学,双12期间很多人还是克制不住要上上淘宝。
(3)不同行为的每小时PV趋势分析
使用折线图,将“小时”列作为轴,将"user_id"列作为值,将“behavior_type”作为图例,得出下面趋势图。
行为“1点击” 明显比其他行为的PV高得多,说明大家都在刷。
行为“2加入购物车” 比 行为“3添加收藏” 的PV要多,让用户收藏进行复购还是难些呀。
比较上下两个图,四种行为的趋势还是很一致的。
(4)用户购买次数分析
先使用下面公式构建新表,按不同的购买次数对用户进行分类汇总。
表 = SUMMARIZE(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),tianchi_mobile_recommend_train_user[user_id],"购买次数分类",count('tianchi_mobile_recommend_train_user'[behavior_type]))
添加用户数量的度量值。
用户数量 = count('表'[购买次数分类])
使用柱状图、矩阵进行可视化,构建方法与前面几点类似。
从购买次数看,大多数用户还是比较克制的,购买次数在20以下的占了绝大多数。
(5)不同购买频次客户的贡献度分析
由于原始数据中,没有每笔订单的金额,只能对不同购买频次的客户,分类计算总购买次数,以分析不同类别客户的贡献度。
构建总购买次数度量值。
总购买次数 = sum('表'[购买次数分类])
这就很明显地发现了几个“剁手族”的贡献了,有6个客户购买次数达到了200次以上。
(6)每天购买总数、购买频次分析
购买次数度量值
购买次数 = SUMX(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),1)
平均购买次数度量值
平均购买次数 = DIVIDE(SUMX(FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4),1),CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4)))
每天的购买总数、购买频次的趋势基本一致,都在双12当天达到峰值,且在双12当天远远大于其他时间。
(7)活跃用户消费情况分析
构建活跃用户消费率度量值
活跃用户消费率 = DIVIDE(CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=4)),CALCULATE(DISTINCTCOUNT('tianchi_mobile_recommend_train_user'[user_id]),FILTER('tianchi_mobile_recommend_train_user','tianchi_mobile_recommend_train_user'[behavior_type]=1)))
在双12当天,打开过淘宝的人,超过一半都下单消费了,这转换率高得离谱呀。
而且即使在其他时间,每天都保持有超过20%的转化。
五、总结
在上述所有的分析中,除了整理数据时加载较慢以外,其他所有分析中,所构建的表、度量值、可视化图形等,Power BI都是秒速完成的。在数据量超过1200万的级别,这样的响应速度,还是很不错的了。
从Power BI的可视化界面,可以很快就完成了整个数据分析的全流程,包括数据的导入、清理、度量值编写、模型构建、可视化表达、指标分析等,也从分析结果中快速得到一些商业洞察,十分具有实际应用价值。
Power BI应用案例:淘宝用户行为分析实战相关推荐
- Python数据分析案例—淘宝用户行为分析
赛题与数据 一.项目背景 本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析 ...
- 淘宝用户行为分析MySQL
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 淘宝用户行为分析MySQL 一.数据清洗 二.总体情况 1.UV.PV.人均浏览次数 2.复购率.跳失率 三.用户行为分析 1.行为转 ...
- 阿里天池:淘宝用户行为分析项目
数据来源:阿里天池 - 淘宝用户商品行为数据 (在这里仅选用表名为 "tianchi_mobile_recommend_train_user" 中的数据,用作淘宝用户行为分析) 项 ...
- Python项目实战 —— 04. 淘宝用户行为分析
Python项目实战 Python项目实战--目录 Python项目实战 -- 04. 淘宝用户行为分析 一.背景 二.解题思路 三.数据分析 3.1 数据清洗 3.2 数据分析 3.2.1 用户整体 ...
- MySQL—淘宝用户行为分析
文章目录 一.项目背景 二.结论先行 2.1用户行为漏斗转化分析 2.2时间维度分析用户行为 2.3商品维度分析用户行为 2.4RFM模型用户价值分析 三.数据分析 3.1数据来源 3.2数据说明 3 ...
- 数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析
数据分析实战之淘宝用户行为分析(3) -- 用户行为路径分析 淘宝行为分析Tableau可视化展示 数据分析实战之淘宝用户行为分析(5) - 数据分析报告 数据分析实战之淘宝用户行为分析(4) - 用 ...
- 淘宝用户行为分析项目
淘宝用户行为分析项目 说明:项目通过jupter notebook.使用pandas,numpy,matplotlib,seaborn等第三方库对数据进行不同维度上的分析. 一.项目背景 本数据报告以 ...
- MySQL数据项目分析实战——淘宝用户行为分析
MySQL数据项目分析实战--淘宝用户行为分析 一.项目背景 二.项目目标 2.1分析目的 2.2分析维度 三.数据的收集与整理 3.1数据来源 3.2数据说明 3.3理解数据 3.4导入数据 四.数 ...
- 数据分析案例之淘宝用户行为分析完整报告
一.项目背景 UserBehavior为淘宝用户行为的数据集,数据集包括了2017年11月25日至2017年12月3日之间,有大约82万随机用户的用户行为(行为包括点击pv,购买buy,加购物车cha ...
- 案例三:淘宝用户行为分析
一.项目背景 本项目基于淘宝app平台数据,通过相关指标对行为进行分析,探索消费者相关行为模式 分析方法: 用户行为分析:日pv和日uv分析,时pv和时uv分析,不同行为类型用户的pv分析用户消费行为 ...
最新文章
- [case19]聊聊eureka的TaskDispatcher
- 提高工作效率:15个有用的项目管理工具
- slice(),substring()和substr()的异同
- elasticsearch 嵌入式_Elasticsearch 开箱指南
- python语法大全-python基本语法
- workerman介绍
- python2必须安装步骤_Python入门-第三方库的安装及环境配置(2)
- Spring Cloud Gateway介绍(一)
- [bzoj4881][Lydsy2017年5月月赛]线段游戏
- tts android,Android系统自带的TTS实现语音播报
- 【简单思考】noip模拟赛 NTR酋长
- DSP28335学习——系统初始化
- SCI写作攻略——附带常见英语写作句式
- Pytorch 残差网络 ResNet
- ubuntu开机自启动python程序
- 《平凡的世界》造就不平凡的人生 --路遥
- android 11源码OTA升级封装及U盘检测
- 现在编程主要用什么软件
- CSS笔记(美化超链接)
- Python零代码小游戏 · FreeGames