基于天池淘宝母婴用品数据的可视化分析
一、分析背景
二、数据来源及理解
字段 |
字段说明 |
说明 |
user_id |
用户标识 |
|
auction_id |
交易 ID |
|
category_1 |
商品一级类目 ID |
|
category_1 |
商品二级类目 ID |
|
buy_amount |
购买数量 |
|
day |
订单发生日期 |
格式:YYYYMMDD |
字段 |
字段说明 |
说明 |
user_id |
用户标识 |
抽样&字段脱敏 |
birthday |
婴儿出生日期 |
由 user_id 填写,有可能不真 实,格式:YYYYMMDD |
gender |
婴儿性别 (0 男孩,1 女孩,2 性别 不明) |
由 user_id 填写,有可能不真实 |
三、分析思路
四、可视化分析
4.1 产品维度
1 、不同时期的商品销售情况
从 2012 年的第三季度到 2014 年的第四季度,每年的购买量是呈现周期性变 化的,从第一季度到第四季度,逐个季度增长,到第四季度达到顶峰。猜测造成 这样的原因可能是第一季度处于春节时期,这一时间段快递等行业放假,造成该 季度营销量的减少,而第四季度有双十一、双十二这种大型营销活动带来销售量 的增长。
对比 2012 年-2014 年的月份销售量图,在 1 、2 月销售量消减,11 月份的销 售量剧增,通过这可以初步印证前面关于第一季度和第四季度的猜想。
通过对比图也可以发现,每年的 5 月份都有个小高峰,通过查看 5 月份的日 销售量图,可以发现每年的数据走势大致相同,峰值都集中在母亲节等节日前后,因此,推测商家可能是通过相关的活动来回馈母亲,感恩母亲。
通过 11 月份日销售量的对比,我们可以发现,在双 11 当日销售量出现了激 增,几乎是平时销售量的 6 倍左右,因此可以说明双 11 的促销活动使得当月的 销量出现了大幅度的增长。
2 、不同品类商品的销售情况
对比查看一级品类商品,发现 28 号商品的种类最多且销量最好,其次是 50008168 号商品销量,该商品的种类较少;相反 50022520 号商品的种类多但销 量较少,后期可以对这该类商品进行种类调整,避免库存积压。另外,滞销品主 要为 122650008 号商品。
进一步了解商品的二级品类 top5,可以发现 38 号商品下 211122 号商品占该 商品销量的 55%以上,产品部门可以重新调整该类商品,重点关注热销产品。 50008168 号产品的销量虽不如 28 号产品,但是该类产品的子类产品的销量更为 的平均。
依据商品销售量=人均购买量*用户购买次数,将重点分析这两个指标变化对 销售量的影响;从图中可知,每个商品的购买次数和商品的销量走势基本一致, 经统计购买次数与销量的相关系数达到 0.83,而人均购买量和销量并没有明显的 相关性;因此可知影响商品销量主要是用户购买次数,因此拓展新客户,提高老 用户回流,是提升销量的关键。
4.2 用户维度
1 、性别分析
通过饼图,可以看到购买产品的男女孩比例基本上是持平的。
依据性别查看商品品类信息,总体上,购买的品类主要为50014815,122650008和50008168号的产品,但是男女孩对商品的需求种类还是略有差异的,男孩主要购买122650008号产品,女孩主要购买50014815号产品。
2、年龄分析
通过统计不同年龄下用户的数量,绘制玫瑰图可以发现,商品的主要用户年龄是0-2岁的婴幼儿。3岁以上的婴幼儿,随着年龄的增长,购买需求在逐渐下降。
通过对不同年龄下的小孩对各品类商品的购买情况的统计,可以发现不同年龄段的小孩对商品的需求不一样,商品种类主要集中在50014815号商品和50008168号商品,其中2岁以下的小孩主要使用50014815号商品,2岁以上的小孩主要使用50008168号商品。
3、商品复购情况
经统计发现,在接近3万条的商品交易数据中,仅仅只有24个用户具有复购记录,用户的复购率非常低,接近于0,且在复购的用户中,基本上只复购一次,由此也说明了用户的忠诚度很低。
序号 |
user_id |
次数 |
序号 |
user_id |
次数 |
1 |
814316568 |
4 |
13 |
900655351 |
2 |
2 |
1039632779 |
2 |
14 |
473068583 |
2 |
3 |
1126907662 |
2 |
15 |
1954450396 |
2 |
4 |
613315428 |
2 |
16 |
14069200 |
2 |
5 |
371804010 |
2 |
17 |
889177953 |
2 |
6 |
21833701 |
2 |
18 |
718313786 |
2 |
7 |
890739828 |
2 |
19 |
93538756 |
2 |
8 |
73181079 |
2 |
20 |
69889555 |
2 |
9 |
675043151 |
2 |
21 |
57700536 |
2 |
10 |
213455117 |
2 |
22 |
151414264 |
2 |
11 |
116466705 |
2 |
23 |
316403637 |
2 |
12 |
775005980 |
2 |
24 |
50570082 |
2 |
五、建议
5.1 运营方面
(1)继续丰富母亲节、儿童节、双11节日的活动促销策略,针对1、2月份可以采用类似方式,借助元旦、春节、情人节等特殊节日的促销,改善销量。
(2)减少4岁以上幼童的商品,专注3岁以下宝宝的产品和设计,定期对0~3岁用户进行回访,通过优惠券、母婴大课堂等方式促使用户回访,提高复购率。
(3)对购买次数较多的用户进行定期维护,通过积分兑换、发放优惠券等方式,促使用户回流。
(4)女性用户是购买力的主力军,女性购买一级商品50014815的销量最大,122650008号商品在男性中是最畅销的,商家可针对不同性别的客户对这两款商品进行推广,在男性中重点推广122650008号商品,在女性中推广50014815号商品,有针对性的推广有利于销量的整体提高。
5.2 产品方面:
(1)可以减少滞销品50022520号商品的种类,销售部门与产品部门应依据客户的喜好,设计1~2种主打商品进行重点销售,提升商品销量。
(2)商品一级分类中,销量top6的商品分别是:28、50008168、50014815、38、50022520和122650008,而122650008号商品的销量是最差的。商品二级分类中,销量top5的商品分别是: 50018831、50013636、211122、50011993和50006602,其中50018831号商品的销量是最高的,是二级分类中的畅销商品,商家可有针对性地对畅销品进行推广,备足库存,对于销量差的商品则可减少备货量,减少库存的压力。
基于天池淘宝母婴用品数据的可视化分析相关推荐
- 基于天池淘宝用户100万条行为数据分析——SQL、Tableau
目录 一.项目背景和目的 1.1项目背景 1.2项目目的 二.数据来源和数据清洗 2.1数据介绍 2.2数据清洗 2.2.1观察数据添加需要的字段 2.2.2检查是否存在重复值 2.2.3检查是否存在 ...
- 基于python的小说大数据预测可视化分析系统
https://b23.tv/8x689Tm .使用requests模块爬取17k小说网站的数据,网站存在严重的加密反爬,使用bs4模块解析数据,然后存入数据. 2.使用使用sklearn 实现一元线 ...
- 基于Python的淘宝行为数据可视化分析
项目背景&总结: 项目背景 完成如下商业分析任务,通过数据分析和可视化展示,充分挖掘数据的价值,让数据更好地为业务服务: 流量分析:PV/UV是多少,通过分析PV/UV能发现什么规律? 漏斗分 ...
- 爬取淘宝手机数据,并进行清洗,并可视化展示
爬取所需环境 selnium安装 Win+R输入cmd敲回车进入到cmd窗口: 输入"pip3 install selenium -i https://pypi.tuna.tsinghua. ...
- 阿里天池——淘宝母婴销售项目分析
数据来源:淘宝母婴购物数据集_数据集-阿里云天池 --------------------------------------------------------------------------- ...
- 淘宝母婴用品分析(Excel)
1.前期准备 数据来源 阿里巴巴天池:baby goods info data 字段含义 总共有两个csv文件,用excel打开. 此为婴儿信息表. 三个字段:用户ID, birthday:出生日期 ...
- 使用MySQL进行数据分析——以淘宝用户数据为例
使用MySQL进行数据分析--以淘宝用户数据为例 1. 背景介绍 本文主要是练习使用 mysql 进行数据分析,结合 excel 进行可视化分析,数据来源为阿里云天池的淘宝用户数据集,本数据集(Use ...
- 淘宝大数据之路【转】
原文地址:https://yq.aliyun.com/articles/62528 2003年至今淘宝网从零开始飞速发展,走过了13个年头,支撑淘宝业务野蛮式生长背后是一套不断完善的技术平台,淘宝大数 ...
- 归因分析:淘宝直播数据助理及其价值研究
导读:近年来,直播带货成为一种新的流行业态.主播在直播间与线上消费者实时互动,这极大的提高了信息交流的效率.在这种实时性极强的场景,主播对直播间实时信息的使用有可显著影响直播间的带货情况. 为了让主播 ...
最新文章
- JAVA从数据库中拿到数据
- ThinkPHP中的视图二
- 对软件工程与计算机科学之间区别的看法
- Markdown学习测试.md
- [Contest20171005]Maze
- linux下curl的使用
- C语言数据结构学习用单元测试
- (转)数据库可靠性/可用性、稳定性RTO/RPO
- 织梦(DEDECMS)首页调用相关投票的方法(自动更新)
- 孩子数学总是考不好?做好这五点,下次成绩一定好
- mysql 设置大小写_mysql修改大小写参数注意事项
- jquery插件图片浏览
- python循环控制语句将数值转化成字符串_python基础入门详解(文件输入/输出内建类型字典操作使用方法)...
- iOS UINavigationBar-导航栏、UINavigationItem-导航项
- java checked异常有那些_JAVA 的checked异常和unchecked异常
- usb网卡android驱动+win7,usb网卡万能驱动_手把手教你usb网卡驱动
- 微信小程序路线规划导航,选择起点和终点路线规划
- c语言中fprintf的作用,C语言中fprintf函数介绍
- SAP物料清单MM60中如何统计输出条目数量
- 中专计算机学数学,科学计算器在中职数学教学中的意义