一、分析背景

        母婴用品是淘宝的热门购物类目,随着国家鼓励二胎、三胎政策的推进,会进一步促进了母婴类目商品的销量。与此年轻一代父母的育儿观念也发生了较大的变化,因此中国母婴电商市场发展形态也越来越多样化。随之引起各大母婴品牌更加激烈的争夺,越来越多的母婴品牌管窥到行业潜在的商机,纷纷加入母婴电商,行业竞争越来越激烈。本文主要对“天池”中发布的淘宝和天猫上购买婴儿商品数据进行分析,该数据集包括:购买商品表、婴儿信息数据。

二、数据来源及理解

        本数据集来自阿里巴巴天池竞赛淘宝母婴购物行为数据集,其中包含 2 个CSV 数据,表 1 为商品交易信息表: tianchi_mum_baby_trade_history ,表 2 为用户基本信息表:tianchi_mum_baby 。各字段说明如下:
商品交易信息表: tianchi_mum_baby_trade_history

字段

字段说明

说明

user_id

用户标识

auction_id

交易 ID

category_1

商品一级类目 ID

category_1

商品二级类目 ID

buy_amount

购买数量

day

订单发生日期

格式:YYYYMMDD

用户基本信息表: tianchi_mum_baby

字段

字段说明

说明

user_id

用户标识

抽样&字段脱敏

birthday

婴儿出生日期

由 user_id 填写,有可能不真

实,格式:YYYYMMDD

gender

婴儿性别 (0  男孩,1  女孩,2 性别

不明)

由 user_id 填写,有可能不真实

三、分析思路

四、可视化分析

4.1  产品维度

1 、不同时期的商品销售情况

从 2012 年的第三季度到 2014 年的第四季度,每年的购买量是呈现周期性变 化的,从第一季度到第四季度,逐个季度增长,到第四季度达到顶峰。猜测造成 这样的原因可能是第一季度处于春节时期,这一时间段快递等行业放假,造成该 季度营销量的减少,而第四季度有双十一、双十二这种大型营销活动带来销售量 的增长。

对比 2012 年-2014 年的月份销售量图,在 1 、2 月销售量消减,11 月份的销 售量剧增,通过这可以初步印证前面关于第一季度和第四季度的猜想。

通过对比图也可以发现,每年的 5 月份都有个小高峰,通过查看 5 月份的日 销售量图,可以发现每年的数据走势大致相同,峰值都集中在母亲节等节日前后,因此,推测商家可能是通过相关的活动来回馈母亲,感恩母亲。

通过 11 月份日销售量的对比,我们可以发现,在双 11 当日销售量出现了激 增,几乎是平时销售量的 6 倍左右,因此可以说明双 11 的促销活动使得当月的 销量出现了大幅度的增长。

2 、不同品类商品的销售情况

对比查看一级品类商品,发现 28 号商品的种类最多且销量最好,其次是 50008168 号商品销量,该商品的种类较少;相反 50022520 号商品的种类多但销 量较少,后期可以对这该类商品进行种类调整,避免库存积压。另外,滞销品主 要为 122650008 号商品。

进一步了解商品的二级品类 top5,可以发现 38 号商品下 211122 号商品占该 商品销量的 55%以上,产品部门可以重新调整该类商品,重点关注热销产品。 50008168 号产品的销量虽不如 28 号产品,但是该类产品的子类产品的销量更为 的平均。

依据商品销售量=人均购买量*用户购买次数,将重点分析这两个指标变化对 销售量的影响;从图中可知,每个商品的购买次数和商品的销量走势基本一致, 经统计购买次数与销量的相关系数达到 0.83,而人均购买量和销量并没有明显的 相关性;因此可知影响商品销量主要是用户购买次数,因此拓展新客户,提高老 用户回流,是提升销量的关键。

4.2  用户维度

1 、性别分析

通过饼图,可以看到购买产品的男女孩比例基本上是持平的。

依据性别查看商品品类信息,总体上,购买的品类主要为50014815,122650008和50008168号的产品,但是男女孩对商品的需求种类还是略有差异的,男孩主要购买122650008号产品,女孩主要购买50014815号产品。

2、年龄分析

通过统计不同年龄下用户的数量,绘制玫瑰图可以发现,商品的主要用户年龄是0-2岁的婴幼儿。3岁以上的婴幼儿,随着年龄的增长,购买需求在逐渐下降。

通过对不同年龄下的小孩对各品类商品的购买情况的统计,可以发现不同年龄段的小孩对商品的需求不一样,商品种类主要集中在50014815号商品和50008168号商品,其中2岁以下的小孩主要使用50014815号商品,2岁以上的小孩主要使用50008168号商品。

3、商品复购情况

经统计发现,在接近3万条的商品交易数据中,仅仅只有24个用户具有复购记录,用户的复购率非常低,接近于0,且在复购的用户中,基本上只复购一次,由此也说明了用户的忠诚度很低。

复购记录表

序号

user_id

次数

序号

user_id

次数

1

814316568

4

13

900655351

2

2

1039632779

2

14

473068583

2

3

1126907662

2

15

1954450396

2

4

613315428

2

16

14069200

2

5

371804010

2

17

889177953

2

6

21833701

2

18

718313786

2

7

890739828

2

19

93538756

2

8

73181079

2

20

69889555

2

9

675043151

2

21

57700536

2

10

213455117

2

22

151414264

2

11

116466705

2

23

316403637

2

12

775005980

2

24

50570082

2

五、建议

5.1 运营方面

(1)继续丰富母亲节、儿童节、双11节日的活动促销策略,针对1、2月份可以采用类似方式,借助元旦、春节、情人节等特殊节日的促销,改善销量。

(2)减少4岁以上幼童的商品,专注3岁以下宝宝的产品和设计,定期对0~3岁用户进行回访,通过优惠券、母婴大课堂等方式促使用户回访,提高复购率。

(3)对购买次数较多的用户进行定期维护,通过积分兑换、发放优惠券等方式,促使用户回流。

(4)女性用户是购买力的主力军,女性购买一级商品50014815的销量最大,122650008号商品在男性中是最畅销的,商家可针对不同性别的客户对这两款商品进行推广,在男性中重点推广122650008号商品,在女性中推广50014815号商品,有针对性的推广有利于销量的整体提高。

5.2 产品方面:

(1)可以减少滞销品50022520号商品的种类,销售部门与产品部门应依据客户的喜好,设计1~2种主打商品进行重点销售,提升商品销量。

(2)商品一级分类中,销量top6的商品分别是:28、50008168、50014815、38、50022520和122650008,而122650008号商品的销量是最差的。商品二级分类中,销量top5的商品分别是: 50018831、50013636、211122、50011993和50006602,其中50018831号商品的销量是最高的,是二级分类中的畅销商品,商家可有针对性地对畅销品进行推广,备足库存,对于销量差的商品则可减少备货量,减少库存的压力。

基于天池淘宝母婴用品数据的可视化分析相关推荐

  1. 基于天池淘宝用户100万条行为数据分析——SQL、Tableau

    目录 一.项目背景和目的 1.1项目背景 1.2项目目的 二.数据来源和数据清洗 2.1数据介绍 2.2数据清洗 2.2.1观察数据添加需要的字段 2.2.2检查是否存在重复值 2.2.3检查是否存在 ...

  2. 基于python的小说大数据预测可视化分析系统

    https://b23.tv/8x689Tm .使用requests模块爬取17k小说网站的数据,网站存在严重的加密反爬,使用bs4模块解析数据,然后存入数据. 2.使用使用sklearn 实现一元线 ...

  3. 基于Python的淘宝行为数据可视化分析

    项目背景&总结: 项目背景 完成如下商业分析任务,通过数据分析和可视化展示,充分挖掘数据的价值,让数据更好地为业务服务: 流量分析:PV/UV是多少,通过分析PV/UV能发现什么规律? 漏斗分 ...

  4. 爬取淘宝手机数据,并进行清洗,并可视化展示

    爬取所需环境 selnium安装 Win+R输入cmd敲回车进入到cmd窗口: 输入"pip3 install selenium -i https://pypi.tuna.tsinghua. ...

  5. 阿里天池——淘宝母婴销售项目分析

    数据来源:淘宝母婴购物数据集_数据集-阿里云天池 --------------------------------------------------------------------------- ...

  6. 淘宝母婴用品分析(Excel)

    1.前期准备 数据来源 阿里巴巴天池:baby goods info data 字段含义 总共有两个csv文件,用excel打开. 此为婴儿信息表. 三个字段:用户ID, birthday:出生日期 ...

  7. 使用MySQL进行数据分析——以淘宝用户数据为例

    使用MySQL进行数据分析--以淘宝用户数据为例 1. 背景介绍 本文主要是练习使用 mysql 进行数据分析,结合 excel 进行可视化分析,数据来源为阿里云天池的淘宝用户数据集,本数据集(Use ...

  8. 淘宝大数据之路【转】

    原文地址:https://yq.aliyun.com/articles/62528 2003年至今淘宝网从零开始飞速发展,走过了13个年头,支撑淘宝业务野蛮式生长背后是一套不断完善的技术平台,淘宝大数 ...

  9. 归因分析:淘宝直播数据助理及其价值研究

    导读:近年来,直播带货成为一种新的流行业态.主播在直播间与线上消费者实时互动,这极大的提高了信息交流的效率.在这种实时性极强的场景,主播对直播间实时信息的使用有可显著影响直播间的带货情况. 为了让主播 ...

最新文章

  1. JAVA从数据库中拿到数据
  2. ThinkPHP中的视图二
  3. 对软件工程与计算机科学之间区别的看法
  4. Markdown学习测试.md
  5. [Contest20171005]Maze
  6. linux下curl的使用
  7. C语言数据结构学习用单元测试
  8. (转)数据库可靠性/可用性、稳定性RTO/RPO
  9. 织梦(DEDECMS)首页调用相关投票的方法(自动更新)
  10. 孩子数学总是考不好?做好这五点,下次成绩一定好
  11. mysql 设置大小写_mysql修改大小写参数注意事项
  12. jquery插件图片浏览
  13. python循环控制语句将数值转化成字符串_python基础入门详解(文件输入/输出内建类型字典操作使用方法)...
  14. iOS UINavigationBar-导航栏、UINavigationItem-导航项
  15. java checked异常有那些_JAVA 的checked异常和unchecked异常
  16. usb网卡android驱动+win7,usb网卡万能驱动_手把手教你usb网卡驱动
  17. 微信小程序路线规划导航,选择起点和终点路线规划
  18. c语言中fprintf的作用,C语言中fprintf函数介绍
  19. SAP物料清单MM60中如何统计输出条目数量
  20. 中专计算机学数学,科学计算器在中职数学教学中的意义

热门文章

  1. php ico容器,Laravel 核心——IoC 服务容器
  2. mac/linux 查找软件安装、配置路径
  3. 有没有好用的数据恢复软件推荐?
  4. 【数据分析】疫情对美国民众消费的影响研究报告
  5. Java网络编程(第二版) 出版社: 中国电力出版社
  6. XT301 25.0刷机
  7. 【人脸识别】人脸识别损失函数学习笔记
  8. 安装过程中报错:“需要HD Audio总线驱动程序”
  9. Xiyou Linux Group 2020
  10. 一文搞定数据库连接池,太TM简单了,收藏!!!