淘宝母婴用品分析(Excel)
1.前期准备
数据来源
阿里巴巴天池:baby goods info data
字段含义
总共有两个csv文件,用excel打开。
此为婴儿信息表。
三个字段:用户ID, birthday:出生日期 gender:性别(0 male,1 female, 2 未知)
总共953条记录
此为商品购买记录表。
七个字段:用户ID, 购买行为编号,商品序列号,商品类别号,商品属性,购买数量,购买日期。
共29971条记录
业务分析角度
由于缺少大量必要数据(客单价,订单金额等),只从以下三个角度分析:
- 销售角度
销量对比、销量变化趋势 - 产品角度
商品市场额度(大类、具体商品) - 用户角度
用户购买行为、用户画像
2.数据清洗(Excel)
查重
婴儿信息表,针对id查重,无重复
购买表整行查重,无重复。id重复代表复购缺失值
用countblank函数求每一列的空值,property存在144空值。
性别处理
用替换实现: 1男 0女 2未知日期处理
1 用分列 将两个表中的日期改为日期格式
2 在购买表中添加婴儿的出生日期、性别,用vlookup,以user_id为查找目标
3 添加一列计算婴儿年龄
用datediff来计算。返回错误值意味着购买日期早于出生日期,表示未出生
4年龄分段
用if实现年龄分段。未出生,0-6个月,6-12个月,1-3岁,3-6岁,6岁以上字段名改为中文,除去不需要字段,易于理解
数据预处理结束,图为清理后数据格式
数据可视化及分析
销量分析
- 年度汇总
数据记录的是2012年7月至2015二月的销售数据。为保持有效对比,选取2012-2014年的7至12月销售数据。可以看出总体销量是迅速上升的。
季度汇总
2012,2015数据不全,从13、14年的数据来看,第一季度的销量最低,第四季度最高,且从第一季度到第四季度整体呈现一个上升趋势
同比增长率
同比增长率, 一般指和去年同期相比较的增长率。能反应平台的发展状况和产品的需求变化。
同季度对比,第三四季度增幅较大(7-12月份)。12年到14年底,整体销量保持上升,特别是每年第三四季度销量的增长在80%~120%。这表明这三年在淘宝母婴用品的需求增长迅速。
第四季度保持最高销量、高增长,可能跟假期及促销活动有关(国庆、双十一、圣诞、年终促销)。
产品分析
- 商品种类分析
首先,我们按照商品类别分析,看一下哪类产品最受欢迎
商品总共有六个大类。可见最受欢迎的商品种类编号是28。所有的销售量中,前三种商品(28、50008168、50014815)市场占比将近90%。 - 商品分析
其次,我们按具体的商品分析,看看哪几个商品最受欢迎。
销量前三的商品序号为50018831(17%)、50011993(5%)、50012788(4%).总得来说商品种类多,需求多样化。50018831商品销量远远领先其他,要保持供应充足。
用户分析
因为用户信息缺失严重,正确填写婴儿性别和生日的记录大概1000+条,所以只能以这些数据来分析。可视为抽样分析。
- 婴儿性别比例
婴儿性别为男的数量是438,婴儿性别为女的数量是492。
男女比例基本一致,未知是性别填错,可忽略
- 婴儿性别偏好
整体数量上女婴家长购买力强于男婴家长。
女婴家长中最受欢迎的商品种类是50014815,男婴家长中最受欢迎的商品种类是50008168。
38、50014815两类商品可能主要是针对女性婴儿的产品,因为女婴消费占比超过70%。 - 婴儿年龄分布
购买人群中,婴儿年龄段为1-3岁的父母最多,6岁以上最少。其他年龄段类似。 - 重复购买情况
29919人次发生一次购买行为,48人次发生2次购买行为,4人次发生四次购买行为。总体来说复购率很低。
总结
- 母婴产品销量总体来看呈上升趋势,上升幅度大幅度。
- 母婴产品的销售高峰集中在每年的第四季度
- 28、50008168、50014815三类商品市场份额接近90%,50018831商品是爆款。
- 1-3岁的婴儿父母是最大消费人群,同时购买意愿也最强烈。六岁以上婴儿数量最少,市场份额低。
- 绝大多数消费者只发生一次购买行为。应该想办法提高复购率。
淘宝母婴用品分析(Excel)相关推荐
- 4 Python数据分析 淘宝母婴用品数据分析案例
Python数据分析 1 淘宝母婴用品数据分析案例 1.1 数据介绍 数据来源:Baby Goods Info Data 1.2 字段介绍 婴儿信息数据 Tianchi_mum_baby.csv 字段 ...
- 【征集需求】准备开发一个针对淘宝卖家的excel模板,实现在Excel上做帐
一个针对淘宝卖家的excel模板,实现在Excel上做帐 请大家把做帐过程中关心的功能补充上来 比如 记录款项来源 模板中提供选项 1支付保 2 工行直接汇款 3招行直接汇款 4 赊帐 等等 [提供有 ...
- 基于天池淘宝母婴用品数据的可视化分析
一.分析背景 母婴用品是淘宝的热门购物类目,随着国家鼓励二胎.三胎政策的推进,会进一步促进了母婴类目商品的销量.与此年轻一代父母的育儿观念也发生了较大的变化,因此中国母婴电商市场发展形 ...
- 淘宝母婴用品数据分析
一.分析背景及目的 本文是一次探索性分析,通过对所有常规指标进行分析,来寻找业务上优化点 二.理解数据 1.数据来源: 数据集-阿里云天池tianchi.aliyun.com 其中包含2个csv数据 ...
- SQL数据分析淘宝用户分析实操
sql也能做分析? 常见的数据清洗,预处理,数据分类,数据筛选,分类汇总,以及数据透视等操作,用SQL一样可以实现(除了可视化,需要放到Excel里呈现).SQL不仅可以从数据库中读取数据,还能通过不 ...
- 淘宝RSA分析与学习
淘宝,购物者的天堂.每天更有数以万计的用户登陆购买商品,其背后的技术支持,能让我们愉快的购物. 而前段时间吵得很火的,数据包劫持能够分析到你的各种行为,其中不乏网站账号密码.而为什么他们没有劫持到淘宝 ...
- 一、淘宝ua分析与学习之匿名函数
写在前: 我属于比较懒段的非码农,在分析淘宝ua之前没正经学习过js,对js的理解也仅仅在与简单的运算表达式.由于最近项目上需要用到前端js,遂,开始慢慢关注js方面的文章.书籍.但是我太懒,都是三天 ...
- 软件系统架构质量属性——淘宝网分析
一.可用性 可用性与系统故障及其相关后果有关 所关注的方面:如何检测系统故障,系统故障发生的频度,出现故障会发生什么情况,允许系统有多长时间非正常运行,什么时候可以安全地消除故障,如何防止故障的发生以 ...
- 第二次作业:淘宝案例分析
---恢复内容开始--- 1.介绍产品的相关信息 1.1我选择的产品是淘宝 1.2选择淘宝的理由 (列表中没有我想要分析的所以随便找一个比较熟悉的==) 一个好的产品有两个 特性,当下十分流行并且经久 ...
最新文章
- Web目录全能扫描工具DirBuster
- android资源之res/raw和assets的异同
- curl命令java_让 Bug 无处藏身,Java 线上问题排查思路、常用工具
- 主存储器物理地址,逻辑地址,转换
- Python3 协程 + 正则 批量爬取斗鱼美女图片
- 通过重新训练语音识别来改善iPhone上的嘿Siri | MOS86
- 扩展方法/对象与集合初始化器
- java素数(质数)计算
- vim编辑器在Linux系统中的用法
- excel冻结行和列_Spire.Cloud.Excel 冻结或解除冻结Excel中的行和列
- 我的第一本社会心理学(part3)--自我概念
- android短信uri,Android开发,URI 如:发短信,发彩信,调用通讯录等
- 基于FPGA 的毫米波雷达系统
- 如何在Eclipse上创建新项目
- Eclipse的配置使用
- android string.join java8_Java8 - 更优雅的字符串连接(join)收集器 Collectors.joining
- 外行假装内行,我也来谈谈SAP BAPI和BADI
- Python 3.10版本及其依赖项 Linux下源码编译 安装到指定路径/目录
- 为了在nano上进行远程连接
- 12个情人节分别是什么?