1.前期准备

数据来源

阿里巴巴天池:baby goods info data

字段含义

总共有两个csv文件,用excel打开。

此为婴儿信息表。
三个字段:用户ID, birthday:出生日期 gender:性别(0 male,1 female, 2 未知)
总共953条记录

此为商品购买记录表。
七个字段:用户ID, 购买行为编号,商品序列号,商品类别号,商品属性,购买数量,购买日期。
共29971条记录

业务分析角度

由于缺少大量必要数据(客单价,订单金额等),只从以下三个角度分析:

  • 销售角度
    销量对比、销量变化趋势
  • 产品角度
    商品市场额度(大类、具体商品)
  • 用户角度
    用户购买行为、用户画像

2.数据清洗(Excel)

  • 查重
    婴儿信息表,针对id查重,无重复
    购买表整行查重,无重复。id重复代表复购

  • 缺失值
    用countblank函数求每一列的空值,property存在144空值。

  • 性别处理
    用替换实现: 1男 0女 2未知

  • 日期处理
    1 用分列 将两个表中的日期改为日期格式
    2 在购买表中添加婴儿的出生日期、性别,用vlookup,以user_id为查找目标
    3 添加一列计算婴儿年龄
    用datediff来计算。返回错误值意味着购买日期早于出生日期,表示未出生
    4年龄分段
    用if实现年龄分段。未出生,0-6个月,6-12个月,1-3岁,3-6岁,6岁以上

  • 字段名改为中文,除去不需要字段,易于理解

  • 数据预处理结束,图为清理后数据格式

数据可视化及分析

销量分析

  • 年度汇总
    数据记录的是2012年7月至2015二月的销售数据。为保持有效对比,选取2012-2014年的7至12月销售数据。可以看出总体销量是迅速上升的。

  • 季度汇总
    2012,2015数据不全,从13、14年的数据来看,第一季度的销量最低,第四季度最高,且从第一季度到第四季度整体呈现一个上升趋势

  • 同比增长率
    同比增长率, 一般指和去年同期相比较的增长率。能反应平台的发展状况和产品的需求变化。

  • 同季度对比,第三四季度增幅较大(7-12月份)。12年到14年底,整体销量保持上升,特别是每年第三四季度销量的增长在80%~120%。这表明这三年在淘宝母婴用品的需求增长迅速。

  • 第四季度保持最高销量、高增长,可能跟假期及促销活动有关(国庆、双十一、圣诞、年终促销)。

产品分析

  • 商品种类分析
    首先,我们按照商品类别分析,看一下哪类产品最受欢迎

    商品总共有六个大类。可见最受欢迎的商品种类编号是28。所有的销售量中,前三种商品(28、50008168、50014815)市场占比将近90%。
  • 商品分析
    其次,我们按具体的商品分析,看看哪几个商品最受欢迎。

    销量前三的商品序号为50018831(17%)、50011993(5%)、50012788(4%).总得来说商品种类多,需求多样化。50018831商品销量远远领先其他,要保持供应充足。

用户分析

因为用户信息缺失严重,正确填写婴儿性别和生日的记录大概1000+条,所以只能以这些数据来分析。可视为抽样分析。

  • 婴儿性别比例

    婴儿性别为男的数量是438,婴儿性别为女的数量是492。
    男女比例基本一致,未知是性别填错,可忽略
  1. 婴儿性别偏好

    整体数量上女婴家长购买力强于男婴家长。
    女婴家长中最受欢迎的商品种类是50014815,男婴家长中最受欢迎的商品种类是50008168。
    38、50014815两类商品可能主要是针对女性婴儿的产品,因为女婴消费占比超过70%。
  2. 婴儿年龄分布

    购买人群中,婴儿年龄段为1-3岁的父母最多,6岁以上最少。其他年龄段类似。
  3. 重复购买情况

    29919人次发生一次购买行为,48人次发生2次购买行为,4人次发生四次购买行为。总体来说复购率很低。

总结

  1. 母婴产品销量总体来看呈上升趋势,上升幅度大幅度。
  2. 母婴产品的销售高峰集中在每年的第四季度
  3. 28、50008168、50014815三类商品市场份额接近90%,50018831商品是爆款。
  4. 1-3岁的婴儿父母是最大消费人群,同时购买意愿也最强烈。六岁以上婴儿数量最少,市场份额低。
  5. 绝大多数消费者只发生一次购买行为。应该想办法提高复购率。

淘宝母婴用品分析(Excel)相关推荐

  1. 4 Python数据分析 淘宝母婴用品数据分析案例

    Python数据分析 1 淘宝母婴用品数据分析案例 1.1 数据介绍 数据来源:Baby Goods Info Data 1.2 字段介绍 婴儿信息数据 Tianchi_mum_baby.csv 字段 ...

  2. 【征集需求】准备开发一个针对淘宝卖家的excel模板,实现在Excel上做帐

    一个针对淘宝卖家的excel模板,实现在Excel上做帐 请大家把做帐过程中关心的功能补充上来 比如 记录款项来源 模板中提供选项 1支付保 2 工行直接汇款 3招行直接汇款 4 赊帐 等等 [提供有 ...

  3. 基于天池淘宝母婴用品数据的可视化分析

    一.分析背景         母婴用品是淘宝的热门购物类目,随着国家鼓励二胎.三胎政策的推进,会进一步促进了母婴类目商品的销量.与此年轻一代父母的育儿观念也发生了较大的变化,因此中国母婴电商市场发展形 ...

  4. 淘宝母婴用品数据分析

    一.分析背景及目的 本文是一次探索性分析,通过对所有常规指标进行分析,来寻找业务上优化点 二.理解数据 1.数据来源: 数据集-阿里云天池​tianchi.aliyun.com 其中包含2个csv数据 ...

  5. SQL数据分析淘宝用户分析实操

    sql也能做分析? 常见的数据清洗,预处理,数据分类,数据筛选,分类汇总,以及数据透视等操作,用SQL一样可以实现(除了可视化,需要放到Excel里呈现).SQL不仅可以从数据库中读取数据,还能通过不 ...

  6. 淘宝RSA分析与学习

    淘宝,购物者的天堂.每天更有数以万计的用户登陆购买商品,其背后的技术支持,能让我们愉快的购物. 而前段时间吵得很火的,数据包劫持能够分析到你的各种行为,其中不乏网站账号密码.而为什么他们没有劫持到淘宝 ...

  7. 一、淘宝ua分析与学习之匿名函数

    写在前: 我属于比较懒段的非码农,在分析淘宝ua之前没正经学习过js,对js的理解也仅仅在与简单的运算表达式.由于最近项目上需要用到前端js,遂,开始慢慢关注js方面的文章.书籍.但是我太懒,都是三天 ...

  8. 软件系统架构质量属性——淘宝网分析

    一.可用性 可用性与系统故障及其相关后果有关 所关注的方面:如何检测系统故障,系统故障发生的频度,出现故障会发生什么情况,允许系统有多长时间非正常运行,什么时候可以安全地消除故障,如何防止故障的发生以 ...

  9. 第二次作业:淘宝案例分析

    ---恢复内容开始--- 1.介绍产品的相关信息 1.1我选择的产品是淘宝 1.2选择淘宝的理由 (列表中没有我想要分析的所以随便找一个比较熟悉的==) 一个好的产品有两个 特性,当下十分流行并且经久 ...

最新文章

  1. Web目录全能扫描工具DirBuster
  2. android资源之res/raw和assets的异同
  3. curl命令java_让 Bug 无处藏身,Java 线上问题排查思路、常用工具
  4. 主存储器物理地址,逻辑地址,转换
  5. Python3 协程 + 正则 批量爬取斗鱼美女图片
  6. 通过重新训练语音识别来改善iPhone上的嘿Siri | MOS86
  7. 扩展方法/对象与集合初始化器
  8. java素数(质数)计算
  9. vim编辑器在Linux系统中的用法
  10. excel冻结行和列_Spire.Cloud.Excel 冻结或解除冻结Excel中的行和列
  11. 我的第一本社会心理学(part3)--自我概念
  12. android短信uri,Android开发,URI 如:发短信,发彩信,调用通讯录等
  13. 基于FPGA 的毫米波雷达系统
  14. 如何在Eclipse上创建新项目
  15. Eclipse的配置使用
  16. android string.join java8_Java8 - 更优雅的字符串连接(join)收集器 Collectors.joining
  17. 外行假装内行,我也来谈谈SAP BAPI和BADI
  18. Python 3.10版本及其依赖项 Linux下源码编译 安装到指定路径/目录
  19. 为了在nano上进行远程连接
  20. 12个情人节分别是什么?

热门文章

  1. 废品回收城市代理加盟分销小程序开发
  2. 教务系统对某门课程的教师评教系统的设计
  3. Android获取短信验证码并自动填充的两种方式
  4. 豆瓣评分9.3,吴军博士重磅新作,修炼你的计算思维!(文末赠书)
  5. 【java】ClassLoader.getResources加载资源的顺序
  6. 关于在linux终端下使用mysql Client
  7. 「精品」手绘游戏原画绘画学习的技巧
  8. Python中文本文件的编码格式——ASCII编码和UNICODE编码
  9. web前端开发过程中如何写JavaScript程序?
  10. TRACE32——加载符号表信息用于调试