数据来源:淘宝母婴购物数据集_数据集-阿里云天池

---------------------------------------------------------------------------------------------------------------------------------

淘宝母婴销售

0.目标、要求:

01.官方要求

根据父母的购买行为预测孩子的年龄,或根据孩子的信息预测用户会购买什么样的商品

02.自我分析和要求(基于表格内容)

a.分析一级商品和二级商品的销售情况

b.分年度、季度和月度对产品总销售量进行分析

c.对不同商品销量进行对比、对不同时期销售情况进行对比,是否存在异常情况

d.孩子的性别分布情况以及不同性别的孩子最喜欢的商品类型、不同产品购买人群孩子的性别占比

e.年龄段分布、不同年龄段的销售总量情况、不同年龄段的销售偏好(哪一类产品最多)

1.数据的获取

01.数据获取来源

阿里天池:淘宝母婴购物数据集

02.表格内容

2.数据清洗和处理

01.选择有用数据

auction_id 订单号 以及 property商品属性对本次数据分析没有帮助,进行隐藏

02.删除重复数据

无重复数据

03.排除缺失值

查找和选择--定位条件--空值 无缺失值

04.一致化处理

1.购买日期和出生日期都转换成'YYYY/M/D'格式

数据-分列-其他(无)-日期

2.列名都转换成中文

3.孩子的性别转换成‘男’,‘女’,‘其他’

4.用购买日期和出生日期作差来计算孩子的年龄,并转换成年龄段,方便后续分析

05.异常值

  • 将两个表格用VLOOKUP连接后(增加了孩子年龄和年龄段),删除没有匹配的用户

  • 删除性别为‘其他’的用户数据

  • 删除年龄中的异常值,既不能为负值,也不能大于12

  • 订单数量中太大的数字不能够保留,会对数据分析产生负面影响,这个应当和相关部门进行沟通,我在数据分析过程中将一个160的购物数量删除掉(可能是团购或者企业购买),来分析零售的销售情况

3.数据可视化和分析

01.产品角度

A.一级商品销售情况

根据图标可以分析得知,50008168是销量最好的一级商品,远超过其他的商品,这应该是公司的主推商品系列

B.销量最好的一级商品下的二级商品销量TOP10

通过建设数据透视表切片器可以得到每个一级商品下的二级商品销量,选择50008168即可得到二级商品的销量排名情况,其中50013636是销量最高的二级商品

02.时间角度

A.不同年份、季度和月度销售情况

从图中可以看出,2012年到2014年商品的销量在不断增长,但是2015年却大幅度下降,但是这并不是因为2015年销量减少,根据季度销售量情况和月度销售量情况可以得知2015年只统计到2月5号。

从季度的角度分析,往往第二季度和第四季度销售量最高,个人认为这和网上购物节有关。接下来结合月度销售量进行分析;

每年第二季度(尤其是5月)销售量都比较高,可能是因为在五一劳动节期间和母亲节期间商品有优惠;同理,在十一月期间,由于双十一购物节的存在,商品的销售量增加;在每年的1-2月期间都会有一个小高峰,并且立刻回落,这是由于春节前商品打折和春节期间快递停运

B.不同产品的迭代

根据折线图可以看出,50014815在2013年第二季度有一个非常高的销售额,推测是在那个时间商品找到了代言人或者优化了产品结构或者推出了较大的优惠活动,同样也可以用来分析2014年第二季度。然而50008168几乎一直占着最高销售额,说明50008168一直是最受欢迎的产品。

03.用户性别

A.不同用户性别占比

男宝宝占比43%,略低于女宝宝的57%,说明有女宝宝的用户购买需求略大于有男宝宝的用户,当然也应当考虑当时的男女宝宝数量对比情况。

B.不同商品的性别销量对比

男宝宝和女宝宝消费量最大的产品都是50008168。由于有女宝宝的用户消费量本身大于有男宝宝的数量,因此每个商品来看女宝宝销售量都大于男宝宝销售量,其中38商品领先幅度最大,可能是商品包装或者宣传的功效方面更贴近女宝宝。

C.不同性别的商品销量对比

和前面分析的一样,男宝宝和女宝宝消费量最大的产品都是50008168。男宝宝的28和50014815消费量差不多;女宝宝的50014815消费量略高于28

04.年龄

前面为了方便分析,将年龄分成了四个阶段:0-1岁婴儿期、1-3岁幼儿期、3-7岁学龄期、7-12岁小学期

A.不同年龄段销量占比

可以看出用户的孩子多处于婴儿期和幼儿期、其次是学龄期

B.不同商品的不同年龄段销量对比

根据图表可以看出,50008168深受幼儿期用户欢迎。尽管幼儿期用户也大量购买50014815商品,但是50014815商品更受婴儿期用户欢迎。此外,学龄期和小学期选择最多的商品都是50008168

C.不同年龄段的不同商品销量对比

和前面分析一致,幼儿期、学龄期和小学期的用户都喜欢购买50008168;而婴儿期的用户更喜欢购买50014815

4.结论

1.一级商品中50008168是销量最好的,占总销量的35%,并且近期销售量依旧位于比较高的水平,说明该商品已经有了良好的市场基础和口碑,应当继续当做主要卖点抢占市场。50014815和28销售量差不多,并且都有过高销售额的经历,说明可以通过寻找代言人、投放广告等方式增加宣传,促进销售。对于122650008和50022520商品,由于数据中没有价格元素,因此无法判断这两者是高价商品还是低价但是销售量小的商品,如果是高价商品,可以适当减少产量,加强研发提高商品自身价值,并通过宣传等方式打造品牌,吸引高收入人群购买;如果是低价且不受欢迎的商品,应当进行分析是商品包装太差还是商品质量不达标,解决商品自身问题后,可以使用捆绑销售等方式让客户了解和接受这一产品并自愿消费,提升整体收益。

2.通常来说,母婴产品是用户粘性很大的产品类型,但是该店铺的却鲜有回头客(用户留存率和复购率很低),说明店铺在运营上可能存在很大问题,店铺应当尽快检查线上服务和售后是否存在问题,并给予回头客适当优惠,提高老用户的留存和复购率。

3.节日期间商品销售量远大于平时。店铺可以着重于五月的母亲节和双十一购物节,加大优惠力度,并在节日期间对平时销量一般的商品加大优惠力度,吸引用户购买。

4.男女宝宝购买的商品种类差异比较小,说明该店铺做的商品基本都是通用类型的商品,可以适当涉及一些差异化产品来吸引不同性别宝宝。

5.1-3岁幼儿期间的商品销售量最高,其次是婴儿期、学龄期、小学期。除了婴儿期用户偏好50014815之外,其他用户都是偏好50008168商品。可以加大这两款产品的推广,吸引用户,宣传推广的对象应当是0-7岁孩童的父母。

阿里天池——淘宝母婴销售项目分析相关推荐

  1. 实战整理-阿里天池淘宝用户购物行为数据集实战(MySQL数据分析+Navicat)

    数据集链接:淘宝用户购物行为数据集_数据集-阿里云天池 因原数据集过大,电脑和MySQL跑不动,故截取前一百万条数据进行实战演练. 1.导入数据 利用navicat软件直接导入下载好的Excel文件( ...

  2. 基于天池淘宝用户100万条行为数据分析——SQL、Tableau

    目录 一.项目背景和目的 1.1项目背景 1.2项目目的 二.数据来源和数据清洗 2.1数据介绍 2.2数据清洗 2.2.1观察数据添加需要的字段 2.2.2检查是否存在重复值 2.2.3检查是否存在 ...

  3. 天池-淘宝用户行为数据分析(python+Tableau)

    天池-淘宝用户行为数据分析(python+Tableau) 一.背景 ​ 用户行为分析可以让产品更加详细.清楚地了解用户的行为习惯,从而找出网站.app.推广渠道等产品存在的问题,有助于产品发掘高转化 ...

  4. 基于天池淘宝母婴用品数据的可视化分析

    一.分析背景         母婴用品是淘宝的热门购物类目,随着国家鼓励二胎.三胎政策的推进,会进一步促进了母婴类目商品的销量.与此年轻一代父母的育儿观念也发生了较大的变化,因此中国母婴电商市场发展形 ...

  5. 阿里系-淘宝接口抓取

    阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...

  6. 从标准到开源,阿里大淘宝技术的“创新担当”

    近期,中国网络通信标准与开源在多方面取得重要进展.阿里巴巴(中国)有限公司联合国内学界提交的<可交互低延时互联网多媒体传输系统需求>(GRTN)国际标准立项提案正式获批通过.阿里巴巴大淘宝 ...

  7. 阿里百川淘宝联盟私域会员对接

    阿里百川淘宝联盟私域会员对接 阿里百川 淘宝联盟 阿里百川 1.新建百川应用,阿里百川SDK已经升级到(4.0.0.2版本),开通百川电商SDK集成到安卓或IOS 2.百川SDK负责淘宝授权登陆,在百 ...

  8. 淘宝联盟开发系列:阿里妈妈淘宝客申请步骤

    一.阿里妈妈淘宝客API: 阿里妈妈淘宝客/淘客是阿里妈妈与淘宝合作开发的针对淘宝卖家的一种商品和店铺的推广模式,通过推广店铺商品推广人可以按推广商品成交价格收取一定比例的佣金这样的推广人就是淘宝客/ ...

  9. 阿里系-淘宝接口抓取及相关问题

    阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...

最新文章

  1. 实现一个基于 SharePoint 2013 的 Timecard 应用(下)
  2. LeetCode 1074. 元素和为目标值的子矩阵数量(2d前缀和+哈希)
  3. 扫雷程序设计 python_端口扫描
  4. Spring 笔记
  5. EventBus的使用
  6. 二叉排序树[2005年华中科技大学计算机保研机试真题]
  7. C# 创建Excel并写入内容
  8. 数据分析为何能指导商业决策?
  9. 51Nod 1593 公园晨跑(RMQ,ST表)
  10. 一些FORK函数的例子
  11. 缠中说禅:教你炒股票108课(转载)
  12. 局域网SDN技术硬核内幕 一 从二层到大二层
  13. omnet++tictoc12案例解析
  14. 2021-7-20 指针:强大而危险的灵魂【C++指针的应用---中下】(炉边小坐)
  15. 华为理工女,8年熬出头......
  16. 腾讯云通信、网易云通信、极光IM、阿里百川、容云通信国内云通信抉择之路 看云通信市场风云与掌控力 带腾讯云通信实战代码demo
  17. 利用指针作为游标,编写程序完成将输入字符串复制到一个字符数组中,要求每复制三个字符之后插入一个空格。 例如,若给a输入字符串:ABCDEFGHKIJK,字符数组中的内容为:ABC DEF GH
  18. 计算机最最最底层的 工作原理是怎么运行的
  19. python里offset啥意思_深度理解Jquery 中 offset() 方法
  20. 日复一日 - C++ (设计符合下述要求的日期类(Date))新人

热门文章

  1. 菱形数阵c语言,二年级奥数数阵习题及参考答案.doc-资源下载在线文库www.lddoc.cn...
  2. 面向大模型微调的instruction指令自动化生成技术:SELF-INSTRUCT指令自动化生成框架工作介绍...
  3. 阿里应用分发下架违规应用,app安全备受关注
  4. 使用百度echarts仿雪球分时图(四)
  5. java基础入门ppt_Java基础入门.ppt
  6. BZOJ3155 Preprefix sum
  7. oracle11客户端 oui.exe已停止工作,Windows Oracle 打patch(11.2.0.4)错误OUI-67073
  8. 腾讯马化腾、商汤科技汤晓鸥等六位大佬深度解读人工智能的过去、现在和未来
  9. Proteus一些元件名字~
  10. 微信小程序开放「分享到朋友圈」功能