使用Excel和Tableau分析淘宝母婴产品上新策略
1 业务分析过程:
2 数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
数据集:Baby Goods Info Data
3 理解数据:
3.1 表格概况
(sample)sam_tianchi_mum_baby_trade_history.csv 【母婴产品交易记录表】
数据大小:29971行*7列
(sample)sam_tianchi_mum_baby.csv【儿童基本信息表】
数据大小:953行*3列
【母婴产品销售分析表】是以上两个表的组合。
3.2 理解数据集各个字段的业务含义
表格一:(sample)sam_tianchi_mum_baby.csv 【儿童基本信息表】
user_id :用户ID
birthday :出生日期
gender :儿童性别
表格二:(sample)sam_tianchi_mum_baby_trade_history.csv【母婴产品交易记录】
user_id:用户ID
auction_id:交易id
item_id:产品ID
cat_id:类目ID
property:商品属性
buy_mount:购买数量
day:成交日期
4 数据清洗
4.1 列名重命名:
先将表格另存为xls格式,然后将表格内英文列名,修改为汉语,用短语概述,结果如图:
4.2 新建一列【性别】,用lookup函数对于【儿童性别】列中数据文字表示,0代表男,1代表女,2代表未知。
4.3 表格一致化处理
规范两个表格的日期格式,操作方式为:选中"日期"列—>数据—>分列—>固定宽度—>下一步—>下一步—>日期—>完成。
执行不成功,将第一行删除,其余行上移后执行成功。5 构建模型
5.1 新建一个【母婴产品销售分析】表,将两个表名改成【母婴产品交易记录】和【儿童基本信息】,并分别复制到【母婴产品销售分析】表中。
在【母婴产品销售分析】表中的【母婴产品交易记录】表输入vlookup函数,结果如下图:
#N/A表示匹配不到,需要筛选去掉:
筛选结果:
用户id按升序排列,将‘’出生日期‘’复制过去,把两张表合并成一张表:
5.2 根据交易时间,儿童生日计算出交易时对应儿童年龄。新建列并命名为儿童年龄。计算公式=(交易时间-出生日期)/365
5.3 根据【母婴产品销售分析表】,对各类目母婴产品销量进行比较。(操作步骤:全选数据->插入数据透视表->对于数据透视表字段进行设置)
生成数据透视图,使分析结果更直观。(操作步骤:数据透视表->点击右上角数据透视表的分析->点击数据透视图)
在弹出的对话框中选择“簇状柱形图”,点击确定,得到以下分析结果:
分析结论:上图类目5014815销量最高,对应竞品数量偏低,且竞争小,适合上新。5.4 基于【母婴产品销售分析表】,对于选定类目产品销量进行分析。(操作过程:全选数据->插入->数据透视表->对数据透视表字段进行设置)
筛选类目:仅分析类目5014815中产品销量,如下图:
分析总结:该类目总销量是496,产品50018831销量占46%,且与第2、3产品相差较多,上新50018831同类产品,还有很大的发展空间。5.5 分析母婴产品年度销售趋势
根据【母婴产品销售记录表】,对此表数据透视分析,字段设置如图所示:
下面是数据透视图:
分析结果:观察2012-2015销售趋势,销售态势年初到年底持续攀升的状态,建议最佳上新时间是第三季度。5.6 分析母婴产品成交记录中高频属性关键词
根据【母婴产品销售记录表】,筛选出5014815类目所有的成交记录,黏贴成交记录中产品属性列到新表格,命名为【产品属性分析表】。
通过观察知道产品属性列中,每行数据包含多个产品属性,用;间隔。对产品属性分列处理,操作步骤:选中产品属性列–>数据–>分列–>分隔符号–>下一步–>分号分隔符–>下一步–>完成。
结果如图所示,每个单元格中仅有一个属性。
统计表格中每个属性的频次,此过程分为两步:首先列举表格中包含的所有属性,其次用countif函数计算每个属性出现次数。
第一步,列举表格中包含的所有属性。此过程比较繁琐,我们用VB代码来执行此过程。操作过程:选中“开发者工具‘’下的–>查看代码–>在弹出对话框中输入代发–>执行。
在表格的最后一列会自动列举出所有的产品属性。如图所示:
第二步:在AX列计算频次,命名为“频次”,利用countif函数计算频次公式=countif(数据区域,判断条件),公式如图:
将商品属性与频次复制黏贴到新的表格,并降序排序,结果如图:
对分析的结果,利用tableau制作词云图:
结果显示1628665:3233942和1628665:3233941两个属性关键词频次最高,是消费者比较关注的属性。5.7 消费者画像
从消费者年龄与消费者性别两个维度对消费者画像进行描述
消费者年龄:首先需要先对消费者年龄进行分组,根据年龄情况分为未出生,0-1岁,1-2岁,…,9-10岁,10岁以上。
用VLOOKUP函数对年龄中每个数据进行分组匹配:
对分组后的年龄,用数据透视表统计每个年龄段出现的频次:
消费者性别:利用数据透视表分析,字段设置如图所示:
分析结果:用户年龄主要集中在0-2岁。
用户性别男女比例为1:1
对孩子的年龄范围,也可以利用tableau对于分组前数据进行可视化图表展现,如图纵轴代表频数,横轴代表孩子年龄。
6 总结与建议
6.1 分析结果显示:50014815类目,市场大,竞争小,选定此类目上新产品。
6.2 50014815类目竞品较少,产品50018831销售额占比46%,与销量第2,3名相差很大,上新同类产品有较大提升空间。
6.3 母婴新品在3季度上新时间是最佳时间,产品上新后经过加权,发现高频的关键词,抓痛点提转化,受众年龄多为0-2岁,无性别差异。
使用Excel和Tableau分析淘宝母婴产品上新策略相关推荐
- 数据分析实战——母婴产品上新策略分析
分析目的:本次分析将针对母婴类产品,根据市场销售数据分析需求,确定产品,指导上新. 本文在分析过程中参考了:张蒙:母婴产品上新策略分析(excel+tableau)的分析步骤,使用python进行分析 ...
- 淘宝店铺上新图片上传获取请求方法
淘宝上新图片上传获取请求方法如下: 1.请求方法:POST [支持高并发同时请求] 点击获取请求key和secret Headers: 参数名称 参数值 是否必须 示例 备注 Content-Type ...
- python行业中性_Python抓取分析淘宝连衣裙数据,128元真的是低价人群分界线吗?...
1.我是一个低价人群用户 上周发表文章<一个匿名用户的淘宝"连衣裙"大观>后,交流群里面很热闹地讨论了起来,小伙伴们都在秀自己的淘宝连衣裙搜索价格,相较于小伙伴们搜索出 ...
- python爬取并分析淘宝商品信息
python爬取并分析淘宝商品信息 背景介绍 一.模拟登陆 二.爬取商品信息 1. 定义相关参数 2. 分析并定义正则 3. 数据爬取 三.简单数据分析 1.导入库 2.中文显示 3.读取数据 4.分 ...
- 用户行为分析的背景以及几种模型分析、实例分析——淘宝用户行为分析
这里写目录标题 1. 绪论 1.1了解用户行为分析 1.2用户行为分析的目的 2.用户行为分析的具体内容 2.1用户行为分析的指标 2.2用户行为分析模型 2.2.1漏斗模型分析 2.2.2用户留存分 ...
- python大数据可视化分析淘宝商品,开专卖店不行啊
python大数据可视化分析淘宝商品,开专卖店不行啊 现如今大数据分析异常火爆,如何正确分析数据,并且抓住数据特点,获得不为人知的秘密?今天沉默带你用python爬虫,爬取淘宝网站进行淘宝商品大数据分 ...
- python爬取数据分析淘宝商品_python爬取并分析淘宝商品信息
python爬取并分析淘宝商品信息 Tip:本文仅供学习与交流,切勿用于非法用途!!! 背景介绍 有个同学问我:"XXX,有没有办法搜集一下淘宝的商品信息啊,我想要做个统计".于是 ...
- 弘辽科技:淘宝宝贝上下架有哪些规则?该如何优化?
原标题<弘辽科技:淘宝宝贝上下架有哪些规则?该如何优化?> 在淘宝开店成功的卖家们肯定少不了要上下架商品来维持消费者的新鲜感,但是上下架商品是不是可以按自己想法随意来呢?其实淘宝平台对于商 ...
- 淘宝搜索排名新规则 7.30发布
淘宝搜索排名新规则 一.淘宝搜索排名规则 淘宝的排名规则对淘宝卖家提高产品销量起着至关重要的作用.如何让自己的产品在淘宝的站内搜索排名靠前?怎么样让发布的产品能够在同类产品的名靠前?怎么样让别人找到你 ...
- 弘辽科技:淘宝店铺上下架规则有哪些?规则介绍
淘宝近年来发展的比较迅速,很多商家都选择在淘宝上进行开店,但是在开店之后,商家会要上架产品这些的,而淘宝上下架产品也是有一定规则的,下面来了解下淘宝店铺上下架规则是什么? 1.要注意目标客户的在线购物 ...
最新文章
- 脚本修改linux网络配置,用脚本实现Linux的网络配置
- 手机端viewport的设置规范
- python项目打包部署到ios_Python的iOS自动化打包实例代码
- vue中通过第三方代理解决跨域问题
- elasticsearch的一个bug总结
- CSS样式表书写位置
- java封装为so,java挪用.so文件
- Docker Swarm的前世今生
- 【人脸识别】基于matlab GUI FISHER人脸识别【含Matlab源码 605期】
- 汉诺塔问题详解(C语言)
- [windows]JDK安装与环境变量配置
- 微信小程序上线问题与经验总结
- mini- KMS_Activator_v1.2最新版(迷你KMS)使用方法
- 电气火灾的危害及预防
- jfreechart-x轴刻度倾斜45度
- win10 小娜搜索空白
- 2021年中国存款余额持续增长,人民币、外币存款余额均创历史新高[图]
- 虚拟服务器ip怎么配,如何向虚拟服务器分配端口和 IP 地址
- 博弈:阿里巴巴与雅虎
- Silverlight vs Flash