数据分析流程:

1、总体运营指标
2、从价格区间找出表现不好的产品,优化商品结构
3、从折扣区间来找出表现不好的产品,优化商品结构

import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')

此次分析的目标:

评估每次促销活动的结果,并根据情况优化商品结构,以便让自己的商品卖的更好。

1、数据预处理
1.1 读取各部分数据集
import sqlalchemy
engine = sqlalchemy.create_engine('mysql+pymysql://root:root-123@localhost:3306/wphcx')
# 读取数据
# 商品信息表
sql_cmd = "select * from sales_info1"# 执行sql语句,获取数据
dt1 = pd.read_sql(sql=sql_cmd, con=engine)dt1.rename(columns={"sale_name":"商品名","sale_price":"售卖价","tag_price":"吊牌价","discout":"折扣率","stocks":"库存量","stocks_value":"货值","cost_price":"成本价","profit_rate":"利润率","skus":"SKU"},inplace=True)dt1.head()
# 读取数据
# 商品热度表
sql_cmd = "select * from sales_info2"# 执行sql语句,获取数据
dt2 = pd.read_sql(sql=sql_cmd, con=engine)dt2.rename(columns={"sale_name":"商品名","uvs":"UV数","collections":"收藏数","carts":"加购物车数"},inplace=True)dt2.head()
# 读取数据
# 用户销售明细表
sql_cmd = "select * from sales_info3"# 执行sql语句,获取数据
dt3 = pd.read_sql(sql=sql_cmd, con=engine)dt3.rename(columns={"user_id":"用户id","buy_date":"购买日期","sale_name":"商品名","buy_cons":"购买数量","buy_price":"购买单价","cost_price":"购买金额","is_tui":"是否退货","tui_cons":"退货件数","tui_price":"退货金额"},inplace=True)dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0})
dt3.head()
1.2 合并商品信息表和商品热度表数据
# 把商品信息加上该商品的热度信息
# 得到基础的商品信息,以及商品的一些热度信息:加购物车数量,收藏数量、uv数
dt_product = dt1.merge(dt2,how="left",on="商品名")
dt_product.head()
1.3 合并商品信息表和商品热度表数据和用户销售明细表
# 统计每个商品的一个销售情况product_sales = dt3.groupby("商品名").agg({"购买数量":"sum","购买金额":"sum","退货件数":"sum","退货金额":"sum","购买单价":"mean","用户id":pd.Series.nunique}).reset_index()product_sales.rename(columns={"购买数量":"商品销售数量","购买金额":"商品销售金额","是否退货":"商品退货数量","退货金额":"商品退货金额","购买单价":"商品销售单价","用户id":"购买用户数量"},inplace=True)product_sales.head()
# 合并商品信息
dt_product_sales = dt_product.merge(product_sales,how="left",on="商品名")
dt_product_sales.head()

2、总体运营情况评价

总体运营部分,主要关注销售额、售卖比、UV、转化率等指标,其他指标作为辅助指标。销售额用来和预期目标做对比,售卖比用来看商品流转情况。

  • GMV:销售额,在唯品会里称为到手价。
  • 实销:GMV – 拒退金额。
  • 销量:累计销售量(含拒退)。
  • 客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
  • UV:商品所在页面的独立访问数。
  • 转化率:客户数 / UV。
  • 折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
  • 备货值:吊牌价 * 库存数。
  • 售卖比:又称售罄率,GMV / 备货值。
  • 收藏数:收藏某款商品的用户数量。
  • 加购数:加购物车人数。
  • SKU数:促销活动中的SKU计数(一般指货号)。
  • SPU数:促销活动中的SPU计数(一般指款号)。
  • 拒退量:拒收和退货的总数量。
  • 拒退额:拒收和退货的总金额。
#1、GMV:销售额,包含退货的金额
gmv = dt_product_sales["商品销售金额"].sum()
gmv

3747167.0

#2、实际销售额=GMV - 退货金额
return_sales = dt_product_sales["商品退货金额"].sum()
return_money = gmv - return_sales
return_money

2607587.0

#3、销量:累计销售量(含拒退)
all_sales = dt_product_sales["商品销售数量"].sum()
all_sales

12017

#4、客单价:GMV / 客户数,客单价与毛利率息息相关,一般客单价越高,毛利率越高。
# dt3.user_id.unique().count()custom_price = gmv / dt_product_sales["购买用户数量"].sum()
custom_price

493.56783456269756

# 5、UV:商品所在页面的独立访问数
uv_cons = dt_product_sales["UV数"].sum()
uv_cons

1176103

# 6、转化率:客户数 / UV。
uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum()
uv_rate

0.006455216932530569

# 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量),在日常工作中,吊牌额是必不可少的。
tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"])
discount_rate= gmv / tags_sales
discount_rate

0.4179229541452886

# 8、备货值:吊牌价 * 库存数。
goods_value = dt_product_sales["货值"].sum()
goods_value

18916395

# 9、售卖比:又称售罄率,GMV / 备货值。
sales_rate = gmv / goods_value
sales_rate

0.19809096817866195

# 10、收藏数:收藏某款商品的用户数量。
coll_cons = dt_product_sales["收藏数"].sum()
coll_cons

6224

# 11、加购数:加购物车人数。
add_shop_cons = dt_product_sales["加购物车数"].sum()
add_shop_cons

18690

# 12、SKU数:促销活动中的最小品类单元(一般指货号)。
sku_cons = dt_product_sales["SKU"].sum()
sku_cons

125

# 13、SPU数:促销活动中的SPU计数(一般指款号)。
spu_cons = len(dt_product_sales["商品名"].unique())
spu_cons

80

# 14、拒退量:拒收和退货的总数量。退货件数
reject_cons = dt_product_sales["退货件数"].sum()
reject_cons

3643

# 15、拒退额:拒收和退货的总金额。
reject_money = dt_product_sales["商品退货金额"].sum()
reject_money

1139580.0

# 汇总统计
sales_state_dangqi = pd.DataFrame({"GMV":[gmv,],"实际销售额":[return_money,],"销量":[all_sales,],"客单价":[custom_price,],"UV数":[uv_cons,],"UV转化率":[uv_rate,],"折扣率":[discount_rate,],"货值":[goods_value,],"售卖比":[sales_rate,],"收藏数":[coll_cons,],"加购数":[add_shop_cons,],"sku数":[sku_cons,],"spu数":[spu_cons,],"拒退量":[reject_cons,],"拒退额":[reject_money,],}, ) #index=["今年双11",]# 去年的数据是已经统计好了的,这里用来做展示,不需要计算(写死的内容)
sales_state_tongqi = pd.DataFrame({"GMV":[2261093,],"实际销售额":[1464936.517,],"销量":[7654,],"客单价":[609.34567,],"UV数":[904694,],"UV转化率":[0.0053366,],"折扣率":[0.46,],"货值":[12610930,],"售卖比":[0.1161,],"收藏数":[4263,],"加购数":[15838,],"sku数":[82,],"spu数":[67,],"拒退量":[2000,],"拒退额":[651188.57,],}, ) #index=["去年双11",]#sales_state = pd.concat([sales_state_dangqi, sales_state_tongqi])
sales_state_dangqi_s = pd.DataFrame(sales_state_dangqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_dangqi_s.columns = ["指标","今年双11"]
sales_state_tongqi_s = pd.DataFrame(sales_state_tongqi.stack()).reset_index().iloc[:,[1,2]]
sales_state_tongqi_s.columns = ["指标","去年双11"]
sales_state = pd.merge(sales_state_dangqi_s, sales_state_tongqi_s,on="指标")
sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"]
sales_state

3、从价格区间来优化商品结构

我们需要做的是,深入探究不同区间的数据,以此来优化后期的促销结构。首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等数据。
查看指标:

  • 销售额
  • 销量
  • 件单价
  • 客户数
  • UV
  • 转换率
  • 库存
  • 货值
  • 售卖比
# 划分价格区间段
# 设置切分区域
listBins = [0,200, 400, 100000]# 设置切分后对应标签
listLabels = ['1_200','200_400','400及以上']# 利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致
"""
pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
x:需要切分的数据
bins:切分区域
right : 是否包含右端点默认True,包含
labels:对应标签,用标记来代替返回的bins,若不在该序列中,则返回NaN
retbins:是否返回间距bins
precision:精度
include_lowest:是否包含左端点,默认False,不包含
"""
dt_product_sales['价格分组'] = pd.cut(dt_product_sales['售卖价'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
价格区间销售情况统计
  • 价格区间
  • 货值
  • 货值占比
  • 销售额
  • 售卖比
  • 销售占比
  • 销量
  • 客单价
  • UV
  • 收藏数
  • 加购数
  • 转化率
# 货值占比、销售占比、客单价、转化率  后面求
dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({"货值":"sum","商品销售金额":"sum","商品销售数量":"sum","UV数":"sum","购买用户数量":"sum","收藏数":"sum","加购物车数":"sum"}).reset_index()
dt_product_sales_info.head()
# 货值占比、销售占比、客单价、转化率
dt_product_sales_info["货值占比"]=dt_product_sales_info["货值"]/dt_product_sales_info["货值"].sum()
dt_product_sales_info["销售占比"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["商品销售金额"].sum()
dt_product_sales_info["客单价"]=dt_product_sales_info["商品销售金额"]/dt_product_sales_info["购买用户数量"]
dt_product_sales_info["转化率"]=dt_product_sales_info["购买用户数量"]/dt_product_sales_info["UV数"]dt_product_sales_info.head()
# 取出400及以上价格区间的数据内容
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上']
product_400.head()
计算商品指标
  • 销售额
  • 销量
  • 件单价
  • 客户数
  • UV
  • 转换率=客户数 / UV
  • 库存
  • 备货值=吊牌价 * 库存数
  • 售卖比=又称售罄率,GMV / 备货值
# 转换率=客户数 / UV
product_400['转换率'] = product_400["购买用户数量"]/product_400["UV数"]
# 备货值=吊牌价 * 库存数
product_400["备货值"] = product_400["吊牌价"]*product_400["库存量"]
product_400.head()
# 售卖比=又称售罄率,GMV / 备货值
product_400["售卖比"] = product_400["商品销售金额"]/product_400["备货值"]
product_400.head()
product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]

优化方案:

  • 转化率大于0.7%的商品,暂时保留,用于下次促销活动;
  • 转化率小于0.7%的商品,但是售卖比大于36%的商品予以保留参加下次促销活动,
  • 转化率小于0.7%的商品,并且售卖比小于36%的商品进行清仓处理。
# 挑选合格的商品:
# 1、保留商品:转化率大于0.7%的商品予以保留
stay_stocks571 = product_400[product_400["转换率"]>0.007]
stay_stocks571
# 挑选合格的商品:
# 2、保留商品:找出转化率小于0.7% 但是 售卖比大于36%的部分予以保留
stay_stocks573 = product_400[(product_400["售卖比"]>=0.36)&(product_400["转换率"]<0.007)]
stay_stocks573
# 3、清仓处理商品,找出转化率小于0.7%并且售卖比小于36%的部分
stay_stocks574 = product_400[(product_400["售卖比"]<0.36)&(product_400["转换率"]<0.007)]
stay_stocks574
4、从折扣区间来优化商品结构

同样地,我们选择0.35-0.4折扣区间进行深入探究。dt_product_discount_info表中,我们可以得到0.35-0.4折扣区间的售卖比为16.90%,转化率为0.53%,折扣率为37%,在进行商品结构优化的时候要着重对比这几个指标。

dt_product_sales.head()
# 划分价格区间段
#设置切分区域
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1]#设置切分后对应标签
listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1']#利用pd.cut进行数据离散化切分,注意分组标签和分组数要一致
"""
pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
x:需要切分的数据
bins:切分区域
right : 是否包含右端点默认True,包含
labels:对应标签,用标记来代替返回的bins,若不在该序列中,则返回NaN
retbins:是否返回间距bins
precision:精度
include_lowest:是否包含左端点,默认False,不包含
"""
dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True)
dt_product_sales.head()
折扣区间销售情况统计
  • 价格区间
  • 货值
  • 货值占比
  • 销售额
  • 售卖比
  • 销售占比
  • 销量
  • 客单价
  • UV
  • 收藏数
  • 加购数
  • 转化率
# 货值占比、销售占比、客单价、转化率  后面求
dt_product_discount_info = dt_product_sales.groupby("折扣区间").agg({"货值":"sum","商品销售金额":"sum","商品销售数量":"sum","UV数":"sum","购买用户数量":"sum","收藏数":"sum","加购物车数":"sum"}).reset_index()
dt_product_discount_info
# 货值占比、销售占比、客单价、转化率  后面求
dt_product_discount_info["货值占比"]=dt_product_discount_info["货值"]/dt_product_discount_info["货值"].sum()
dt_product_discount_info["销售占比"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["商品销售金额"].sum()
dt_product_discount_info["客单价"]=dt_product_discount_info["商品销售金额"]/dt_product_discount_info["购买用户数量"]
dt_product_discount_info["转化率"]=dt_product_discount_info["购买用户数量"]/dt_product_discount_info["UV数"]dt_product_discount_info
# 取出0.35-0.4价格区间的数据内容
product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4']
product_354.head()
计算商品指标
  • 销售额
  • 销量
  • 件单价
  • 客户数
  • UV
  • 转换率=客户数 / UV
  • 库存
  • 货值=吊牌价 * 库存数
  • 售卖比=又称售罄率,GMV / 备货值
# 转换率=客户数 / UV
product_354['转换率'] = product_354["购买用户数量"]/product_354["UV数"]
# 备货值=吊牌价 * 库存数
product_354["备货值"] = product_354["吊牌价"]*product_354["库存量"]
product_354.head()
# 售卖比=又称售罄率,GMV / 备货值
product_354["售卖比"] = product_354["商品销售金额"]/product_354["备货值"]
product_354.head()
product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数","库存量","备货值","折扣率","售卖比",'转换率']]

优化结果:

  • 折扣率**大于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;

  • 折扣率**小于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。

# 挑选合格的商品:
# 1、保留商品:折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留
stay_stocks1 = product_354[(product_354["折扣率"]>0.37)&(product_354["售卖比"]>0.365)&(product_354["转换率"]>0.007)]
stay_stocks1
# 2、清仓处理商品,不满足条件的:折扣率大于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品
# 取反即可
stay_stocks2 = product_354[(product_354["折扣率"]>=0.37)&((product_354["售卖比"]<=0.365)|(product_354["转换率"]<=0.007))] #
stay_stocks2
# 挑选合格的商品:
# 3、保留商品:在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留
stay_stocks3 = product_354[(product_354["折扣率"]<=0.37)&(product_354["转换率"]>0.007)&(product_354["售卖比"]>0.365)]
stay_stocks3
# 4、清仓处理商品,不满足此条件的:在折扣率小于37%的部分找出售卖比小于36.5%或转化率小于0.7%的部分
# 取反即可
stay_stocks4 = product_354[((product_354["折扣率"]<0.37) & ((product_354["售卖比"]<0.365)|(product_354["转换率"]<0.007)))]
stay_stocks4

优化结果:

  • 折扣率**大于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留,其余进行清仓处理;

  • 折扣率**小于37%**的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,其余进行清仓处理。

电商促销复盘分析项目相关推荐

  1. 唯品会电商销售复盘分析

    什么是特卖: 唯品会是一个专门做特卖的网站,什么是特卖呢.特卖一般是指在特定的时间段里,以优惠的价格出售指定的商品,一般以商城或者专卖店为多.该模式在线下早已存在(比如商场促销.街边的尾货甩卖),在国 ...

  2. 如何从0到1搭建电商促销系统?

    看到社区有很多电商促销方面的问题,恰好我们也在做这方面的分析和设计,跟大家一起探讨一下. 目录: 1.三种优惠类型 1)代金券   2)满减或满赠   3)活动价 2.发放优惠 3.使用优惠 1)优惠 ...

  3. 电商促销海报PSD分层模板|创意合成,这样的设计越来越吃香!

    了解电商行业的设计师都知道,从10月份开始,各种大促活动就处于不间断放送,根本不会给你充足的时间去系统的学习,优图网 专注高品质电商素材,提前准备了创意合成的电商促销海报PSD分层模板,这样的设计越来 ...

  4. 电商促销海报PSD模板|临摹优秀,设计好的banner广告从试炼开始!

    每当你打开淘宝时,首页的banner广告总是会弹出你近期浏览过的或者是购买过的同类产品,这就是淘宝善于使用个人大数据,从而达到精准推广的效果. 而设计师在设计banner广告图之前,一般会参考之前投放 ...

  5. 数据集收集-包含《COVID-19》,《英国在线零售业务》,《电商行业用户行为分析数据集》,《电商婴儿用户》,《亚马逊手机》等17个数据集,用于数据分析挖掘,kaggle比赛练习

    COVID-19数据集 本数据集记录了2019年12月01日至2020年7月24日,每日精确到国家.省.市的确诊.疑似.治愈.死亡人数.2020年02月07后数据从今日头条接口采集,每小时57分自动更 ...

  6. 工厂模式+策略模式组合实现电商促销活动

    项目中大多数设计模式都是组合使用的,对于单个设计模式小伙伴们可以去菜鸟教程学习一下,下面使用 Java 实现的工厂模式+策略模式组合实现电商促销 首先,根据策略的不同,一些需要优惠计算,一些需要普通计 ...

  7. Excel电商女装评价分析

    电商女装评价分析 数据来源:https://www.kesci.com/home/dataset/5aab7e09afaabd5e93e4df30/project 项目背景 基于某电商女性服装评论数据 ...

  8. 电商离线数仓项目实战(下)

    电商离线数仓项目实战(下) 电商分析--核心交易 文章目录 电商离线数仓项目实战(下) 电商分析--核心交易 一.业务需求 二.业务数据库表结构 1. 数据库表之间的联系 img 2. 业务数据库-- ...

  9. 插画素材模板 | 玩转电商促销季插画设计

    随着审美流行趋势的变化,电商设计的新鲜创意也层出不穷,表达手法日新月异,尤其插画应用的比重格外突出. 电商设计中,因风格或创意内容需要制作一些可爱.搞怪.梦幻.内容量庞大的超现实画面,而插画设计可以充 ...

最新文章

  1. 模态框获取id一直不变,都是同一个id值
  2. [转]opensuse 更新源
  3. 8/人天,小记一次 JAVA(APP后台) 项目改造 .NET 过程(后台代码已完整开源于 Github)...
  4. 《数据安全法》今日实施,中国信通院联合百度等企业发起“数据安全推进计划”
  5. 如何在SAP S/4HANA Cloud系统里创建employee
  6. LINUX BASH SHELL,小小学习一下
  7. 查询指定范围内数据记录(适用于sqlserver2005以上)
  8. 原 R语言柱状图排序和x轴上的标签倾斜
  9. 边缘计算安全技术综述
  10. bangteng文件夹各种方式尝试后删除不了的解决办法
  11. Flex读取xml文件
  12. 【debug】写应用程序时遇到的桌面图标、运行图标、背景图片问题
  13. 如何有效地使用t-SNE | How to Use t-SNE Effectively
  14. 面试官最常问的问题总结(一)
  15. buntu12.10 64位 + android-ndk-r9 编译ffmpeg遇到的问题
  16. SCI/SCIE/SSCI/期刊简介及官方查询验证方法
  17. 基于python3的群聊聊天室
  18. 哪款蓝牙耳机通话效果好?蓝牙耳机通话效果最好排名
  19. Java面试宝典之:基础篇
  20. RedHat 系软件包管理

热门文章

  1. 虚拟机---虚拟机打开控制台
  2. Android 日历开发教程[二]
  3. 心理学如何影响用户决策—社会认同效应
  4. 雷军演讲全文:我看未来20年
  5. Kaggle宝典|使用Python进行全面的数据探索
  6. C语言(通识)_对三子棋的简单实现
  7. java的源代码存放于_android开发工程目录中用来存放java源代码的是哪个目录?
  8. 苹果内存其他怎么清理_这才是清理苹果手机内存的方法,清理后流畅好几倍,太好用了...
  9. 安装时间大于30秒_get朋友圈超长视频模版, 点亮朋友圈30秒“带货神器”
  10. 【reactjs】requestIdleCallback 和 requestAnimationFrame对比