一、背景及目的

从多维度对某平台2016年电商数据进行分析,总结销售规律,为来年销售计划做准备,指导之后的产品销售。

二、理解数据

三、提出分析思路

四、数据清洗

此部分请见我之前写的文章:电商数据分析之数据清洗(python)mh赵:电商数据分析之数据清洗(python)​zhuanlan.zhihu.com

五、数据分析

首先,看下2016年的整体销售情况:

2016年,订单总量是104,329,总销售额为9,066,399元,共有102,447位用户参与购买,有流水的商品数为1,000件。

1、产品数据

1)销量前十、后十的产品

看出,销量前十的产品ID为895,762、103、587、385、60、38、403、345、823,他们的销量范围在280~360之间,这些产品是比较受消费者欢迎的。

销量后十的产品id

销量后十的产品id是948、856、621、272、563、347、597、468、986、1000,销量范围在10~30之间,这些产品的购买用户较少。

2)销售额前十、后十的产品

以产品Id分组求和,选取payMoney列,并按照进行payMoney降序处理。

销售额前十的产品:

销售额排名前十的产品销售额都在25万元以上,除了产品id为385产品销售额外,其余产品销售额差距不大。

销售额后十的产品:

销售额排名后十的产品销售额均在25,000元以下,可以看到,销售额前十的产品销售额是排名后十的产品销售额的十倍。

接下来,我们看下销量和销售额最后100个的交集,如果这些产品的销量和销售额都不行,需要看看是不是要优化或者下架。

3)不同城市的销量、销售额排名,方法同产品的销量和销售额分析,下面给出代码并求出销量和销售额都低的城市id

得出,cityid为280012、280010、70002、180023、380001的城市销量和销售额都很低。我们需要对每个城市进行详细的分析,为什么这些城市销量和销售额低。可以从推广,运营,用户等多个维度查找问题,此处不再赘述。

4、所有商品的价格区间怎样?有没有一个价格区间的商品卖的非常好?

绘图时加入中文字体:导入matplotlib 中的font_manager 库:

From matplotlib import font_manager

# 设置中文字体

my_font=font_manager.FontProperties(fname='C:\Windows\Fonts\msyh.ttc',size=18)

# 先按照100的区间分桶

bins = np.arange(0,25000,100)

pd.cut(order_data.price,bins)

#直方图

plt.figure(figsize=(16,16))

plt.hist(order_data.price,bins)

plt.xlabel('价格区间',fontproperties=my_font)

plt.ylabel('数量',fontproperties=my_font)

plt.title('商品的价格分布',fontproperties=my_font)

plt.show()

结果如下:

可以看到价格区间10,000以上的商品很少,我们修改价格区间范围最大值为10,000再次展示:

a、很多价格区间是没有商品的,如果可以根据市场情况,考虑要不要补上对应商品。

下面我们查找这些价格区间:

b、价格区间0~2000的商品居多,我们按照1000分桶再看下

结果如下:

看出,价格在1000以下的产品占71%,占所有商品的大多数。我们可以多研发这些本区间热销产品。

2、用户数据

1)我们可以根据不同时间的下单量,按照时间做推广

a、按照小时来看

中午12、13、14点下单比较多,晚上20点左右下单较多,这两个高峰期,我们需要着重推广商品。且下单高峰时段,我们也要注意网站的稳定性和可用性,不要因为一些不必要的因素导致销量低。

b、按照星期来看

周末下单最多,其次是周四周五

c、按照月来看每月交易情况

先将创建时间设置为表的索引:

df = order_data.set_index('createTime',inplace=False)

注意设置变量接收,尽量保持原表完整,便于下面分析。

制作每月销售额曲线:

看到,2016年从4月份销售额逐渐上升,7月份销售额最高,8月份稍有下降,9月份急剧下降。

再看2016年销量:

对于销量,5月份快速上升,7月达到最高销量,8月有所下降,9月急剧下降,销量趋势和销售额曲线基本吻合。

2)下单多久后支付

首先定义一个函数,获取支付时间和创建时间差(单位秒),并添加到列

查看是否添加成功

在payDelta列分桶:

画饼图的时候,若有重合部分,我们可以调整分桶区间

饼图显示,支付时间在10分钟以内的用户占大多数(97%)

3、渠道数据

1)不同渠道的销量

看到,渠道2和渠道3的销量明显多于其他渠道的销量,再看不同渠道的销售额

2)不同渠道销售额

渠道2和渠道3的销售额也明显多于其他渠道销售额。可以看到,渠道2销量多与渠道3销量,但渠道2销售额小于渠道3的销售额,我们需要结合成本等来逐渐优化。对于销量和销售额都很低的渠道5、6我们要结合实际看看之后是否还要继续通过这两个渠道来进行推广。

六、结论及建议

1、2016年,订单总量是104,329,总销售额为9,066,399元,共有102,447位用户参与购买,有流水的商品数为1,000件。

2、不管是销量还是销售额来看,热销产品还是表较多的,我们可以结合市场情况主推销量和销售额都很多的385号产品;

对于销量和销售额都很低的产品,我们需要看看是要优化这些产品还是下架(具体产品参考problem_productId)。

3、对于各城市的销售分析看出,ityid为280012、280010、70002、180023、380001的城市销量和销售额都比较低。

具体情况我们还要对每个城市进行详细分析,为什么这些城市销量和销售额低。可以从推广,运营,用户等多个维度查找问题。

4、价格区间分析中,我们看到价格在1000元以下的产品占比71%,我们可以多研发这些区间的热销产品;对于没有商品的价格区间

我们可以根据市场情况,考虑要不要补上对应商品。

5、用户每小时的下单量,中午12、13、14点下单比较多,晚上20点左右下单较多,这两个高峰期,我们需要着重推广商品。且下单高峰时段,我们也要注意网站的稳定性和可用性,不要因为一些不必要的因素导致销量低。

从周看,周末的下单量最多,周四周五次之。

2016年每月销售分析趋势看,每年5月左右销售逐渐变好,8月稍有下降,9月份急剧下降,到11月跌至最低。

6、从用户下单到用户支付时间差看,用户支付时间在10分钟以内的占大多数(97%),说明用户的购买意愿、目的性强。

7、渠道2销量多与渠道3销量,但渠道2销售额小于渠道3的销售额,我们需要结合成本等来逐渐优化。对于销量和销售额都很低的渠道5、6我们要结合实际看看之后是否还要继续通过这两个渠道来进行推广。

python电商_电商数据分析(python)相关推荐

  1. python编程基础_月隐学python第2课

    python编程基础_月隐学python第2课 学习目标 掌握变量的输入和输出 掌握数据类型的基本概念 掌握算数运算 1.变量的输入和输出 1.1 变量输入 使用input输入 input用于输入数据 ...

  2. 查看Python的版本_查看当前安装Python的版本

    一.查看Python的版本_查看当前安装Python的版本 具体方法: 首先按[win+r]组合键打开运行: 然后输入cmd,点击[确定]: 最后执行[python --version]命令即可. 特 ...

  3. python武汉工资_进来看看学Python的工资有多高?

    80% 的朋友都希望可以通过 Python 找到一个高薪工作.但现在市场在变化,大部分都只能勉强凑合. 为什么这么说?先来看看 Python 相关的工作状况: 技能太窄能力受限:只会 Python 爬 ...

  4. python函数解读_通过7个Python函数来解释区块链

    我想对于那里的很多人来说,区块链就是这种现象,很难不让你头脑发热.我开始观看视频和阅读文章,但对我个人而言,直到我编写自己的简单区块链,我才真正理解它是什么以及它的潜在应用价值. 我对区块链的看法是它 ...

  5. 虫术python绝技下载_《虫术——Python绝技》梁睿坤著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: 梁睿坤著 出版社:电子工业出版社 出版时间:2018.6.30 版次:1 开本:16 ISBN:9787121344565 版权提供:电子工业出版社 基本信息 书名:虫术--Pyth ...

  6. python新手难点_初学两天python的操作难点总结

    已经学习两天python,将我认为的操作难点进行总结 1 在cmd下 盘与盘之间的切换 直接 D或d: 就好 2 查找当前盘或者文件下面的目录 直接 dir 3 想在一个盘下进去一个文件夹,用cd空格 ...

  7. python职位应聘_我去面试Python岗位了

    最近换工作了,坐标上海,裸辞,之前早有前辈们说过,"裸辞一时爽,一直裸辞一直爽",这话一点不假,裸辞你要面临没有收入来源,但是每天眼睁睁看着各种花销不断支出的煎熬,我主要是觉得一边 ...

  8. python编程基础_月隐学python第一课

    1.概述 本文是用于描述本人学习python的过程,这是第1课情况. 2.学习目标 了解python基础知识 理解程序和程序翻译的两种形式 掌握使用pycham编程基本步骤 重点掌握变量定义 掌握数据 ...

  9. python并行运算库_最佳并行绘图Python库简介:“ HiPlot”

    python并行运算库 HiPlot is Facebook's Python library to support visualization of high-dimensional data ta ...

最新文章

  1. 精准广告系统架构调研
  2. CSS3 @keyframes animate
  3. 2010提高组-乌龟棋 [记忆优化搜索]
  4. Servlet/Tomcat/ Spring 之间的关系
  5. 向上弹出菜单jQuery插件
  6. 全球数据库--基金/管理产品--分类/行业平均
  7. 在Java中避免NullPointerException
  8. 那年学过的web后端笔记
  9. 开源文化依旧熠熠生辉 —— 在openEuler社区,有技术、有idea,你就是主角
  10. hadoop longwritable类
  11. Centos 设置时区和时间以及增加中文输入法
  12. 【E2EL5】A Year in Computer Vision中关于图像增强系列部分
  13. php-fpm 相关
  14. 全国多地元旦迎雾霾天气 京津冀霾明天短暂减弱
  15. 各种符号的英文读法读音单词
  16. 依分布收敛的定义细节
  17. 3.3 泰勒(Taylor)公式和麦克劳林(Maclaurin)公式
  18. 解决Sqoop导出数据报错Can‘t parse input data 和 NoSuchElementException
  19. vi之列操作——步步为营+实例
  20. 【嵌入式12】DMA通信原理及编程实验,DMA方式向上位机连续发送数据

热门文章

  1. AutoCAD2018_编辑工具
  2. 通过调用接口查询ISBN的图书信息
  3. 鸿蒙跨屏协作实现原理,跨屏协作满足效率党 高效工作这几款手机必备
  4. 绘声绘影2022绿色旗舰版安装教程及功能介绍
  5. opencv入门基础——图像读取,图像显示,图像保存
  6. 依赖倒转原则与里氏代换原则
  7. Elasticsearch 7.3.0 翻译 - 《Aggregations》 度量聚合 百分位数聚合
  8. Android获取手机的卡槽数量和sim卡数量
  9. ANSYS的宏文件mac的创建和应用
  10. 百度云盘搜索引擎微信公证号_全L导演 H265 1080P 双语版@微信公众号edy521