Day45. 数据分析实战(1):超市运维数据分析


文章目录

  • Day45. 数据分析实战(1):超市运维数据分析
  • 前言
  • 一. 读取数据
  • 二. 看哪些类别的商品比较畅销
  • 三. 哪些商品比较畅销
  • 四. 不同门店的销售额占比
  • 五. 超市客流高峰时间段
  • 总结

前言

本文主要是利用超市的运营数据进行分析,通过分析,对超市近期的运行状况有一定的直观了解。看能否得到些有用的消息来改进或者优化现有的运营方式,包括销售手段,客户经营等帮助超市改善经营现状,感觉蛮有意思滴。


一. 读取数据

我们将数据放在表格中,然后用 pandas 将其读出(这里全部用的都是jupyter notebook)。
这里因为数据比较干净,所以读取之后没做清洗等操作,但不代表不重要哈。

# 导入库
import pandas as pd# 读取数据
data = pd.read_csv('超市运营数据.csv',encoding='gbk',parse_dates=["成交时间"])
# 查看数据前五行
data.head()

二. 看哪些类别的商品比较畅销

我们先将数据按照类别ID进行分组,然后对分组后的销量进行求和,最后用reset_index重置索引。

# 先分组
data_group_xl = data.groupby("类别ID")["销量"].sum().reset_index()# 为了取出销量最好的前十类商品分类,我们可以对`data_group`按照销量进行排序。
data_group_xl = data_group_xl.sort_value(by="销量", ascending=False).head(10)
# 看看分组后的数据
data_group_xl

这里我们可以看到其实销量之间差别也是很大的,这里可以根据销量进行进货预期等操作。

三. 哪些商品比较畅销

分析逻辑与上面的类别相一致。

data_group = data.groupby("商品ID")["销量"].sum().reset_index()
data_group.head(10)

这里有些区别的是上面一种是以类别进行分类的,这里是直接以销量分类的,还是有些许差别,也就是优先级不同。

四. 不同门店的销售额占比

先计算销售额,然后添加到数据中

data['销售额'] = data['销量']*data['单价']# 按照门店进行分组,对分组后的营业额进行求和并充值索引
data_group_xse = data.groupby('门店编号')['销售额'].sum().reset_index()
data_group_xse

再用饼图画出销售额占比

from pyecharts import options as opts
from pyecharts.charts import Pie# 这里不同的是,在pyecharts中,数据都是list。
x = list(data_group['门店编号'])
y = list(data_group['销售额'])
pie = (Pie().add("",[(i,j)for i,j in zip(x,y)],radius=["30%", "75%"],center=["50%", "50%"],rosetype="radius",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="门店销售额占比")).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}"))
)
pie.render_notebook();

: 这里建议还是自己去生成html或者就在jupyter里面看,功能会多一点,但是成图片之后,这种动态的(原本html里面点击三个小矩形会有变动的)特点就没有了。

五. 超市客流高峰时间段

了解客流高峰时间段是很有必要的,可以帮助超市确定什么时间开展销售活动最合适

# 首先从日趋中提取小时数(精确到小时也够了)。
data["小时"] = data["成交时间"].map(lambda x: int(x.strftime("%H")))# 然后对小时和订单进行去重
traffic = data[["小时", "订单ID"]].drop_duplicates()# 再计算每小时的订单量
traffic_count = traffic.groupby("小时")["订单ID"].count()# 最后使用订单量画出折线图
import pyecharts.options as opts
from pyecharts.charts import Linex = [str(i) for i in list(range(6,22))]
y = list(traffic_count)
line=(Line().add_xaxis(xaxis_data=x).add_yaxis(series_name="销量",y_axis=y, is_smooth=True).set_global_opts(title_opts=opts.TitleOpts(title="不同时段销量折线图"),yaxis_opts=opts.AxisOpts(axistick_opts=opts.AxisTickOpts(is_show=True),splitline_opts=opts.SplitLineOpts(is_show=True),),)
)
line.render_notebook()

  1. 我们可以从上图发现,8点到10点是潮湿一天中的销量高峰期,然后17点到19点优势一个小高峰。从实际情况来看也是比较合理的,因为这两个时间段正好对应着早上早餐或者起早买菜去做早餐以及做晚餐和下班的时间。
  2. 那我们是否可以根据这个时间特点进行打折引流等操作。
  3. 这里小伙伴也可以尝试在不同时间(一个小时)内进行分析,看在不同的时间内畅销产品的区别,这里应该可以发现不同时间的销售特点;或者产品的销售高峰(在一天内的),然后画个柱状图也比较直观,或者以产品来分类,画个散点图,看他们在一天中的分布,都是可以的idea,顺便也联系一下画图操作。

总结

这里简单的介绍了一个小小的超市运营案例分析,就是把学到的和想到的简单的实践了一下,小伙伴们有什么好的想法或者想吐槽的都可以说啊。

Day45. 数据分析实战(1):超市运营数据分析相关推荐

  1. 《Microsoft Power BI数据可视化与数据分析》之超市运营数据分析

    14.3.1  各省份销售额柱形图 在"字段"窗格中,将"销售额"字段拖到画布上的空白区域,然后将"省/自治区"字段拖动到"可视化 ...

  2. python电影数据分析报告_【python数据分析实战】电影票房数据分析(二)数据可视化...

    在上一部分<[python数据分析实战]电影票房数据分析(一)数据采集> 已经获取到了2011年至今的票房数据,并保存在了mysql中. 本文将在实操中讲解如何将mysql中的数据抽取出来 ...

  3. Power bi 超市运营数据分析

    关注微信公共号:小程在线 关注CSDN博客:程志伟的博客 数据集链接见微信公共号底端 1.启动Power BI Desktop, 从"开始"功能区中单击"获取数据&quo ...

  4. python数据分析实战之超市零售分析

    文章目录 1.明确需求和目的 2.数据收集 3.数据预处理 3.1 数据整合 3.1.1 加载相关库和数据集 3.1.2 数据概览 3.2 数据清洗 3.2.1 列名重命名 3.2.2 数据类型处理 ...

  5. 数据分析实战之超市零售分析(附python代码)

    目录 1.明确需求和目的 对一家全球超市四年(2011-2014)的销售数据进行 人.货.场分析,并给出提升销量的针对性建议. 场:整体运营情况分析,包括销售额.销量.利润.客单价.市场布局等具体情况 ...

  6. Python-玩转数据-超市运营数据分析

    一.目标 为了提高超市的运营水平,对超市的数据进行分析,以便找到阻碍超市提高盈利水平和运营能力的问题所在,有针对性地提出解决措施. 二.数据准备(虚拟数据) 三.代码 #!/usr/bin/env p ...

  7. python数据分析实战:超市零售商店

    嗨害大家好鸭!我是小熊猫❤ 其实这是一个做了好久的外包 给大家来分享一下其中的思路 有什么python相关报错解答自己不会的.或者源码资料/模块安装/女装大佬精通技巧 都可以来这里:(https:// ...

  8. python数据分析概述答案_Python数据分析实战(1)数据分析概述

    一.入门数据分析 1.大数据时代的基本面 大数据产业发展现状:现在数据已经呈现出了爆炸式的增长,每一分钟可能就会有:13000+个iPhone应用下载 Twitter上发布98000+新微博 发出1. ...

  9. 【PYTHON数据分析实战】电影票房数据分析(一)数据采集

    获取URL 我们先打开猫眼票房http://piaofang.maoyan.com/dashboard?date=2019-10-22 ,查看当日票房信息, 但是在通过xpath对该url进行解析时发 ...

最新文章

  1. Wmap5 测试80端口 Your port 80 is actually used by :Server: Microsoft-HTTPAPI/2.0
  2. SIM900A基站定位调试笔记 -转
  3. mybatis 3.2.2_环境搭建
  4. java nosql_使用NoSQL实现实体服务–第4部分:Java EE
  5. oracle 设置忽略关键字,记oracle里continue关键字的陷阱
  6. Linux中启动和停止jar包的运行
  7. Thread中interrupt()interrupted()和isInterrupted()的区别
  8. jQuery核心函数
  9. JPDA 架构研究4 - JDWP的传输器
  10. HDU2179--pi(麦金公式)
  11. [root@py ~]# watch -n 1 ifconfig 求解释
  12. SOEM建立主站程序
  13. 数据库建立索引的优缺点及适合建立索引的字段
  14. uploadify 简单使用
  15. 串口的原始模式和标准模式
  16. 打印机设备与计算机连接类型,电脑打印机的连接方式 打印机的种类有哪些
  17. nagios NSCA 被动检测
  18. C# .Net通过pythonnet调用python pyd文件
  19. aix服务器如何查看cpu信息,aix服务器查看cpu内存
  20. 新一代三维GIS技术白皮书v1.0

热门文章

  1. NTU-RGBD骨架数据分析
  2. 【推荐】jquery开发的大型web应用—H5编辑器工具
  3. 让人舒心就是领导力和内在激励
  4. # IE浏览器打不开网页,google浏览器能打开
  5. Squared Error 数学
  6. 如何去保证软件的质量
  7. mds聚类matlab,机器学习C9笔记:MDS聚类可视化
  8. 系统上线后如何确保原始数据的准确性?
  9. 为什么大数据工程师比Java程序员工资高
  10. 19、Jetson Xavier NX使用yolov5对比GPU模型下的pt、onnx、engine 、 DeepStream 加速性能