首先导入pandas,读取Excel文件中的数据为data:

import pandas as pd
data = pd.read_excel(r'E:\Jupyter\Study\超市.xls')

查看前五行数据:

data.head()


查看各列的数据类型,是否为空值:

去除列名中的空格和斜杠,以便后面引用时不会报错:

data = data.rename(columns = lambda x:x.replace(" ","").replace("/",""))

检查去除后的列名:

data.columns


查看订单总数,输出结果为2773,说明数据源中1000条商品交易数据包含在这2773个订单中:

len(data.订单ID.unique())

用describe查看汇总统计集合,从结果可以得出,销售额均值为1611.75,利润均值为215.655,销售额最高为35621.35,最低为13.44,利润最高为10108.28,最低为-7978.32,接下来查看具体是什么商品:

查看利润最低的前五行,可以看出,这些利润出现了极高的负值,说明这些商品存在亏损十分严重,应当查找分析亏损的原因。

data.sort_values(by = '利润').head()


查看利润最高的前五行

data.sort_values(by = '利润',ascending = False).head()


查看各省自治区商品交易数量,输出前五名,可以看出,山东省商品交易数量是最高的,其次是广东和辽宁,前五名当中大都属于沿海省份:

data.省自治区.value_counts().head()山东     914
广东     836
辽宁     668
黑龙江    655
江苏     583
Name: 省自治区, dtype: int64

查看各省自治区商品交易数量,输出后五名,可以看出,西藏是交易数量最少的省份,其次是青海和宁夏,从地理位置上看,后五名省份大多属于西部不发达地区,由此推测与当地经济发展水平和物流服务相关。

data.省自治区.value_counts(ascending = True).head()西藏    10
青海    21
宁夏    38
新疆    39
海南    65
Name: 省自治区, dtype: int64

设置显示图片,解决Jupyter输出图表中文是方块的问题:

%matplotlib inline
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

绘制各省自治区交易数量的条形图,按照从高到低显示:

data.省自治区.value_counts().plot.bar()


绘制各省自治区销售额和利润堆积图,从图中可以看出,内蒙古、四川、江苏、浙江、湖北、甘肃、辽宁几个省份的利润为负,山东、广东、黑龙江销售额在全国各省中相对较高,利润也较高:

grouped_p[['销售额','利润']].agg('sum').plot.bar(stacked=True,title = '各省自治区销售额和利润堆积图')

Pandas超市商品交易数据分析相关推荐

  1. ML之FE:pandas库中数据分析利器之groupby分组函数、agg聚合函数、同时使用groupby与agg函数组合案例之详细攻略

    ML之FE:pandas库中数据分析利器之groupby分组函数.agg聚合函数.同时使用groupby与agg函数组合案例之详细攻略 目录 pandas库中数据分析利器之groupby分组函数.ag ...

  2. 超市经营数据分析举要

    超市经营数据分析举要       超市经营只有进行仔细的数据分析,才能真正抓住市场.通常,超市所需进行的数据分析项目如下: 1. 市场占有率:客源的分析 根据每一季作出访问图,描绘商圈形态,并记录每个 ...

  3. 超市销售数据分析python、求某一个人的营业额总和_Python+pandas使用交叉表分析超市营业额数据!这超市怕是!...

    交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数实现其他功能.扩展库pandas提供了crosstab()函数用来生成交叉表,返回新的DataFrame,其语法为: ...

  4. python 数据分析 实际案例_python实战案例:超市营业额数据分析

    实战是学习的最好途径,效率最高,本文不是很长,通过小小的练习,让大家综合运用基础知识,加深印象巩固记忆. 一.读入数据,了解数据 本数据随机生成的假数据,读者可以自己造,也可以通过下方链接下载,或者后 ...

  5. Day45. 数据分析实战(1):超市运营数据分析

    Day45. 数据分析实战(1):超市运维数据分析 文章目录 Day45. 数据分析实战(1):超市运维数据分析 前言 一. 读取数据 二. 看哪些类别的商品比较畅销 三. 哪些商品比较畅销 四. 不 ...

  6. 超市销售数据分析python_python实战案例:超市营业额数据分析

    实战是学习的最好途径,效率最高,本文不是很长,通过小小的练习,让大家综合运用基础知识,加深印象巩固记忆. 一.读入数据,了解数据 本数据随机生成的假数据,读者可以自己造,也可以通过下方链接下载,或者后 ...

  7. 基于Python的超市零售数据分析

    分析框架: 一.明确需求和目的 对一家全球超市的四年(2012-2015)销售数据进行"人.货.场"分析,并给出提升销量的针对性建议. 场:整体运营情况分析,包括销售额.销量.利润 ...

  8. 超市销售数据分析python_基于Python的超市O2O营销数据分析

    第 35 卷第 4 期 哈尔滨商业大学学报(自然科学版) Vol. 35 No. 4 2019 年 8 月 Journal of Harbin University of Commerce ( Nat ...

  9. 超市销售数据分析python_Python实现超市关键指标数据分析

    超市月报表关键指标计算 业务背景: 现在有一个超市2017年和2016年1月和4月的经营数据,需要了解2017年4月的营业情况如何,营业情况的核心指标用销售额.客流量.客单价这三个指标来反映,这三个指 ...

最新文章

  1. 计算机课程成绩表排名怎么算,微机原课程设计学生成绩名次表设计.doc
  2. 周长最短面积最大_圆内接三角形中,正三角形周长最大值的证明
  3. 电脑退出全屏按哪个键_电脑键盘上的F1到F12,每一个都是快捷键大家都会用到...
  4. C语言switch分支结构
  5. ActiveMQ:了解内存使用情况
  6. 嗯,查询滑动窗口最大值的这4种方法不错....
  7. Bootstrap鼠标悬停下拉导航总结
  8. Linux课程实践二:编译模块实现内核数据操控
  9. Java——IO基础
  10. 力扣-559. N 叉树的最大深度
  11. Django模板语言(DTL)
  12. MATLAB怎么做出三叶玫瑰线,matlab复习题
  13. python大作业报告(爬虫 分析 可视化)_python第四次周末大作业
  14. Altera 在线资源使用
  15. jlink接口定义接stm32_图解Stm32使用jlink程序时jtag接口(SW和JTAG模式)的简化方法
  16. Java中Math类的随机数公式
  17. win10桌面右键一直转圈_吐血推荐:掌握这些技巧,win10工作效率提升9999%
  18. linux rescue 硬盘,深入浅出的了解Linux rescue
  19. Create an undirected graph from the adjacency list
  20. 移动端应该如何动态设置字体大小?

热门文章

  1. AWE2019:AI赋能 智慧生活体验全面升级
  2. 【编程实践】MDD 模型驱动开发工程师实战
  3. 华为服务器网卡激活配置文件,华为服务器网卡配置文件
  4. Ruby读写excel表格
  5. 罗德里格斯公式使用示例
  6. Linux指令的几个重要概念
  7. LinkedList 的创建与使用
  8. 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java科研项目申报系统40lsu
  9. 一篇文章学会写作,自媒体人的必经之路
  10. mysql单个查询_MySQL单表查询实例详解