Pandas超市商品交易数据分析
首先导入pandas,读取Excel文件中的数据为data:
import pandas as pd
data = pd.read_excel(r'E:\Jupyter\Study\超市.xls')
查看前五行数据:
data.head()
查看各列的数据类型,是否为空值:
去除列名中的空格和斜杠,以便后面引用时不会报错:
data = data.rename(columns = lambda x:x.replace(" ","").replace("/",""))
检查去除后的列名:
data.columns
查看订单总数,输出结果为2773,说明数据源中1000条商品交易数据包含在这2773个订单中:
len(data.订单ID.unique())
用describe查看汇总统计集合,从结果可以得出,销售额均值为1611.75,利润均值为215.655,销售额最高为35621.35,最低为13.44,利润最高为10108.28,最低为-7978.32,接下来查看具体是什么商品:
查看利润最低的前五行,可以看出,这些利润出现了极高的负值,说明这些商品存在亏损十分严重,应当查找分析亏损的原因。
data.sort_values(by = '利润').head()
查看利润最高的前五行
data.sort_values(by = '利润',ascending = False).head()
查看各省自治区商品交易数量,输出前五名,可以看出,山东省商品交易数量是最高的,其次是广东和辽宁,前五名当中大都属于沿海省份:
data.省自治区.value_counts().head()山东 914
广东 836
辽宁 668
黑龙江 655
江苏 583
Name: 省自治区, dtype: int64
查看各省自治区商品交易数量,输出后五名,可以看出,西藏是交易数量最少的省份,其次是青海和宁夏,从地理位置上看,后五名省份大多属于西部不发达地区,由此推测与当地经济发展水平和物流服务相关。
data.省自治区.value_counts(ascending = True).head()西藏 10
青海 21
宁夏 38
新疆 39
海南 65
Name: 省自治区, dtype: int64
设置显示图片,解决Jupyter输出图表中文是方块的问题:
%matplotlib inline
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
绘制各省自治区交易数量的条形图,按照从高到低显示:
data.省自治区.value_counts().plot.bar()
绘制各省自治区销售额和利润堆积图,从图中可以看出,内蒙古、四川、江苏、浙江、湖北、甘肃、辽宁几个省份的利润为负,山东、广东、黑龙江销售额在全国各省中相对较高,利润也较高:
grouped_p[['销售额','利润']].agg('sum').plot.bar(stacked=True,title = '各省自治区销售额和利润堆积图')
Pandas超市商品交易数据分析相关推荐
- ML之FE:pandas库中数据分析利器之groupby分组函数、agg聚合函数、同时使用groupby与agg函数组合案例之详细攻略
ML之FE:pandas库中数据分析利器之groupby分组函数.agg聚合函数.同时使用groupby与agg函数组合案例之详细攻略 目录 pandas库中数据分析利器之groupby分组函数.ag ...
- 超市经营数据分析举要
超市经营数据分析举要 超市经营只有进行仔细的数据分析,才能真正抓住市场.通常,超市所需进行的数据分析项目如下: 1. 市场占有率:客源的分析 根据每一季作出访问图,描绘商圈形态,并记录每个 ...
- 超市销售数据分析python、求某一个人的营业额总和_Python+pandas使用交叉表分析超市营业额数据!这超市怕是!...
交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数实现其他功能.扩展库pandas提供了crosstab()函数用来生成交叉表,返回新的DataFrame,其语法为: ...
- python 数据分析 实际案例_python实战案例:超市营业额数据分析
实战是学习的最好途径,效率最高,本文不是很长,通过小小的练习,让大家综合运用基础知识,加深印象巩固记忆. 一.读入数据,了解数据 本数据随机生成的假数据,读者可以自己造,也可以通过下方链接下载,或者后 ...
- Day45. 数据分析实战(1):超市运营数据分析
Day45. 数据分析实战(1):超市运维数据分析 文章目录 Day45. 数据分析实战(1):超市运维数据分析 前言 一. 读取数据 二. 看哪些类别的商品比较畅销 三. 哪些商品比较畅销 四. 不 ...
- 超市销售数据分析python_python实战案例:超市营业额数据分析
实战是学习的最好途径,效率最高,本文不是很长,通过小小的练习,让大家综合运用基础知识,加深印象巩固记忆. 一.读入数据,了解数据 本数据随机生成的假数据,读者可以自己造,也可以通过下方链接下载,或者后 ...
- 基于Python的超市零售数据分析
分析框架: 一.明确需求和目的 对一家全球超市的四年(2012-2015)销售数据进行"人.货.场"分析,并给出提升销量的针对性建议. 场:整体运营情况分析,包括销售额.销量.利润 ...
- 超市销售数据分析python_基于Python的超市O2O营销数据分析
第 35 卷第 4 期 哈尔滨商业大学学报(自然科学版) Vol. 35 No. 4 2019 年 8 月 Journal of Harbin University of Commerce ( Nat ...
- 超市销售数据分析python_Python实现超市关键指标数据分析
超市月报表关键指标计算 业务背景: 现在有一个超市2017年和2016年1月和4月的经营数据,需要了解2017年4月的营业情况如何,营业情况的核心指标用销售额.客流量.客单价这三个指标来反映,这三个指 ...
最新文章
- 计算机课程成绩表排名怎么算,微机原课程设计学生成绩名次表设计.doc
- 周长最短面积最大_圆内接三角形中,正三角形周长最大值的证明
- 电脑退出全屏按哪个键_电脑键盘上的F1到F12,每一个都是快捷键大家都会用到...
- C语言switch分支结构
- ActiveMQ:了解内存使用情况
- 嗯,查询滑动窗口最大值的这4种方法不错....
- Bootstrap鼠标悬停下拉导航总结
- Linux课程实践二:编译模块实现内核数据操控
- Java——IO基础
- 力扣-559. N 叉树的最大深度
- Django模板语言(DTL)
- MATLAB怎么做出三叶玫瑰线,matlab复习题
- python大作业报告(爬虫 分析 可视化)_python第四次周末大作业
- Altera 在线资源使用
- jlink接口定义接stm32_图解Stm32使用jlink程序时jtag接口(SW和JTAG模式)的简化方法
- Java中Math类的随机数公式
- win10桌面右键一直转圈_吐血推荐:掌握这些技巧,win10工作效率提升9999%
- linux rescue 硬盘,深入浅出的了解Linux rescue
- Create an undirected graph from the adjacency list
- 移动端应该如何动态设置字体大小?