分布、描述性统计和贡献度分析
一、实验目的
(1) 掌握分布分析的方法。
(2) 掌握描述性统计分析的方法。
(3) 掌握贡献度分析的方法。
二、实验内容
(1) 销售额分布分析。
(2) 销售数量描述性统计分析。
(3) 销售数量贡献度分析。
三、实验过程、内容
1. 销售额分布分析
使用分布分析统计各销售额区间(此处以173作为组距,共分成5个销售额区间)的销售额频率分布,并绘制其频率分布直方图
导入库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#导入数据集
df =pd.read_excel('新零售智能销售设备6月份商品销售情况.xlsx')
#查看数据集
df.head()
绘制频率直方图
bins = [0,173,346,519,692,865]
labels = ['[0,173)','[173,346)','[346,519)','[519,692)','[692,865)']
df['销售额分层']=pd.cut(df['销售额(元)'],bins ,labels=labels)
aggResult= df.groupby(by=['销售额分层'])['销售额(元)'].agg([("销售额(元)",np.size)])
pAggResult = round(aggResult/aggResult.sum(), 2, )*100
plt.figure(figsize=(10,6))
pAggResult['销售额(元)'].plot(kind='bar',width=0.6,fontsize=10)
plt.rcParams['font.sans-serif']=['SimHei'] #正常显示中文标签
plt.title('销售额频率直方图',fontsize=20)
plt.show()
2. 销售数量描述性统计分析
使用描述性统计分析对销售数量计算其基本的统计量结果,并根据输出结果进行分析
data = df['销售数量(个)']
statistics = data.describe()
statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位数间距
print(statistics)
3. 盈利额贡献度分析
使用贡献度分析统计各商品的盈利额贡献度,并绘制各商品的帕累托图进行分析
data = df['盈利额(元)'].copy()
data.sort_values(ascending=False,inplace=False)
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
plt.figure()
data.plot(kind='bar')
plt.ylabel('盈利额(元)')
p = 1.0*data.cumsum()/data.sum()
p.plot(color='r', secondary_y=True, style='-o',linewidth=2)
plt.ylabel('盈利额(比例)')
plt.show()
分布、描述性统计和贡献度分析相关推荐
- 更新:描述性统计和相关性:EAP.portfolio_anaysis.Univariate
实证资产定价(Empirical asset pricing)已经发布于Github和Pypi. 包的具体用法(Documentation)博主将会陆续在CSDN中详细介绍,也可以通过Pypi直接查看 ...
- 黄开宁:搞多媒体开发要掌握好信号处理、统计和数理分析
尽管有WebRTC和FFmpeg这样的超级工具,但多媒体开发的核心难点的难度并没有因此降低,这需要开发者掌握牢固的基础知识.LiveVideoStack专访了即构科技音视频技术资深架构师黄开宁,他对学 ...
- python变量贡献率排序_3.2.5 贡献度分析
贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律.同样的投入放在不同的地方会产生不同的效益.例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品,而其他80%的产品只产生了 ...
- 【直流潮流】基于直流潮流的电力系统停电分布及自组织临界性分析
1.软件版本 matlab2013b 2.系统概述 整个算法的流程图,OPA模型的流程图如下: 详细的讲,我们的这个算法的安如下的步骤进行: 步骤1:k=k+1,通过慢动态过程中的几个公式,对Pmax ...
- 数据统计分析案例(对比分析、销量定比分析、同比、双坐标图、环比、shift、贡献度分析(帕累托法则)、差异化分析、resample、季节性波动分析)
本文来自<Python数据分析从入门到精通>--明日科技编著 本章以案例为主,通过简单的知识讲解使读者了解数据统计分析中常用的分析方法,如对比分析,同比.定比和环比分析,贡献度分析,差异化 ...
- python的基本统计和分组分析和分布分析和交叉分析和结构分析
import pandas fa=pandas.read_csv('D://Python projects//reference data//5.1//data.csv') #查看学生分数的描述性统计 ...
- 【统计和图形分析】上海道宁为您带来测试、分析、改进和控制自身服务、交易和制造流程的强大工具——SigmaXL
SigmaXL是 一种经济高效.功能强大 但易于使用的工具 使用户能够测量.分析.改进和控制 他们的服务.交易和制造流程 SigmaXL是Microsoft Excel的插件 非常适合精益六西格码培训 ...
- c++ error函数_R语言中广义线性模型(GLM)中的分布和连接函数分析
原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...
- 栈应用_将算式转成按运算符优先级分布(代码、分析、汇编)
目录: 代码: 分析: 汇编: 代码: LinkList.h LinkList.c LinkStack.h LinkStack.c 栈-线性表 main.c #include <stdio.h& ...
最新文章
- 就在几天前,听说用了 YYYY-MM-dd 的程序员,都在加班改 Bug !
- 是否存在两台 MacOS 之间无缝切换的办法?
- ​采访了14位技术公司的创始人,他们如何看待2020年的AI行业?
- IIS支持http协议的:put、delete等方法
- 802.11(wi-fi)的PHY层(编码与调制方法)
- 仿win8磁贴界面以及功能
- java Thread 类的几种方法
- php new self()关键字的用法
- Django-认证系统
- matlab中bwlabel意思,Matlab 里bwlabel 函数的具体含义
- python get_len_Python类,特殊方法, __getitem__,__len__, __delitem__
- keystone 手动建立租户,用户,角色,服务,端口
- 基于“中国架构”,为政企数字化转型而生,中国电子云自带“三大光环”
- Web前端密码加密是否有意义?
- 刚装好的mysql设置密码_第一次装好mysql后要设置密码
- 开上新能源车之后,如何摆脱“充电焦虑”?
- java爬虫利器Jsoup的使用
- 操作系统底层工作的整体认识
- 【SDCC 2016】蘑菇街、华为、阿里巴巴、58到家、同程旅游、链家网、京东的架构变迁与技术演进...
- 虚拟声源定位系统+环绕声场效果
热门文章
- 刺客列传鸿蒙记,高淳高级中学2020-2021学年高一上学期阶段测试语文试题.docx
- 更新:为 NGINX 配置免费的 Let‘s Encrypt SSL/TLS 证书
- commander、ora、chalk、inquirer使用
- 释放已删除的InnoDB磁盘空间
- Neuron segmentation using 3D wavelet integratedencoder–decoder network
- Hive环境搭建(保姆级教程)
- 【python-02】
- DATA GUARD代码(部分)
- LTE物理传输资源(3)-时频资源
- 项目管理修炼之道之把握项目的节奏