一、实验目的

(1) 掌握分布分析的方法。

(2) 掌握描述性统计分析的方法。

(3) 掌握贡献度分析的方法。

二、实验内容

(1) 销售额分布分析。

(2) 销售数量描述性统计分析。

(3) 销售数量贡献度分析。

三、实验过程、内容

1. 销售额分布分析

使用分布分析统计各销售额区间(此处以173作为组距,共分成5个销售额区间)的销售额频率分布,并绘制其频率分布直方图

  • 导入库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#导入数据集
df =pd.read_excel('新零售智能销售设备6月份商品销售情况.xlsx')
#查看数据集
df.head()
  • 绘制频率直方图

bins = [0,173,346,519,692,865]
labels = ['[0,173)','[173,346)','[346,519)','[519,692)','[692,865)']
df['销售额分层']=pd.cut(df['销售额(元)'],bins ,labels=labels)
aggResult= df.groupby(by=['销售额分层'])['销售额(元)'].agg([("销售额(元)",np.size)])
pAggResult = round(aggResult/aggResult.sum(), 2, )*100
plt.figure(figsize=(10,6))
pAggResult['销售额(元)'].plot(kind='bar',width=0.6,fontsize=10)
plt.rcParams['font.sans-serif']=['SimHei']  #正常显示中文标签
plt.title('销售额频率直方图',fontsize=20)
plt.show()

2. 销售数量描述性统计分析

使用描述性统计分析对销售数量计算其基本的统计量结果,并根据输出结果进行分析

data = df['销售数量(个)']
statistics = data.describe()
statistics.loc['range'] = statistics.loc['max']-statistics.loc['min']   #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean']    #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%']     #四分位数间距
print(statistics)

3. 盈利额贡献度分析

使用贡献度分析统计各商品的盈利额贡献度,并绘制各商品的帕累托图进行分析

data = df['盈利额(元)'].copy()
data.sort_values(ascending=False,inplace=False)
plt.rcParams['font.sans-serif'] = ['SimHei']    #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False      #用来正常显示负号
plt.figure()
data.plot(kind='bar')
plt.ylabel('盈利额(元)')
p = 1.0*data.cumsum()/data.sum()
p.plot(color='r', secondary_y=True, style='-o',linewidth=2)
plt.ylabel('盈利额(比例)')
plt.show()

分布、描述性统计和贡献度分析相关推荐

  1. 更新:描述性统计和相关性:EAP.portfolio_anaysis.Univariate

    实证资产定价(Empirical asset pricing)已经发布于Github和Pypi. 包的具体用法(Documentation)博主将会陆续在CSDN中详细介绍,也可以通过Pypi直接查看 ...

  2. 黄开宁:搞多媒体开发要掌握好信号处理、统计和数理分析

    尽管有WebRTC和FFmpeg这样的超级工具,但多媒体开发的核心难点的难度并没有因此降低,这需要开发者掌握牢固的基础知识.LiveVideoStack专访了即构科技音视频技术资深架构师黄开宁,他对学 ...

  3. python变量贡献率排序_3.2.5 贡献度分析

    贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律.同样的投入放在不同的地方会产生不同的效益.例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品,而其他80%的产品只产生了 ...

  4. 【直流潮流】基于直流潮流的电力系统停电分布及自组织临界性分析

    1.软件版本 matlab2013b 2.系统概述 整个算法的流程图,OPA模型的流程图如下: 详细的讲,我们的这个算法的安如下的步骤进行: 步骤1:k=k+1,通过慢动态过程中的几个公式,对Pmax ...

  5. 数据统计分析案例(对比分析、销量定比分析、同比、双坐标图、环比、shift、贡献度分析(帕累托法则)、差异化分析、resample、季节性波动分析)

    本文来自<Python数据分析从入门到精通>--明日科技编著 本章以案例为主,通过简单的知识讲解使读者了解数据统计分析中常用的分析方法,如对比分析,同比.定比和环比分析,贡献度分析,差异化 ...

  6. python的基本统计和分组分析和分布分析和交叉分析和结构分析

    import pandas fa=pandas.read_csv('D://Python projects//reference data//5.1//data.csv') #查看学生分数的描述性统计 ...

  7. 【统计和图形分析】上海道宁为您带来测试、分析、改进和控制自身服务、交易和制造流程的强大工具——SigmaXL

    SigmaXL是 一种经济高效.功能强大 但易于使用的工具 使用户能够测量.分析.改进和控制 他们的服务.交易和制造流程 SigmaXL是Microsoft Excel的插件 非常适合精益六西格码培训 ...

  8. c++ error函数_R语言中广义线性模型(GLM)中的分布和连接函数分析

    原文链接:http://tecdat.cn/?p=14874 通常,GLM的连接函数可能比分布更重要.为了说明,考虑以下数据集,其中包含5个观察值 x = c(1,2,3,4,5)y = c(1,2, ...

  9. 栈应用_将算式转成按运算符优先级分布(代码、分析、汇编)

    目录: 代码: 分析: 汇编: 代码: LinkList.h LinkList.c LinkStack.h LinkStack.c 栈-线性表 main.c #include <stdio.h& ...

最新文章

  1. 就在几天前,听说用了 YYYY-MM-dd 的程序员,都在加班改 Bug !
  2. 是否存在两台 MacOS 之间无缝切换的办法?
  3. ​采访了14位技术公司的创始人,他们如何看待2020年的AI行业?
  4. IIS支持http协议的:put、delete等方法
  5. 802.11(wi-fi)的PHY层(编码与调制方法)
  6. 仿win8磁贴界面以及功能
  7. java Thread 类的几种方法
  8. php new self()关键字的用法
  9. Django-认证系统
  10. matlab中bwlabel意思,Matlab 里bwlabel 函数的具体含义
  11. python get_len_Python类,特殊方法, __getitem__,__len__, __delitem__
  12. keystone 手动建立租户,用户,角色,服务,端口
  13. 基于“中国架构”,为政企数字化转型而生,中国电子云自带“三大光环”
  14. Web前端密码加密是否有意义?
  15. 刚装好的mysql设置密码_第一次装好mysql后要设置密码
  16. 开上新能源车之后,如何摆脱“充电焦虑”?
  17. java爬虫利器Jsoup的使用
  18. 操作系统底层工作的整体认识
  19. 【SDCC 2016】蘑菇街、华为、阿里巴巴、58到家、同程旅游、链家网、京东的架构变迁与技术演进...
  20. 虚拟声源定位系统+环绕声场效果

热门文章

  1. 刺客列传鸿蒙记,高淳高级中学2020-2021学年高一上学期阶段测试语文试题.docx
  2. 更新:为 NGINX 配置免费的 Let‘s Encrypt SSL/TLS 证书
  3. commander、ora、chalk、inquirer使用
  4. 释放已删除的InnoDB磁盘空间
  5. Neuron segmentation using 3D wavelet integratedencoder–decoder network
  6. Hive环境搭建(保姆级教程)
  7. 【python-02】
  8. DATA GUARD代码(部分)
  9. LTE物理传输资源(3)-时频资源
  10. 项目管理修炼之道之把握项目的节奏