数据特征分析之帕累托分析以及python实现
帕累托分析(贡献度分析) → 帕累托法则:20/80定律
“原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。一般来说,投入和努力可以分为两种不同的类型:
多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。”
→ 一个公司,80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润
例如:
** 世界上大约80%的资源是由世界上15%的人口所耗尽的
** 世界财富的80%为25%的人所拥有;在一个国家的医疗体系中
** 20%的人口与20%的疾病,会消耗80%的医疗资源。
一个思路:通过二八原则,去寻找关键的那20%决定性因素!
‘’’
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
% matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False # 这里设置字体,防止中文乱码# 帕累托分布分析 data = pd.Series(np.random.randn(10)*1200+3000,index = list('ABCDEFGHIJ'))# 这里ABCDEFGHIJ表示是个产品,用随机值模拟器销售额
print(data)
print('------')
# 创建数据,10个品类产品的销售额data.sort_values(ascending=False, inplace= True)
# 由大到小排列plt.figure(figsize = (10,4))
data.plot(kind = 'bar', color = 'g', alpha = 0.5, width = 0.7)
plt.ylabel('营收_元')
# 创建营收柱状图p = data.cumsum()/data.sum() # 创建累计占比,Series
key = p[p>0.8].index[0]
key_num = data.index.tolist().index(key)
print('超过80%累计占比的节点值索引为:' ,key)
print('超过80%累计占比的节点值索引位置为:' ,key_num)
print('------')
# 找到累计占比超过80%时候的index
# 找到key所对应的索引位置p.plot(style = '--ko', secondary_y=True) # secondary_y → y副坐标轴
plt.axvline(key_num,hold=None,color='r',linestyle="--",alpha=0.8)
plt.text(key_num+0.2,p[key],'累计占比为:%.3f%%' % (p[key]*100), color = 'r') # 累计占比超过80%的节点
plt.ylabel('营收_比例')
# 绘制营收累计占比曲线key_product = data.loc[:key]
print('核心产品为:')
print(key_product)
# 输出决定性因素产品
上面的代码在jupyter中运行,输出如下:
数据分析中,通过帕累托分布,通过产品的贡献度,可以得到现阶段公司核心产品。
数据特征分析之帕累托分析以及python实现相关推荐
- 10.Excel数据特征分析-帕累托分析法
文章目录 1.什么是帕累托分析 2.帕累托分析法案例 3.数据透视表与帕累托分析结合具体步骤 3.1数据透视表建立 3.2 帕累托图的建立 3.3 调整帕累托图 3.3.1调整坐标轴 3.3.2 调整 ...
- 数据特征分析-帕累托分析
帕累托分析(贡献度分析):即二八定律 目的:通过二八原则寻找属于20%的关键决定性因素. 随机生成数据 df = pd.DataFrame(np.random.randn(10)*1000+3000, ...
- Power BI应用案例:销售帕累托分析(28法则)
一.应用背景 帕累托法则往往称为二八原理,即百分之八十的问题是百分之二十的原因所造成的.帕累托图在项目管理中主要用来找出产生大多数问题的关键原因,用来解决大多数问题.本文利用Power BI进行帕累托 ...
- Power BI产品帕累托分析
效果图一: 说明: 1.x轴为每个产品的销售金额,按照从大到小排序 2.y轴为这些产品累积的销售金额占比,也就是 到产品的累积销售金额 除以 所有产品总的销售金额 3.红色框部分表示,累积销售金额占比 ...
- python数据分析之帕累托分析
帕累托分析 帕累托图在概念上与帕累托法则有关.帕累托法则认为,相对少量的原因通常造成大多数的问题或缺陷.该法则通常称为80/20原则,即80%的问题是由20%的原因导致的.帕累托图也用于汇总各种类型的 ...
- 帕累托分析中的累计优化
帕累托分析又称ABC分析,也许有些人是第一次听到这样的叫法,实际它就在我们的身边.比如世界上百分之九十的财富掌握在十个人手里:头部商品占了公司80%的营业额:项目中应该把80%的时间投入到那80%重要 ...
- 笔记-高项案例题-2019年下-质量管理-帕累托分析
2019年下半年信息系统项目管理师考试下午真题 这一题没拿到高分,难怪当年不过了. [说明] 2019年3月某公司中标当地轨道交通的车载广播系统项目,主要为地铁列车提供车载广播.报警.对讲及电子地图系 ...
- Powerbi实现帕累托分析
完整文档 主要实现功能: 1.任意选择城市数量 2.任意选择时间区间 3.除参与排名的城市,其他城市用[其他]代替,且颜色标注出来 实现效果: ![GIF 2022-3-17 14-27-06.gif ...
- SQL如何进行帕累托分析?(窗口函数、累计百分比分类)
帕累托分析法是指定决策的统计方法,包含按降序排序的列和表示累积总百分比的线条 [面试题]有一张"学生成绩表",包含3个字段:学号.课程.成绩. 问题:找出每门课程A类和B类的学生, ...
最新文章
- RIS服务器的安装和远程自动安装操作系统(二)
- Java 配置C3P0数据连接池存入数据存入数据库出现中文乱码问题
- 关于无法加载sass 模块问题。vue2.0中报错ERROR :scss can't resolve 'scss-loader'
- 汇编指令的学习4——ldm/stm指令、栈的处理
- 面试题,如何改进一款产品
- java glassfish_java - Tomcat,JBoss和Glassfish有什么区别?
- 视频码率,帧率和分辨率的联系与差别
- 通达信服务器文件是那个文件夹,通达信的公式在哪个文件夹?
- visio常用快捷键_Visio快捷键大全
- Python异方差的检验与修正
- 微信小游戏Laya引擎声音Bug的解决方案
- 299. 猜数字游戏【我亦无他唯手熟尔】
- linux下看pcie的设备id,linux lspci查看pci总线设备信息
- python基础知识点集锦二
- 初识RFID的物理与逻辑安全机制
- SHOW TABLES语法
- 菜鸟、大牛和教主,三者的区别
- 【面试题】一个环,有n个点, 问从0点出发,经过k步回到原点有多少种方法
- 中国珍珠养殖产业发展现状分析,淡水养殖仍然占据主导地位「图」
- 如何判断远端主机UDP端口是否开启
热门文章
- 华为服务器安装Windows 2012 R2/Windows 2016操作系统指导书(Purley平台)
- 物联网发展下的eSIM卡特点和应用优势
- 记录关于树莓派如何对换串口映射关系
- python,基于http协议,最常用的是GET和POST两种方法
- Vue2 的 Watcher解析以及简单实现
- [轻松一下]-笑话巨搞,饭后帮助消化
- endo-BCN-PEG4-Palmitic,环丙烷环辛炔四聚乙二醇-Palmitic包装灵活
- 软件测试优先级策略,QNX操作系统优先级以及调度策略
- Newtonsoft.Json - JObject与JArray总结
- 华为OD机试 - 最多几个直角三角形(Java JS Python)