1.帕累托分布

帕累托分布是一种幂律概率分布,以意大利土木工程师、经济学家和社会学家维尔弗雷多·帕累托的名字命名,用来描述社会、科学、地球物理、精算和其他各种可观察到的现象。帕累托分配有时也被称为帕累托原则或“80-20”规则,即社会财富的80%掌握在20%的人口手中。帕累托分布不是自然规律,而是一种观察。它在许多实际问题中都很有用。

读完定义后,你一定想知道什么是幂律?幂次定律是两个量之间的函数关系,一个量的变化引起另一个量的比例变化,而与两个量的初始大小无关。

80-20法则在很多情况下都适用。例如,帕雷托发现80%的意大利土地为20%的人口所有。他还发现,他菜园里80%的豌豆来自20%的豌豆植株。世界上82.7%的收入由20%的人口控制。微软2002年的一份报告显示,Windows和MS Office系统80%的错误和崩溃都是由20%的bug引起的。80%的销售额来自20%的产品。80%的客户只使用20%的软件功能。这种80-20分布非常频繁。

2.在Python中生成帕雷托分布

可以使用Scipy在Python中生成帕雷托分布。统计模块或使用NumPy、Scipy、stats模块包含各种概率分布和不断增长的统计函数库。Scipy是一个用于科学计算和技术计算的Python库。NumPy是一个用于科学计算的Python库,除了科学用途之外,它还可以用作泛型数据的多维容器。

2.1使用Scipy.stats

x_m和alpha是帕雷托分布的两个参数。x_m为scale参数,表示帕雷托分布随机变量所能取得最小值。是形状参数,等于n/SUM{ln(x_i/x_m)}。

linspace()返回均匀间隔的样本(样本的数量等于num)在一个特定的间隔内[开始,停止]。在上面的代码中,linspace()方法在一个范围[0,5]内返回1000个均匀间隔的样本。

将迭代形状值-alpha列表以绘制每个值的线条。array()创建一个数组。Pareto()方法返回一个Pareto连续随机变量。PDF()创建一个概率密度函数(PDF)。参数x、b、loc、scale分别为类数组分位数、类数组形状参数、类数组可选位置参数(默认值为0)、类数组可选比例参数(默认值为1)。

plot()绘制均匀间隔的样本和PDF值的数组。图形是为每个值绘制的。在这里,输出。T是输出的转置。输出是一个3行的Pareto分布数组,每个形状参数一个。在转置时,输出被转换成一个列数组。

其余的代码行几乎是不言自明的。使用plt.xlabel()和plt.ylabel()标记x轴和y轴。title()将title分配给图。grid()配置网格线。

所述plt.rcParams []设置当前RC PARAMS。Matplotlib使用matplotlibrc配置文件来自定义各种属性,这些属性称为“ rc设置”或“ rc参数”。Matplotlib中几乎每个属性的默认值都可以控制:图形大小和DPI,线宽,颜色和样式,轴和网格属性,文本和字体属性等等。

legend()显示图例,而plt.show()显示所有数字。

2.2使用Numpy

Pareto()从具有指定形状的Pareto II或Lomax分布中随机抽取样本。帕累托分布是一种移位的帕累托分布。通过添加1并乘以缩放参数x_m,可以从Lomax分布中得到经典的Pareto分布。

帕累托分布的最小值为0,而经典的帕累托分布为mu,其中标准帕累托分布的位置mu = 1。

plt.hist()绘制直方图。当参数density或normed被设置为True时,返回的tuple将第一个元素作为count归一化以形成概率密度。因此,直方图下的面积为1。这是通过将计数除以观察次数乘以箱子宽度而不是除以观察总数来实现的。因此y轴代表样本的密度。

计数中的“_”,bin,_传达返回的元组的最后的值并不重要(plt.hist()将返回三个元素的元组)。

我们将绘制绑定数据的曲线,

我们将随机采样数据拟合一个Pareto分布,并通过计算参数为x_m和alpha的bin定义的x值处的Pareto分布的概率密度,在我们的数据上绘制这个分布。

3.验证帕累托分布

Q-Q图(分位数-分位数图)用于确定连续随机变量是否服从帕累托分布。

统计数据。帕累托根据指定的理论分布(Pareto分布)的分位数生成随机样本(样本数据)的概率图。由于绝大多数的蓝点(样本数据)几乎与红线(理论分布)一致,所以我们可以得出结论,该分布服从Pareto分布。

在结束之前,有必要了解帕累托分布在现实世界中的应用。

4.帕累托分布的应用

人类住区的规模(更少的城市和更多的村庄)。沙粒的大小。遵循TCP协议在internet上分布的数据的文件大小。油田储量价值(大油田少,小油田多)在Tinder上,男性约会成功,80%的女性会争夺20%的最具吸引力的男性。用户玩各种游戏所花费的时间(很少有游戏比大多数很少玩的游戏玩得更多)。帕累托分布及其概念非常简单,但功能强大。它总是有助于收集重要的线索,以了解广泛的人类行为,科学和社会现象。我希望您能更好地理解帕累托分布以及如何从中抽取样本,并使用Pyplot、Numpy、Scipy和Python进行绘图。

python matplotlib绘制柏拉图pareto_强大的帕累托分布——其可视化实现方法相关推荐

  1. Python Numpy random.pareto() 帕累托分布

    NumPy(Numerical Python的缩写)是一个开源的Python科学计算库.使用NumPy,就可以很自然地使用数组和矩阵.NumPy包含很多实用的数学函数,涵盖线性代数运算.傅里叶变换和随 ...

  2. matlab广义误差分布,利用广义帕累托分布对尾数据建模

    广义帕累托分布 广义帕累托 (GP) 分布是一种右偏态分布,使用形状参数 k 和尺度参数 sigma 进行参数化.k 也称为"尾部指数"参数,可以为正值.零或负值. x = lin ...

  3. Tableau技巧(五)帕累托分布(二八原则)

    2021年02月24日(UTC+8) 数据源:Tableau自带超市集 Tableau版本:2020.3 参考: 场景:百分之多少的用户贡献了百分之多少的销售额 客户名称放入列,销售额放入行,标记改为 ...

  4. matlab 广义帕累托分布,基于对数矩的广义帕累托分布参数估计方法与流程

    本发明属于信号处理技术领域,具体涉及一种广义帕累托分布参数估计方法,可用于海杂波背景下的目标检测. 背景技术: 海杂波背景下的目标检测技术是雷达应用技术中一个至关重要的研究方向,在军事和民用领域已经得 ...

  5. 帕累托分布和泊松分布

    本文主要对帕累托分布和泊松分布的定义做一个简要的介绍, 但是不会介绍它们的具体含义及应用. 帕累托分布 参考此处 给定一个参数aaa, 帕累托分布的密度函数为: f(x)=axa+1,x≥1f(x)= ...

  6. matlab帕累托分布函数,Matlab 与帕累托分布

    求高手相助!!!急!!! 什么是帕累托分布.截头帕累托分布,在Matlab程序里怎么用!!! GPRND Random arrays from the generalized Pareto distr ...

  7. MATLAB数据处理(2)——广义帕累托分布和极值外推

    MATLAB数据处理(2)--广义帕累托分布和极值外推 广义帕累托分布 使用matlab进行广义帕累托分布参数估计 图像检查拟合效果 极值外推 还有一些问题 极值外推有时候会有问题 阈值选取的艺术 广 ...

  8. 各种分布函数:泊松分布、二项分布、伯努利分布、高斯分布、帕累托分布

    简单的说 伯努利是扔一次硬币:(二值实验) 二项分布是多次伯努利,即扔多次硬币:(多次二值实验) 泊松分布是 ppp 很小的二项,即扔好多好多次硬币,且扔出正面概率极小: 正态分布是 nnn 很大的二 ...

  9. 极值分析:分块极大值BLOCK-MAXIMA、阈值超额法、广义帕累托分布GPD拟合降雨数据时间序列...

    全文链接:http://tecdat.cn/?p=25348 你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima.阈值超额法threshold excess(点击文末&quo ...

最新文章

  1. linux su -c命令
  2. php json 数组 区别,PHP实战:JSON两种结构之对象和数组的理解
  3. 用C语言解“逆序的三位数”问题
  4. 为什么百万医疗险越来越多,到底选哪款?
  5. 自然语言处理在开放搜索中的应用
  6. BCZM : 1.13
  7. SQL基础-- 数据处理(DML、RETURNING、MERGE INTO)
  8. c++远征之继承篇——隐藏,isa,虚析构函数
  9. typescript和 java区别_typescript中interface和type的区别
  10. oracle表和对象基础维护笔记
  11. [沫沫金原创]Sql中跨库访问和同库跨用户访问区别
  12. 中标麒麟服务器系统安装教程,安装国产Linux中标麒麟操作系统教程
  13. Unity Odin从入门到精通(五):自定义处理器
  14. 鼠标不能动怎么选择计算机,鼠标动不了怎么办 电脑鼠标不动了按什么键
  15. 击鼓传花c语言编程题,转身之间——此间的少年画蛇添足版
  16. VS各个版本的优缺点和发展过程(VC6.0——VS2015)
  17. 微信公众号隐藏右上角三个点分享功能
  18. 计算机文件恢复快捷键,文件变成快捷方式怎么恢复
  19. Android 手机号输入格式化 3-3-4
  20. sqlite3错误原因

热门文章

  1. 在珠海C1驾照能开什么车?
  2. 统计列表中元素出现的次数
  3. Purley平台Linpak测试,从踏坑开始一步步优化
  4. 硬件笔试面试---2
  5. AWS API GATEWAY的使用
  6. 基于Java+SpringBoot+Vue+Uniapp前后端分离健身预约系统设计与实现
  7. 个人知识管理工具一览及相关经验技巧
  8. css 超出省略...
  9. 广东某公安局图像控制中心案例
  10. 阿里的低代码开发平台lowcode-engine