来源:可乐的数据分析之路作者:可乐

今天这篇文章接2个月以前的那篇文章 离散型随机变量的概率分布,继续来聊聊连续型随机变量的概率分布,以及用Python如何实现。

并非所有的数据都是连续的,根据数据类型的不同,有不同的求概率的方法,对于离散型随机变量的概率分布,我们关心的是取某一个特定数值下的概率,而对于连续型随机变量的概率分布,我们关心的是取某一个特定范围内的概率。

首先要提到的一个概念就是:

概率密度函数

概率密度函数用来描述连续型随机变量的概率分布,用函数f(x)表示连续型随机变量,将f(x)就称为概率密度函数,概率密度并非概率,只是一种表示概率的方法,大家不要混淆,其曲线下面的面积表示概率。

概率密度函数下方的总面积为1,因为面积代表概率,而概率是必须为1。


下面是三种典型的连续型随机变量的概率分布

1. 正态分布

随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,就是正态分布,也叫做高斯分布,通常记做:

标准正态分布

正态分布是一个钟形曲线,曲线对称,中央部分的概率密度最大,越往两边,概率密度越小。μ决定了曲线的中央位置,σ决定了曲线的分散性,σ越大,曲线越平缓,σ越小,曲线越陡峭。


如何求正态分布的概率?

正态分布的概率密度函数满足:


连续型随机变量的理想模型就是正态分布,求正态分布的概率同样是求概率密度曲线下的面积,曲线的面积如何求?没关系,已经有前人栽树了,总结好了一整套的概率对应表,我们就直接乘凉就好了,其实求正态分布下的概率,是高中数学的知识点,但是如今我们完全可以借助Excel、Python这些工具也是可以直接计算出来,就没必要学习怎么去手算了。

标准正态分布的意义是,任何一个正态分布都可以通过线性变换转换为标准正态分布。

正态分布

很多实际问题都是符合正态分布的,如身高、体重等。正态分布在质量管理中也应用的非常广泛,“3σ原则”就是在正态分布的原理上建立的。

3σ原则是:

  • 数值分布在(μ—σ,μ+σ)中的概率为0.6826
  • 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544
  • 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974因此可以认为,Y 的取值几乎全部集中在(μ—3σ,μ+3σ)]区间内,超出这个范围的可能性仅占不到0.3%,这是一个小概率事件,通常在一次试验中是不会发生的,一旦发生就可以认为质量出现了异常。

可以用Python里的matplotlib来画一下正态分布scipy.stats 是 scipy 专门用于统计的函数库,所有的统计函数都位于子包 scipy.stats 中

fig,ax = plt.subplots(1,1)loc = 1scale = 2.0#平均值, 方差, 偏度, 峰度mean,var,skew,kurt = norm.stats(loc,scale,moments='mvsk')#print mean,var,skew,kurt#ppf:累积分布函数的反函数。q=0.01时,ppf就是p(Xx = np.linspace(norm.ppf(0.01,loc,scale),norm.ppf(0.99,loc,scale),100)ax.plot(x, norm.pdf(x,loc,scale),'b-',label = 'norm')plt.title(u'正态分布概率密度函数')plt.show()

结果:


2. 均匀分布

均匀分布,也叫矩形分布,是概率密度函数在结果区间内为固定数值的分布

均匀分布

它的概率密度函数为:


均匀分布在自然情况下极为罕见,同样来画一下均匀分布

# 均匀分布fig,ax = plt.subplots(1,1)loc = 1scale = 1#平均值, 方差, 偏度, 峰度mean,var,skew,kurt = uniform.stats(loc,scale,moments='mvsk')#ppf:累积分布函数的反函数。q=0.01时,ppf就是p(Xx = np.linspace(uniform.ppf(0.01,loc,scale),uniform.ppf(0.99,loc,scale),100)ax.plot(x, uniform.pdf(x,loc,scale),'b-',label = 'uniform')plt.title(u'均匀分布概率密度函数')plt.show()

结果:


3. 指数分布

指数分布是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。如旅客进机场的时间间隔,还有许多电子产品的寿命分布一般服从指数分布。

指数分布

其概率密度函数为:


指数分布具有无记忆的关键性质。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。用Python画指数分布的概率密度函数

fig,ax = plt.subplots(1,1)lambdaUse = 2loc = 0scale = 1.0/lambdaUse#平均值, 方差, 偏度, 峰度mean,var,skew,kurt = expon.stats(loc,scale,moments='mvsk')#ppf:累积分布函数的反函数。q=0.01时,ppf就是p(Xx = np.linspace(expon.ppf(0.01,loc,scale),expon.ppf(0.99,loc,scale),100)ax.plot(x, expon.pdf(x,loc,scale),'b-',label = 'expon')plt.title(u'指数分布概率密度函数')plt.show()

结果:


经管学苑

(ID:jingguan100)由南开大学数量经济研究所所长王群勇教授及其学术团队主办,旨在定期与大家分享计量经济学的相关理论及软件使用技巧,覆盖经济学、管理学、社会学等学科,为广大学友提供优质学术内容。欢迎关注

▲长按二维码关注

点个再看吧

python画成绩正态分布图_终于搞清楚正态分布、指数分布到底是啥了!相关推荐

  1. python 正态分布_终于搞清楚正态分布、指数分布到底是个啥了

    前一篇文章写的是离散型随机变量的概率分布,今天我们来聊聊连续型随机变量的概率分布. 并非所有的数据都是连续的,根据数据类型的不同,有不同的求概率的方法,对于离散型随机变量的概率分布,我们关心的是取某一 ...

  2. 怎么用python画饼状图_如何使用python的pygal模块画饼状图

    python是一个很有趣的语言,可以在命令行窗口运行.python中有很多功能强大的模块,这篇经验告诉你,如何使用python的pygal模块,画饼状图. 工具/原料 windows系统电脑一台 py ...

  3. excel查标准正态分布_终于搞清楚正态分布、指数分布到底是个啥了

    前一篇文章写的是离散型随机变量的概率分布,今天我们来聊聊连续型随机变量的概率分布. 并非所有的数据都是连续的,根据数据类型的不同,有不同的求概率的方法,对于离散型随机变量的概率分布,我们关心的是取某一 ...

  4. python画太极八卦图_太极八卦图的正确画法

    PPT怎么画太极八卦图?之前我们介绍了好几种软件绘制太极八卦图的方法,今天我们来看看最常见的ppt中怎么画太极八卦图?下面分享详细的绘制过程和具体参数,需要的朋友可以参考下 1.新建一个PPT文档,设 ...

  5. python画太极八卦图_「太极八卦图」使用HTML+CSS画太极八卦图 - seo实验室

    太极八卦图 使用HTML+CSS画太极八卦图 基本语法 CSS基本语法格式:选择符{属性1:属性值1;属性2:属性值2;属性3:属性值3;......} 选择符:1.元素选择器:找到同名一系列 2.类 ...

  6. python画k线图_一步一步教你用Python画出专业的K线图

    漂亮的界面是量化程序的脸面,直观专业的界面能帮助我们了解股票的走势和形象地展示量化交易的结果.本文介绍如何使用matplotlib做出专业的K线图和展示各种技术指标: matplotlib是受MATL ...

  7. python画车辆轨迹图_如何利用 Python 绘制酷炫的 车辆轨迹 — 速度时空图?三维数据用二维图像呈现...

    说明:本文系交通攻城狮原创文章,如需转载请私信联系,侵权必究. 2020,第 30 期,编程笔记 建议直接阅读精编版:如何利用 Python 绘制酷炫的 车辆轨迹 - 速度时空图?三维数据用二维图像呈 ...

  8. python画三维折线图_使用Python的matplotlib画折线图,柱状图,三维图

    因为在各种场景下需要各种实验数据的对比图像,有的中还要求dpi,这些在Python中的matplotlib中都可以实现,下面是总结的各种画图命令. 打包文件:https://download.csdn ...

  9. python画k线图_使用Matplotlib轻松绘制股票K线图

    K线图是看懂股票走势的最基本知识,K线分为阴线和阳线,阴线和阳线都包含了最低价.开盘价.最高价和收盘价,一般的K线如下图所示: 度娘说:K线图源于日本德川幕府时代(1603-1867年),被当时日本米 ...

最新文章

  1. Java的类加载机制
  2. Google Map API 开发基础--01
  3. python 进程理论基础
  4. 【LeetCode笔记】剑指 Offer 13-. 机器人的运动范围 (Java、dfs)
  5. STL vector用法介绍
  6. python数据预处理——数据分箱(将值归类)
  7. 插画与UI组合素材APP模板|一切简单而美好
  8. Eclipse中Jar包的反编译(通过jar包查看源码)
  9. 人脸识别门禁接线图_自制宿舍NFC门禁教程——当你老是忘带寝室钥匙,并且有一个闲置的充电宝的时候...
  10. PDMS Pipeline Tool 教程(三):材料表
  11. python实战项目分析2—物流
  12. 论文阅读《Language Models are Unsupervised Multitask Learners》
  13. 人脸识别技术开发解决方案,人脸识别智慧工地应用开发
  14. QPS、TPS、并发用户数、吞吐量
  15. 计算机管理-磁盘管理中进行扩展卷操作,管理磁盘diskpart命令
  16. vue引用js文件的多种方式(推荐)
  17. 通过126邮箱SMTP服务发送邮件到指定邮箱
  18. DvaJS的Subscription的使用
  19. python量化策略源码_[Python源码] 十大经典日内策略之空中花园(附源码分享)
  20. 成绩排序(p32)排序

热门文章

  1. 机器学习基础——BP算法
  2. 使用log,log10函数时报错
  3. ext amp; prototype... info? - Ext JS
  4. 恩格 php 5.9,恩格会计软件
  5. 某些Office 精简版 Win7运行问题(Windows7 不支持 Thinstall)
  6. Word排版—数学相关格式(字母改成手写体、函数、公式等的输入)涉及批量操作
  7. python爬虫(一):正则表达式爬取网页文本
  8. LeetCodeClassification---- No.1 分治--使用递归完成对一维数组的求和--递归法完成sum函数
  9. JavaScript 判断闰年典型案例,小算法
  10. 浙江省2009年高考文理科第二批院校平行志愿首轮投档分数线