注:本篇内容均摘自《商务与经济统计学》,目的是方便个人查阅相关基本概念。

随机变量是对实验结果的数值描述,分为离散型随机变量和连续型随机变量。下面列举常见的离散型概率分布和连续型概率分布。

离散型概率分布

1、柏松概率分布

定义

柏松分布是一种常见的离散型概率分布,它主要用来估计在特定时间段或空间中某事件发生的次数。

泊松实验的性质:

第一、在任意两个相等长度的区间上,事件发生的概率相等;
第二、事件在某一区间上是否发生与事件在其他区间上是否发生是独立的。
泊松分布的另外一个重要性质数学期望和方差相等。

泊松概率函数:

,其中
为事件在一个区间发生x次的概率,
为事件在一个区间发生次数的数学期望或均值,e=2.71828;

泊松概率分布的一个案例:

假定感兴趣的是工作日早上15分钟内到达某汽车银行出纳窗口处的汽车数量。如果假设在任意两个相等的时间段上汽车到达的概率是相等的,并且在任意时间段上是否有汽车到达与其他时间段上是否有汽车到达是相互独立的,那么泊松概率函数是适用的。假定以上假设都成立,并且对历史数据的分析显示,15分钟的时间段上到达车辆数目的平均值为10.这时,采用以下概率函数:

,其中随机变量x=15分钟的时间段上到达的汽车数。

一个有趣的题目:已知某app的日活为10000人,那么请判断是否某一天会有15000人同时访问该app?

X=np.arange(8000,16000,100)
y=poisson.pmf(X,mu=10000)
plt.plot(X,y)

图1
X=np.arange(9500,11000,100)
y=poisson.pmf(X,mu=10000)
plt.plot(X,y)

图2

由图1和图2可知,在[9600,10400]之间柏松分布的概率都不为0外,其余取值的概率基本都为0,所以几乎日活不会取到15000.

2、二项概率分布

二项概率分布是一种离散型概率分布,具有广泛的应用。它与一个称为二项实验的多步骤实验有关。

伯努利实验的性质:

第一、实验由一系列相同的实验组成;
第二、每次实验有两种可能的结果。我们把其中的一个称为成功,另一个称为失败;
第三、每次实验成功的概率都是相同的,用p来表示;失败的概率也都相同,用1-p表示;
第四、实验是相互独立的。

二项概率函数:

,其中x为成功的次数,p为每次实验中成功的概率;n为实验的次数;f(x)为n次实验中有x次成功的概率;

二项分布的期望与方差:

;
;

3、超几何概率分布

超几何概率分布与二项分布联系密切。这两种概率分布主要有两处不同:在超几何概率分布中,各次实验不是独立的,并且各次实验中成功的概率不等。
对于超几何概率分布,符号N表示总体容量,r表示总体中具有成功标志的元素个数,N-r表示总体中有失败标志的元素个数。采用不放回抽样方法,从总体中抽取n个元素,超几何概率函数用来计算在这n个元素中恰有x个元素具有成功标志,n-x个元素具有失败标志的概率。当这种实验结果出现时,我们是从总体的r个具有成功标志的元素中抽取x个,从总体的N-r个具有失败标志的元素中抽取n-x个。下面的超几何概率函数f(x)给出了n次实验中有x次成功的概率。

考虑抛5次硬币的实验,每一次都观察硬币着地时正面朝上还是反面朝上。假设我们想要计算5次抛掷中正面出现的次数。这个实验具备二次实验的性质吗?感兴趣的随机变量是什么?注意:

  1. 实验由5次相同的实验组成,每次实验都是抛一枚硬币。
  2. 每次实验都有两种可能的结果:正面朝上或者反面朝上。定义正面朝上为成功,反面朝上为失败。
  3. 在每次实验中,正面朝上和反面朝上的概率都是一样的,即p=0.5,1-p=0.5。
  4. 因为任意一次实验的结果都不影响其他各次实验,所以各次实验都是独立的。

于是,该实验满足二项实验的性质。感兴趣的随机变量为x=抛掷5次硬币正面朝上的次数,这时x的可能取值为0,1,2,3,4或5.

超几何概率函数:

,其中,x为成功的次数;n为实验次数;
为n次实验中x次成功的概率;N为总体中元素的个数;r为总体中具有成功标志的元素的个数。

超几何概率分布的期望与方差:

;
;

当总体容量足够大的时候,超几何分布可以用实验次数为n,成功概率

的二项分布近似。

连续型概率分布

离散型随机变量和连续型随机变量之间最根本的区别在与,二者在概率计算上是不同的。对于一个离散型随机变量,概率函数f(x)给出了随机变量x取某个特定值的概率,而对连续型随机变量,与概率函数相对应的是概率密度函数,也记作f(x).不同的是,概率密度函数并没有直接给出概率。但是,给定区间上曲线f(x)下的面积是连续型随机变量在该区间取值的概率。因此,当计算连续型随机变量的概率时,我们计算的是随机变量在某个区间内取值的概率。

均匀分布

一般的,如果随机变量x服从均匀分布,则它的密度函数的公式如下:

, else
;

正态分布

正态密度函数:

;
为均值,
为标准差;

标准正态密度函数:

二项概率的正态近似:

当实验次数很大时,笔算或者用计算器求解二项概率函数都是很困难的。在

的情况下,正态分布是对二项分布的一个简便易行的近似。当使用正态分布近似二项分布时,正态曲线中取
.

举例说明二项分布的正态近似。假定历史经验表明,某公司发票出错的概率为10%。现选取100张发票组成一个样本,我们想计算恰好有12张发票有错的概率,即想计算100次实验中恰好有12次成功的二项概率。在应用二项分布的正态近似时,另

,下面我们使用
的正态分布计算恰好有12张发票有错的概率。

对连续型概率分布,概率是通过计算密度函数下方的面积得出的。因此,随机变量取任意单个值的概率是0。为了对恰好有12次成功的二项概率进行近似,我们必须计算1.5和12.5之间正态曲线下的面积。其中11.5和12.5是将12加减0.5得到的,我们称0.5为连续性正交因子。由于我们是用连续型分布来近似一个离散分布,从而离散型二项分布的概率

可以用连续型正态分布的概率
来近似,从而可以转换成标准正态分布来求解概率。

指数分布

指数概率分布可用于描述诸如到达某洗车处的两辆车的时间间隔,装载一辆卡车所需要的事件,高速公路上两起重大事故发生地之间的距离等随机变量。

指数概率密度函数:

,其中
为期望值或均值;

泊松分布和指数分布的关系:

泊松分布描述了某一区间中事件发生的次数,而指数分布描述了事件发生的时间间隔长度。

举例如下,假定1h中叨叨某一洗车处的汽车的数量可以用泊松分布描述,其均值为每小时10辆。泊松概率函数给出了每小时有x辆汽车到达的概率:

由于车辆到达的平均数是每小时10辆,则两车到达额度时间间隔的均值为:

,于是描述两车到达的时间间隔的对应分布是指数分布,其均值为
,从而指数概率密度函数为:
.

泊松分布的分布函数_常见概率分布汇总相关推荐

  1. 概率密度函数、概率分布函数、常见概率分布

    1. 概率函数 概率函数,就是用函数的形式来表达概率. pi=P(X=ai)(i=1,2,3,4,5,6)p_i=P(X=a_i)(i=1,2,3,4,5,6)pi​=P(X=ai​)(i=1,2,3 ...

  2. 泊松分布的分布函数_《可靠性设计》——常用的概率分布

    超几何分布: 在总数为N.不合格品率为p的一批产品中随机抽取n个样品,且样品中r个不合格品的概率为 则称x服从超几何分布. 当N很大时,上式计算相当烦琐,此时可以用二项分布或泊松分布来近似. 二项分布 ...

  3. python泊松分布_常见概率分布的Python实现

    离散型概率分布 二项分布 二项试验 满足以下条件的试验成为二项试验: 试验由一系列相同的n个试验组成: 每次试验有两种可能的结果,成功或者失败: 每次试验成功的概率是相同的,用p来表示: 试验是相互独 ...

  4. 超几何分布_常见概率分布

    离散分布 退化分布 若r.v.  只取常数值c,即  ,这时分布函数为: 把这种分布称为退化分布或者单点分布. 伯努利分布 在一次实验中,事件A出现的概率为  ,不出现的概率为  ,若用  记事件A出 ...

  5. 泊松分布的分布函数_第114讲 SAS泊松分布与泊松回归

    西莫恩·德尼·泊松(Simeon-Denis Poisson 1781-1840)法国数学家.几何学家和物理学家.主要成就有统计学发现泊松分布与物理光学发现与发展--泊松亮斑等. 泊松分布的参数λ是单 ...

  6. Hololens开发笔记_常见错误汇总

    笔记规则 ------------------------------------------------------ 问题:描述问题 解决:解决方法 ------------------------ ...

  7. 想不想修真获取服务器配置文件,想不想修真常见问题解答汇总_想不想修真凡人传说_我爱秘籍...

    想不想修真游戏有很多新手玩家都不是很明白怎么玩,这也对游戏产生了很多疑问,本期小编为大家带来想不想修真中常见的问题解答汇总,一起来看看吧. 常见问题解答汇总(ctrl+f搜索关键词找到答案) Q:前期 ...

  8. 概率分布分位点_常用概率分布总结(1)

    老是记不住各种分布及其意义,每次用时,回查各个课本资料也很麻烦,一些分布的重要性质也是各处散布,经常找不到,故这里做个总结,当作个资料卡用. 内容有各种常见概率分布,一般会写含义.密度函数形式.期望. ...

  9. 机器学习常见术语汇总

    A 准确率(accuracy) 分类模型预测准确的比例.在多类别分类中,准确率定义如下: 在二分类中,准确率定义为: 激活函数(Activation function) 一种函数(例如 ReLU 或 ...

最新文章

  1. matlab--奇奇怪怪函数
  2. Serverless 应用引擎产品的流量负载均衡和路由策略配置实践
  3. 分布与并行计算—生产者消费者模型队列(Java)
  4. json.hpp参数错误
  5. 程序员修复bug的吐血过程,太形象了
  6. matlab 箱图不显示异常值_无功功率显示值与计算值不匹配?
  7. phaser java_Java 7的并发编程-Phaser
  8. RNN系列之四 长期依赖问题
  9. python正则匹配数字_python——正则匹配数字
  10. 为什么需要工单系统?
  11. 多因子选选股MATLAB代码,MatlabCode 多因子模型构建。多因子模型是量化选股中最重要的一类模型 联合开发网 - pudn.com...
  12. 数字经济时代,企业上云将成为数字化转型突破口
  13. python学习笔记(一)PIP
  14. 牛客网-Java专项练习11
  15. 1、IOS开发--iPad之仿制QQ空间(登录界面搭建+登录逻辑实现)
  16. APA轨迹规划常见算法
  17. eclispe启动报错
  18. 大学物理:CH3-振动
  19. 一个基于雾里看花的BLDC电机驱动案例
  20. OpenKG 祝大家新春快乐!

热门文章

  1. Go语言基础:method
  2. Spring和SpringMVC的区别
  3. 【手把手教你Maven】构建过程
  4. 雅虎公司C#笔试题(之二)
  5. 大数据技术hadoop入门级生态圈介绍
  6. 谈谈我对服务熔断、服务降级的理解
  7. 数据库相关中间件介绍
  8. PHP的getimagesize获取图像信息
  9. PHP使用单例模式进行连接DB:public的方法进行调用连接函数即可
  10. java传送字符到前端_mina实现服务器与客户端传送对象或字符串