目录

1 基本概念

2 离散型随机变量的概率分布

2.1 二项分布

2.2 超几何分布

2.2.1 概念

2.2.2 举例

2.3 泊松分布

3 连续型随机变量的概率分布

3.1 均匀分布

3.1.1 概念

3.2 正态分布

3.2.1 概念

3.3  指数分布

3.3.1 概念

3.3.2 举例

4 参考文献


1 基本概念

在之前的博文中,已经明白了概率分布函数和概率密度函数。下面来讲解一下常见的离散型和连续型随机变量概率分布。

在此之前,介绍几个基本概念:

  • 均值(期望值expected value):
  • 方差(variance):
  • 标准差(standard deviation):

其中,可以证明

2 离散型随机变量的概率分布

2.1 二项分布

如果进行n次不同的实验,每次试验完全相同并且只有两种可能的结果,这样的实验结果分布情况就是二项分布。最简单的比如投掷一枚硬币,不管进行多少次实验,实验结果都只有正面朝上或者反面朝上,这就是一个简单的二项分布。

二项分布概率分布:

其中:n代表n次实验,x表示实验结果为T的次数,q是实验结果为T的概率,q=1-p,表示实验结果为F的概率。

二项分布的 
均值:
方差:
标准差:
二项分布对于结果只有两种情况的随机事件有非常好的描述,属于日常生活中最常见、最简单的随机变量概率分布,在知道某种实验结果概率的情况下,能够很好推断实验次数后发生其中某一结果次数的概率。

2.2 超几何分布 

2.2.1 概念

超几何分布和二项分布比较相似,二项分布每次实验完全一样,而超几何分布前一次的实验结果会影响后面的实验结果。简单地讲,二项分布抽取之后放回元素,而超几何分布是无放回的抽取。 
超几何分布的概率分布,均值和方差

2.2.2 举例

在一个口袋中装有30个球,其中有10个红球,其余为白球,这些球除颜色外完全相同。游戏者一次从中摸出5个球。摸到至少4个红球就中一等奖,那么获一等奖的概率是多少?

解:由题意可见此问题归结为超几何分布模型。

其中N = 30. r = 10. n = 5.

P(一等奖)= P(X=4)+ P(X=5)

由公式

,x=0,1,2,...得:

P(一等奖) = 106/3393

2.3 泊松分布 

2.3.1 概念

泊松分布适合于描述单位时间内随机事件发生的次数。泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。

泊松分布的概率分布,均值和方差:

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

2.3.2 举例

采用0.05J/㎡紫外线照射大肠杆菌时,每个基因组平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式:

……

3 连续型随机变量的概率分布

3.1 均匀分布

3.1.1 概念

均匀概率分布(uniform probability distribution)是指连续随机变量所有可能出现值出现概率都相同。 
 
均匀分布的概率分布,均值,方差和标准差:

均值:

方差:
标准差:

如何求解均值和标准差:

3.2 正态分布

3.2.1 概念

正态分布是统计学中常见的一种分布,表现为两边对称,是一种钟型的概率分布(bell curve),其概率密度图为:

概率密度函数为:

其中,是正态随机变量的均值; 是标准差; 是圆周率,约等于3.1416··· ;e=2.71828⋅⋅⋅

特别的,当的正态分布,被称为标准正态分布(standard distribution),此时有:

正态分布转化为标准正态分布: 
正态分布x,均值是μ,标准差是σ,z定义为

正态分布来近似二项分布 :
当n足够大的时候,正态分布对于离散型二项分布能够很好地近似。 

评价正态分布 :
如何来确定数据是否正态分布,主要有以下几种方法: 
1. 图形感受法:建立直方图或者枝干图,看图像的形状是否类似正态曲线,既土墩形或者钟形,并且两端对称。 
2. 计算区间,看落在区间的百分比是否近似于68%,95%,100%。(切比雪夫法则和经验法则) 
3. 求IQR和标准差s,计算IQR/s,如若是正态分布,则IQR/s≈1.3.
4. 建立正态概率图,如果近似正态分布,点会落在一条直线上。

3.3  指数分布 

3.3.1 概念

指数分布是描述泊松分布中事件发生时间间隔的概率分布。除了用于泊松过程的分析,还有许多其他应用,如以下场景:

  • 世界杯比赛中进球之间的时间间隔
  • 超市客户中心接到顾客来电之间的时间间隔
  • 流星雨发生的时间间隔
  • 机器发生故障之间的时间间隔
  • 癌症病人从确诊到死亡的时间间隔

指数分布有如下的适用条件: 
1. x是两个事件发生之间的时间间隔,并且x>0; 
2. 事件之间是相互独立的; 
3. 事件发生的频率是稳定的; 
4. 两个事件不能发生在同一瞬间。

这几个条件实质上也是使用泊松分布的前提条件。如果满足上述条件,则x是一个指数随机变量,x的分布是一个指数分布。如果不满足上述条件,那么需要使用Weibull分布或者gamma分布。

指数分布只有一个参数,“λ”,λ是事件发生的频率,在不同的应用场景中可能有不同名称:

  • 事件频率
  • 到达频率
  • 死亡率
  • 故障率
  • 转变率
  • …………

λ是单元时间内事件发生的次数,这里需要注意的是,单元时间可以是秒,分,小时等不同的单位,同时λ根据单元时间度量的不同,其数值也不一样。如单元时间为1小时,λ为6,则单元时间1分钟,λ为6/60=0.1

指数分布的概率密度函数(probability density func,PDF)由λ和x(时间)构成:

均值:

方差:

3.3.2 举例

一个设备出现多次故障的时间间隔记录如下:

23, 261, 87, 7, 120, 14, 62, 47, 225, 71, 246, 21, 42, 20, 5, 12, 120, 11, 3, 14, 71, 11, 14, 11, 16, 90, 1, 16, 52, 95

根据上面数据,我们可以计算得到该设备发生故障的平均时间是59.6小时,即单位小时时间内发生故障事件的次数为λ=1/59.6=0.0168。 
那么该设备在3天(72小时)内出现故障的概率是多大呢?即求P(x<72),这就需要计算指数分布的累积分布函数:


也即该设备3天内出现故障的概率大于70%。


4 参考文献

【1】统计学:离散型和连续型随机变量的概率分布

【2】指数分布

常见的离散型和连续型随机变量的概率分布相关推荐

  1. 统计学:离散型和连续型随机变量的概率分布

    主要随机变量一览表 随机变量 概率分布 均值 方差 一般离散型变量 p(x)的表.公式或者图p(x)的表.公式或者图 ∑xxp(x)\sum_{x}xp(x) ∑x(x−μ)2p(x)\sum_{x} ...

  2. 分类型变量预测连续型变量_概率论与数理统计之离散型和连续型随机变量知识点...

    本文主要回顾复习了有关一维离散型.连续型随机变量及分布,以及相关性质.这一部分主要以选择题和填空题的形式出现在考研数学的试卷中,希望考研的考生多注意这一部分知识的复习,结合历年考研数学真题,争取早日掌 ...

  3. 概率论笔记4.3常见离散型和连续型的期望与方差

    4.3常见离散型和连续型的期望与方差 离散型 0-1分布 二项分布 推导时,np后面的那段式子其实是(p + q)^n,又因为 p + q == 1 所以EX = np 几何分布 证明过程中使用了级数 ...

  4. python 数学期望_数学期望(离散型和连续型)

    数学期望的定义 数学期望的计算公式 例题 1.数学期望的定义 在概率论和统计学中,数学期望(或均值)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一.它反映随机变量平均取值的大小. ...

  5. Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据

    Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据 目录 数据生成之利用pandas自定义生成随机数据 输出结果 实现代码 数据生成之利用pan ...

  6. 连续型随机变量的概率分布

    连续型随机变量的概率分布 概率,大家都知道,就是一个事件发生的可能性.对于离散随机变量,很好描述他的概率分布.比如一个抽奖系统抽到奖品概率就是: 一等奖 二等奖 三等奖 四等奖 1/40 1/10 3 ...

  7. 常用连续型随机变量的概率分布表(附概率密度函数全域积分等于1、期望、方差的推导与证明)

    常用离散型随机变量的内容在这里(CSDN对文章长度设了限制,我只能分成两篇博客来发布). 常用连续型随机变量的概率分布速查表 随机变量 记号 概率密度函数 分布函数 期望 方差 均匀分布 X ∼ U ...

  8. 概率论(二)随机变量及其概率分布——离散和连续型随机变量及其分布函数

    本节知识点 1.随机变量及其分布函数的定义 2.离散型随机变量 定义:随机变量可能取得的值是有限个或者可列无限个 概率分布列 分布函数 常见的离散性随机变量:0-1分布.二项分布和泊松分布 3.连续型 ...

  9. 数理基础(概率论)------离散型和连续型分布期望方差公式

最新文章

  1. mapgis矢量化怎么打分数_mapgis矢量化的详细工作流程
  2. echarts自动生成图片的解决方案
  3. 图解+笔记-python语言-第5章:数字/5.3 内置数字工具/5.3.2 内置数学函数
  4. Elasticsearch kibana一些基本概念
  5. Linux系统巡检项目
  6. Java8新特性解析
  7. 如何优雅地测量一只猫的体积?
  8. spring——事务管理
  9. 0x0000006B蓝屏问题解决方法
  10. 新零售业背景下实体店的经营战略
  11. WebSocket模拟群聊
  12. C# 使用MemeryStream进行序列化
  13. FCPX插件:镜头光晕眩光特效插件PHYX Flarelight
  14. elasticSearch(二)springboot与es的整合
  15. 那个被“爱”刺伤的30岁女孩,在这款游戏里完成了自我“救赎”
  16. Jep解析字符串数学公式
  17. 将Latex tex文档转换成 word文档(下)
  18. 使用nvml获取n卡温度
  19. DVWA靶场-sql盲注
  20. 统计学生成绩 (15 分)

热门文章

  1. linux 常用命令参数集合(二)
  2. [源码和文档分享]基于Win32 API实现的中国象棋游戏
  3. 【支付宝支付】Java实现支付宝APP支付流程
  4. java 编辑我的世界_“我的世界 (Minecraft)”Java版和 RTX 版的世界转换教程
  5. java sha256 实现_JAVA SHA256加密代码实现
  6. 懒人自有懒办法——雅酷互动flash as2简易教程第4篇
  7. 测试接口生成文档的工具 APIFOX
  8. 跟着Cell学单细胞转录组分析(十二):转录因子分析
  9. 广东公办职高计算机网络技术,广州市有哪些公办中专学校 公办中职学校名录?...
  10. java 以管理员执行cmd_java – 以管理员身份运行命令提示符