主要随机变量一览表

随机变量 概率分布 均值 方差
一般离散型变量 p(x)的表、公式或者图p(x)的表、公式或者图 ∑xxp(x)\sum_{x}xp(x) ∑x(x−μ)2p(x)\sum_{x}(x-\mu)^2p(x)
二项分布 p(x)=Cxnpxqn−x (x=0,1,2,3⋅⋅⋅,n)p(x)=C_{n}^{x} p^xq^{n-x} \space (x=0,1,2,3···,n) npnp npqnpq
泊松分布 p(x)=λxe−λx! (x=0,1,2,⋅⋅⋅)p(x)=\frac{\lambda^xe^{-\lambda}}{x!}\space (x=0,1,2,···) λ\lambda λ\lambda
超几何分布 p(x)=CxrCn−xN−rCnNp(x)=\frac{C_{r}^{x}C_{N-r}^{n-x}}{C_{N}^{n}} nrN\frac{nr}{N} r(N−r)n(N−n)N2(N−1)\frac{r(N-r)n(N-n)}{N^2(N-1)}
均匀分布 f(x)=1b−a (a≤x≤b)f(x)=\frac{1}{b-a}\space (a\leq x\leq b) a+b2\frac{a+b}{2} b−a12√\frac{b-a}{\sqrt {12}}
正态分布 f(x)=1σ2π√e−(1/2)[(x−μ)σ]2f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-(1/2)[(x-\mu)\sigma]^2} μ\mu σ2\sigma^2
标准正太分布 f(z)=12π√e−(1/2)z2f(z)=\frac{1}{\sqrt{2\pi}}e^{-(1/2)z^2} 0 1
指数分布 f(x)=1θe−x/θ(x>0)f(x)=\frac{1}{\theta}e^{-x/\theta}(x>0) μ=θ\mu=\theta σ=θ\sigma=\theta

1. 离散型和连续型随机变量的定义

离散型随机变量(discrete random variable):取值是可数的个值的随机变量, 比如投掷一枚骰子的朝上的点数,可能是1,2,3,4,5,6;比如南京大学四食堂吃饭的人数,可能是0,1,2···。
连续型随机变量(continuous random variable):取值是一个区间中的任意一点(也就是不可数)的随机变量,比如南京大学同学身高。


2. 离散型随机变量的概率分布

  1. 基本概念的公式表达
    均值(期望值expected value):μ=E(x)=∑xp(x)\mu=E(x)=\sum xp(x)
    方差(variance):σ=E[(x−μ)2]=∑(x−μ)2p(x)\sigma=E[(x-\mu)^2]=\sum (x-\mu)^2p(x)
    标准差(standard deviation):σ=σ2−−√\sigma =\sqrt {\sigma^2}
    其中,可以证明到E[(x−μ2)]=E(x)2−μ2E[(x-\mu^2)]=E(x)^2-\mu^2
    2. 二项分布
    如果进行n次不同的实验,每次试验完全相同并且只有两种可能的结果,这样的实验结果分布情况就是二项分布。最简单的比如投掷一枚硬币,不管进行多少次实验,实验结果都只有正面朝上或者反面朝上,这就是一个简单的二项分布。
    二项概率分布:

    p(x)=Cxnpxqn−x (x=0,1,2,3⋅⋅⋅,n)

    p(x)=C_{n}^{x} p^xq^{n-x} \space (x=0,1,2,3···,n)

    其中:n代表n次实验,x表示实验结果为T的次数,q是实验结果为T的概率,q=1-p,表示实验结果为F的概率。
    

    二项分布的
    均值:μ=np\mu=np
    方差:σ2=npq\sigma^2=npq
    标准差:σ=npq−−−√\sigma=\sqrt {npq}
    二项分布对于结果只有两种情况的随机事件有非常好的描述,属于日常生活中最常见、最简单的随机变量概率分布,在知道某种实验结果概率的情况下,能够很好推断实验次数后发生其中某一结果次数的概率。
    3. 泊松分布
    泊松分布的概率分布,均值和方差:

    p(x)=λxe−λx! (x=0,1,2,⋅⋅⋅)

    p(x)=\frac{\lambda^xe^{-\lambda}}{x!}\space (x=0,1,2,···)

    μ=λ

    \mu=\lambda

    σ2=λ

    \sigma^2=\lambda
    4. 超几何分布
    超结合分布和二项分布比较相似,二项分布每次实验完全一样,而超几何分布前一次的实验结果会影响后面的实验结果。简单地讲,二项分布抽取之后放回元素,而超几何分布是无放回的抽取。
    超几何分布的概率分布,均值和方差:

    p(x)=CxrCn−xN−rCnN

    p(x)=\frac{C_{r}^{x}C_{N-r}^{n-x}}{C_{N}^{n}}

    μ=nrN

    \mu=\frac{nr}{N}

    σ2=r(N−r)n(N−n)N2(N−1)

    \sigma^2=\frac{r(N-r)n(N-n)}{N^2(N-1)}


3. 连续型随机变量的概率分布

  • 概率密度函数(probability density function):
    又称之为频率函数(frequency function),或者概率分布(probability distribution),用来表示连续型随机变量的概率分布情况,一般是一条光滑的曲线。
    1. 正太分布(normal distribution)

    正态分布是统计学中常见的一种分布,表现为两边对称,是一种钟型的概率分布(bell curve),正太分布有一下的特征:

    概率密度函数:

    f(x)=1σ2π−−√e−(1/2)[(x−μ)σ]2

    f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-(1/2)[(x-\mu)\sigma]^2}

    其中,μ\mu是正太随机变量的均值;
    σ\sigma是标准差;
    π\pi是圆周率,约等于3.1416···
    e=2.71828⋅⋅⋅e=2.71828···

特别的,当μ=0且σ=1\mu=0且\sigma=1的正态分布,被称为标准正太分布(standard distribution),此时有:

f(z)=12π−−√e−(1/2)z2

f(z)=\frac{1}{\sqrt{2\pi}}e^{-(1/2)z^2}
标准正态分布有对应的标准正态分布表,通过该表可以找到对应值累积的概率。

正太分布转化为标准正态分布:
正太分布x,均值是μ,标准差是σ,z定义为z=(x−μ)/σx ,均值是\mu,标准差是\sigma,z定义为z=(x-\mu)/\sigma

正态分布来近似二项分布
当n足够大的时候,正态分布对于离散型二项分布能够很好地近似。

评价正态分布
如何来确定数据是否正态分布,主要有以下几种方法:
1. 图形感受法:建立直方图或者枝干图,看图像的形状是否类似正太曲线,既土墩形或者钟形,并且两端对称。
2. 计算区间x¯±s,x¯±2s,x¯±3s\bar x\pm s,\bar x\pm 2s,\bar x\pm 3s,看落在区间的百分比是否近似于68%,95%,100%。(切比雪夫法则和经验法则)
3. 求IQR和标准差s,计算IQR/s,如若是正态分布,则IQR/s≈1.3.求IQR和标准差s,计算IQR/s,如若是正态分布,则IQR/s\approx 1.3.
4. 建立正态概率图,如果近似正态分布,点会落在一条直线上。

2. 均匀分布
均匀概率分布(uniform probability distribution)是指连续随机变量所有可能出现值出现概率都相同。

均匀随机变量x概率分布特征:
概率密度函数:

f(x)=1b−a (a≤x≤b)

f(x)=\frac{1}{b-a}\space (a\leq x\leq b)
均值: μ=a+b2\mu=\frac{a+b}{2}
标准差: σ=b−a12√\sigma=\frac{b-a}{\sqrt {12}}

3. 指数分布
指数概率分布(exponential probability distribution),具有如下特征:
概率密度函数:

f(x)=1θe−x/θ(x>0)

f(x)=\frac{1}{\theta}e^{-x/\theta}(x>0)
均值: μ=θ\mu=\theta
标准差: σ=θ\sigma=\theta


更多文章:
概率论中基本概念回顾

统计学:离散型和连续型随机变量的概率分布相关推荐

  1. 常见的离散型和连续型随机变量的概率分布

    目录 1 基本概念 2 离散型随机变量的概率分布 2.1 二项分布 2.2 超几何分布 2.2.1 概念 2.2.2 举例 2.3 泊松分布 3 连续型随机变量的概率分布 3.1 均匀分布 3.1.1 ...

  2. 分类型变量预测连续型变量_概率论与数理统计之离散型和连续型随机变量知识点...

    本文主要回顾复习了有关一维离散型.连续型随机变量及分布,以及相关性质.这一部分主要以选择题和填空题的形式出现在考研数学的试卷中,希望考研的考生多注意这一部分知识的复习,结合历年考研数学真题,争取早日掌 ...

  3. python 数学期望_数学期望(离散型和连续型)

    数学期望的定义 数学期望的计算公式 例题 1.数学期望的定义 在概率论和统计学中,数学期望(或均值)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一.它反映随机变量平均取值的大小. ...

  4. 连续型随机变量的概率分布

    连续型随机变量的概率分布 概率,大家都知道,就是一个事件发生的可能性.对于离散随机变量,很好描述他的概率分布.比如一个抽奖系统抽到奖品概率就是: 一等奖 二等奖 三等奖 四等奖 1/40 1/10 3 ...

  5. Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据

    Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据 目录 数据生成之利用pandas自定义生成随机数据 输出结果 实现代码 数据生成之利用pan ...

  6. 常用连续型随机变量的概率分布表(附概率密度函数全域积分等于1、期望、方差的推导与证明)

    常用离散型随机变量的内容在这里(CSDN对文章长度设了限制,我只能分成两篇博客来发布). 常用连续型随机变量的概率分布速查表 随机变量 记号 概率密度函数 分布函数 期望 方差 均匀分布 X ∼ U ...

  7. 概率论笔记4.3常见离散型和连续型的期望与方差

    4.3常见离散型和连续型的期望与方差 离散型 0-1分布 二项分布 推导时,np后面的那段式子其实是(p + q)^n,又因为 p + q == 1 所以EX = np 几何分布 证明过程中使用了级数 ...

  8. 概率论(二)随机变量及其概率分布——离散和连续型随机变量及其分布函数

    本节知识点 1.随机变量及其分布函数的定义 2.离散型随机变量 定义:随机变量可能取得的值是有限个或者可列无限个 概率分布列 分布函数 常见的离散性随机变量:0-1分布.二项分布和泊松分布 3.连续型 ...

  9. 数理基础(概率论)------离散型和连续型分布期望方差公式

最新文章

  1. centos7 安装 Mysql 5.7.28,详细完整教程
  2. 2022,人工智能开启未来新密码
  3. web.py做图片上传网页
  4. uva 101 木块问题
  5. 网络编程应用:基于TCP协议【实现对象传输】--练习
  6. SAP CRM WebClient UI Sales Area的cancel处理
  7. [2020-11-30 contest]数列(矩阵加速),秘密通道(dijkstra最短路)小X游世界树(换根dp),划分(数学)
  8. pytorch微调bert_小版BERT也能出奇迹:最火的预训练语言库探索小巧之路
  9. idea junit 测试看不到控制台报错信息_高手都这么给 Spring MVC 做单元测试!
  10. 程序员为什么 365 天背电脑包?这答案我服!
  11. mysqlgbk不支持中文吗_【转载】mysql 不支持中文解决办法
  12. Zero Sum chapter 2.3 dfs
  13. Overfeat 笔记
  14. GitChat,一个记录技术和躺着赚零花钱的免费平台
  15. 免费的数据恢复软件哪个好?教您找回丢失数据!
  16. MP2451 VOUT计算公式 表
  17. 人工智能的五大核心技术
  18. 宝塔的安全防范-服务器防火墙配置经验分享
  19. PowerBI visuals共计246组2020年1月31日扒取(Power BI 视觉对象)
  20. C# Winform Panel 内控件大小不随Panel大小改变设置

热门文章

  1. 权值衰减和L2正则化傻傻分不清楚?
  2. C语言---sprintf组包、sscanf解包
  3. win10 无法正常启动mindmanager 思维导图
  4. 在windows环境下可以直接运行的word2vec.c 并带有详细注释
  5. 怎么使用漫画脸制作软件
  6. 万国数据指责Blue Orca恶意做空 称做空报告断章取义
  7. 边缘计算:展望与挑战
  8. App Store拒绝原因
  9. 使用vue-cli搭建SPA项目
  10. 安卓盒子launcher界面开发之添加自动定位,获取当地天气