文章目录

  • 正态分布
  • 二项分布
  • 验证

正态分布

正态分布,最早由棣莫弗在二项分布的渐近公式中得到,而真正奠定其地位的,应是高斯对测量误差的研究,故而又称Gauss分布。测量是人类定量认识自然界的基础,测量误差的普遍性,使得正态分布拥有广泛的应用场景,或许正因如此,正太分布在分布族谱图中居于核心的位置。

正态分布 N ( μ , σ ) N(\mu, \sigma) N(μ,σ)受到期望 μ \mu μ和方差 σ 2 \sigma^2 σ2的调控,其概率密度函数为

1 2 π σ 2 exp ⁡ [ − ( x − μ ) 2 2 σ 2 ] \frac{1}{\sqrt{2\pi\sigma^2}}\exp[-\frac{(x-\mu)^2}{2\sigma^2}] 2πσ2 ​1​exp[−2σ2(x−μ)2​]

当 μ = 0 \mu=0 μ=0而 σ = 1 \sigma=1 σ=1时,为标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),对应概率分布函数为 Φ ( x ) = 1 2 π exp ⁡ [ − x 2 2 ] \Phi(x)=\frac{1}{\sqrt{2\pi}}\exp[-\frac{x^2}{2}] Φ(x)=2π ​1​exp[−2x2​],形状如下,

scipy.stats中,分别封装了正态分布类norm和标准正态分布类halfnorm

二项分布

二项分布是非常简单而又基础的一种离散分布,貌似是高中学到的第一个分布,就算不是第一个,也是第一批。在 N N N次独立重复的伯努利试验中,设A在每次实验中发生的概率均为 p p p。则 N N N次试验后A发生 k k k次的概率分布,就是二项分布,记作 X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p),则

P { X = k } = ( n k ) p k ( 1 − p ) n − k P\{X=k\}=\binom{n}{k}p^k(1-p)^{n-k} P{X=k}=(kn​)pk(1−p)n−k

其中 ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k}=\frac{n!}{k!(n-k)!} (kn​)=k!(n−k)!n!​,高中的写法一般是 C n k C^k_n Cnk​。

记 q = 1 − p q=1-p q=1−p,令 x k = k − n p n p q x_k=\frac{k-np}{\sqrt{npq}} xk​=npq ​k−np​,当 n n n趋近于无穷大时,根据De Moivre–Laplace定理,有

lim ⁡ n → ∞ n ! k ! ( n − k ) ! p k q n − k ≈ 1 2 π n p q e ( k − n p ) 2 2 n p q \lim_{n\to\infty}\frac{n!}{k!(n-k)!}p^kq^{n-k}\approx\frac{1}{\sqrt{2\pi npq}}e^{\frac{(k-np)^2}{2npq}} n→∞lim​k!(n−k)!n!​pkqn−k≈2πnpq ​1​e2npq(k−np)2​

即服从 σ 2 = n p q , μ = n p \sigma^2=npq, \mu=np σ2=npq,μ=np的高斯分布。

验证

下面通过scipy.stats对二项分布和高斯分布之间的关联进行验证

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as ssp,q = 0.2, 0.8
ns = [10, 100, 1000, 10000]fig = plt.figure()
for i,n in enumerate(ns):rs = ss.binom(n, p).rvs(50000)rv = ss.norm(n*p, np.sqrt(n*p*q))st, ed = rv.interval(0.999)xs = np.linspace(st, ed, 100)ys = rv.pdf(xs)ax = fig.add_subplot(2,2,i+1)ax.hist(rs, density=True, bins='auto', alpha=0.2)ax.plot(xs, ys)plt.title(f"n={n}")plt.show()

效果如下,可见随着 n n n越来越大,二项分布的随机数越来越靠近正态分布的概率密度曲线

【分布族谱】正态分布和二项分布的关系相关推荐

  1. 【分布族谱】正态分布和卡方分布的关系

    文章目录 正态分布 卡方分布 卡方分布的极限 正态分布 正态分布,最早由棣莫弗在二项分布的渐近公式中得到,而真正奠定其地位的,应是高斯对测量误差的研究,故而又称Gauss分布..测量是人类定量认识自然 ...

  2. 正态分布与泊松分布的关系

    正态分布 正态分布(normal distribution)又名高斯分布(Gaussian distribution).正规分布,是一个非常常见的连续概率分布.正态分布在统计学上十分重要,经常用在自然 ...

  3. 机器学习中的数学——常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)

    分类目录:<机器学习中的数学>总目录 相关文章: · 常用概率分布(一):伯努利分布(Bernoulli分布) · 常用概率分布(二):范畴分布(Multinoulli分布) · 常用概率 ...

  4. 泊松分布与二项分布的关系

    泊松分布与二项分布的关系 实际上泊松分布更趋向于连续时间事件,可进行时间片无限细化.二项分布偏向离散化事件,也就是每个事件按次进行. 当二项分布的次数无穷多,每次发生的概率无限小,就变成了泊松分布.但 ...

  5. 伽马分布,指数分布,泊松分布的关系 -转自简书

    原文链接:https://www.jianshu.com/p/6ee90ba47b4a 伽马分布,指数分布,泊松分布的关系  thinkando 关注 2018.09.25 21:13* 字数 714 ...

  6. 卡方分布、F分布、t分布和正态分布的关系

    这三个分布都是基于正态分布变形得到的,在实际中只能用来做假设检验.比如卡方分布(chi-square distribution, χ²-distribution,或写作χ²分布),已知样本X都是服从正 ...

  7. 【分布族谱】高斯分布和逆高斯分布的关系

    文章目录 高斯分布 逆高斯分布简介 通过高斯分布构造逆高斯分布 高斯分布 正态分布,又称Gauss分布,其概率密度函数入下图所示 正态分布 N ( μ , σ ) N(\mu, \sigma) N(μ ...

  8. 【Statistics-5】——正态分布与二项分布的逼近

    在前文中,实际上我们不仅仅在考虑,抽样分布的置信区间与假设检验方法:实际上,我们面对的是一种特殊的分布.当然,我们都学过概率论,所以我们也知道,这其实就是中心极限定理--特别的,这里是二项分布逼近正态 ...

  9. 伽马分布,指数分布,卡方分布三者关系

    1.伽马分布是一个连续概率分布,具有两个参数 α\alphaα 和 λ\lambdaλ,记为 Gamma(α,λ)\text{Gamma}(\alpha,\lambda)Gamma(α,λ).伽马分布 ...

最新文章

  1. C 把两个bitmap文件合并成一个bitmap文件
  2. 团队项目的分工及绩效评估方法
  3. TPU和GPU跑模型时间统计(持续更新中)以及TPU Research Cloud的申请
  4. 个人站立会议(11月16日)
  5. idea常用快捷键设置
  6. 上海大学计算机网络实验报告3,上海大学计算机组成原理实验报告(全)
  7. rabbitmq接收不到消息_SpringBoot2.x系列教程63--SpringBoot整合消息队列之RabbitMQ详解
  8. Java 异常类层次结构
  9. Linux设备驱动——PCI总线的初始化
  10. Perl 脚本命令行传入参数
  11. Easyrecovery13 for mac 官方版下载
  12. 电池、电机、螺旋桨搭配
  13. Pytorch 运行加速
  14. fiddler手机抓包配置方法
  15. 日落20181125001 - UGUI组件应用之Animation和CanvasGroup制作渐现渐隐效果
  16. HDL4SE:软件工程师学习Verilog语言(十一)
  17. c语言顺序队函数调用,顺序队的基本操作复习过程.doc
  18. SQLite安装配置详细教程2023版
  19. PC制做gif动图超简单教程
  20. IT部门应如何制定技术路线图

热门文章

  1. 林仕鼎:架构设计与架构师
  2. html5 离线资源缓存,html5的离线缓存使用方法
  3. Epub360教你招聘H5页面设计与制作
  4. 下载 编译 OBS 27.2 最新版本
  5. 深陷财务造假丑闻,瑞幸咖啡爆单了!外卖小哥惊呼:单子多得忙不过来...烧钱模式已走到尽头?...
  6. jeston TX1/TX2 系统迁移至SD卡的正确步骤
  7. MVP+okhttp请求网络接口
  8. Sqlite如何读取CherryTree生成的.ctb文件
  9. Java如何实现截取字符串
  10. 基于STM32的FM发射机