文章目录

  • 超几何分布HyperGeometricDistribution
  • 举例并图示
  • 大数据集情况

超几何分布HyperGeometricDistribution

超几何分布描述不放回抽样的抽取试验,即每进行一次抽样,事件发生的概率均有一定的变化。

如:

在含有M个红球的N个球中,任取n个球,其中恰有X个红球,则事件{X=k}发生的概率为:

P(X=k,n,M,N)=CMkCN−Mn−kCNn\large\displaystyle P(X=k,n,M,N)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}P(X=k,n,M,N)=CNn​CMk​CN−Mn−k​​

如果是抽取n+1n+1n+1个球,则

P(X=k,n+1,M,N)=CMkCN−Mn+1−kCNn+1\large\displaystyle P(X=k,n+1,M,N)=\frac{C_M^kC_{N-M}^{n+1-k}}{C_N^{n+1}}P(X=k,n+1,M,N)=CNn+1​CMk​CN−Mn+1−k​​

期望

E(X)=∑x=0nxP(X=x)=∑x=0nxCMkCN−Mn−kCNn=nMN∑CM−1k−1CN−Mn−(k−1)CN−1n−1=nMN\begin{aligned}\Large\displaystyle E(X) &=\sum_{x=0}^{n}xP(X=x)=\sum_{x=0}^{n}x\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\\ \Large\displaystyle &=n\frac{M}{N}\sum\frac{C_{M-1}^{k-1}C_{N-M}^{n-(k-1)}}{C_{N-1}^{n-1}} \\ &=n\frac{M}{N}\end{aligned}E(X)​=x=0∑n​xP(X=x)=x=0∑n​xCNn​CMk​CN−Mn−k​​=nNM​∑CN−1n−1​CM−1k−1​CN−Mn−(k−1)​​=nNM​​

方差
Var(X)=E[(X−E(X))2]=nM(N−M)(N−n)N2(N−1)\displaystyle Var(X)=E[(X-E(X))^2]=n\frac{M(N-M)(N-n)}{N^2(N-1)}Var(X)=E[(X−E(X))2]=nN2(N−1)M(N−M)(N−n)​

举例并图示

从含有10个红球的30个球中抽取5个球,则红球个数的概率符合超几何分布。

from scipy import stats
N = 30 # total number of the objects
M = 10 # total number of Type I objects
n=5
# scipy 超几何分布函数的参数顺序是 (总量,类别量,抽取量)
po=stats.hypergeom(N,M,n)
x=np.arange(n+1)
px=po.pmf(x)
# 图形
fig = plt.figure()
ax = plt.gca()
line1 = ax.stem(x,px,basefmt='k',label='抽取红球数量的概率');
ax.set_xlabel('随机变量:抽取红球个数');
ax.set_ylabel('发生概率');
ax.set_title('超几何分布:球总量30,红球10,抽取量5');ax2=plt.twinx()
y=po.cdf(x)
line2 = ax2.plot(x,y,'r',label='累积概率')
ax2.set_ylabel('累积概率',color='r')
ax.legend(loc=(0.65,0.8));
ax2.legend(loc=(0.65,0.7))

# 统计量期望、方差
po.stats()
#输出为
(array(1.66666667), array(0.95785441))

E(x)=5×1030=5/3E(x)=5×\frac{10}{30}=5/3E(x)=5×3010​=5/3

如果猜测红球个数输赢,即P(X=r)>0.5P(X=r)>0.5P(X=r)>0.5,则

po.ppf(0.5)

输出为2.0.

大数据集情况

从含有100个红球的300个球中抽取50个球,则红球个数的概率符合超几何分布,接近正态分布。

N = 300 # total number of the objects
M = 100 # total number of Type I objects
n=50
po=stats.hypergeom(N,M,n)x=np.arange(n+1)
px=po.pmf(x)
# 图形
fig = plt.figure()
ax = plt.gca()
line1 = ax.stem(x,px,basefmt='k',label='抽取红球数量的概率');
ax.set_xlabel('随机变量:抽取红球个数');
ax.set_ylabel('发生概率');
ax.set_title('超几何分布:球总量300,红球100,抽取量50');ax2=plt.twinx()
y=po.cdf(x)
line2 = ax2.plot(x,y,'r',label='累积概率')
ax2.set_ylabel('累积概率',color='r')
ax.legend(loc=(0.65,0.8));
ax2.legend(loc=(0.65,0.7))

超几何分布HyperGeometricDistribution相关推荐

  1. 几何分布和超几何分布

    1. 在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=m 则.此时我们称随机变量X服从超几何分布 1)超几何分布的模型是不放回抽样 2)超几何分布中的参数是M,N,n X ~ ...

  2. 超几何分布_常见概率分布

    离散分布 退化分布 若r.v.  只取常数值c,即  ,这时分布函数为: 把这种分布称为退化分布或者单点分布. 伯努利分布 在一次实验中,事件A出现的概率为  ,不出现的概率为  ,若用  记事件A出 ...

  3. 几何分布的期望和方差公式推导_超几何分布的数学期望与方差推导

    考虑 个外表相同的物品,其中有 个同类物品与另一类的 个物品:抽取 个物品,每个物品的抽取等概率随机. 上述便是一个超几何分布(Hypergeometric Distribution)的基本模型. 抽 ...

  4. 超几何分布_概率小题——分布列专题

    本期将介绍概率小题中的最后一个考点分布列,其中包括分布列的定义.求法和性质,以及如何通过分布列求解期望和方差,以及期望和方差的性质:除此之外还涉及到部分典型分布分布列的求法已经对应期望和方差的求解公式 ...

  5. 几何分布的期望_超几何分布与二项分布的数学期望

    引入 故事要从这周数学课上的一次考试说起: ❝ 口袋中有黑球.白球共7个.从中任取两个球,若抽到白球的数学期望为,则白球有____个. ❞ 我遇到了这样一道题,题目很简单,所以我很快就想出解法,算出答 ...

  6. python比较两个列表的重合度_#源代码#超几何分布算法介绍及python下的实现代码...

    原标题:#源代码#超几何分布算法介绍及python下的实现代码 超几何分布是统计学上一种离散概率分布.它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还). 在产品质量的不放回抽 ...

  7. 伯努利分布、二项分布、几何分布、超几何分布、泊松分布

    导语        对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量. 伯努利分布        伯努利分布就是我们常见的0-1分布,即它的随机变量只取0 ...

  8. 超几何分布与二项分布及其期望

    惊奇的发现选修2-3上有期望的介绍,不过我没有课本啊qwq.只能去网上找资料了.. 这两节我感觉比较有意思,就记一下吧 超几何分布 名字真高大上 定义 超几何分布(Hypergeometric dis ...

  9. 常见分布律、分布函数、概率密度表,伯努利分布、二项分布、泊松分布、几何分布、超几何分布、均匀分布、高斯分布、指数分布

    离散型随机变量及分布律 分布名称 \qquad\qquad\qquad 记法 \qquad\qquad\qquad\qquad 分布律 \qquad\qquad\qquad\qquad\qquad\q ...

最新文章

  1. 详细介绍!Linux 上几种常用的文件传输方式
  2. 关于GUI_DOWNLOAD中下载excel等文档的乱码问题
  3. 滴滴基于 Flink 的实时数仓建设实践
  4. [css] 什么是FOUC?你是如何避免FOUC的?
  5. VALSE 2020 公开征集 Workshop 候选讲者
  6. virtual box 安装win8 提示status: 0xc0000225错误的处理
  7. 解读TIME_WAIT--你在网上看到的大多数帖子可能都是错误的
  8. ckplayer ajax,旋风解析
  9. 怎样搜索计算机中docx格式的文件,如何打开docx文件 打开docx文件方法
  10. 根据几何定义使用计算机编程求定积分的值
  11. Windows系统运行VirtualBox一直出现0x00000000指令引用的0x00000000内存该内存不能为written
  12. vue admin html,vue-admin-template笔记(六)
  13. URL中 # ? 是什么意思
  14. 2's complement 与 1's complement
  15. Vue验证手机号的同时验证座机号
  16. 超微服务器主板ipmi证书,超微主板的服务器使用IPMI远程安装操作系统教程
  17. Fedora 34 Workstation安装后的配置
  18. 数据库发展史2--数据仓库
  19. Matomo使用IP 2 Location数据库提升地域分析精度
  20. 如何选择python培训

热门文章

  1. iOS11.3 beta5专为提升苹果X速度?网友:iPhone6S的我们怎么办
  2. 服务器win10系统开机慢,Win10系统更新后开机变得很慢的解决方法
  3. Laya.TextInput组件中禁用后改变输入框背景色和文字颜色
  4. mongodb实现一主两从一个仲裁者
  5. 转载-GNS3安装和使用教程(超详细)
  6. 固态硬盘基础知识,了解一下
  7. python实现简易搜索引擎(含代码)
  8. Bootstrap下拉菜单失效的解决方法+使用Bootstrap制作响应式网页
  9. 项目3-分数类中的运算符重载
  10. python用pandas读取excel指定列_Python用Pandas读写Excel