一、超几何分布

1.1、定义

假设N个产品中M个废品,以X记为从N个产品中随机抽出n个里面所包含的废品数m,则:
P(X=m)=(mM)(n−mN−M)/(nN)P(X=m) = {\Large (^M_m)(^{N-M}_{n-m})/(^N_n)}P(X=m)=(mM​)(n−mN−M​)/(nN​)
其中:0≤m≤M,n≤N,n-m≤N-M。

上述概率函数就是超几何分布的概率函数,之所以称为这个名字,是因为其形式与“超几何函数”的级数展开式有关。

1.2、与二项分布关系

这个分布在涉及抽样的问题中常用,特别当 N不大时。因为通常在抽样时,多是“无放回的”,即已抽出的个体不再有放回去以供再次抽出的机会,这就与把n个同时抽出的效果一样,如果一个一个地抽而抽出过的仍放回,则结果是二项分布。

对于二项分布,如果n/N很小,则放回与不放回差别不大。由此可见,在这种情况下超几何分布应与二项分布很接近,确切地说,若X服从超几何分布,则当n 固定时,M/N=p固定;N→∞时,X近似地服从二项分布B(n,p)。

二、负二项分布

2.1、结合例子的定义

为了检查某厂产品的废品率 p 大小,有两个试验方案可采取:一是从该厂产品中抽出若干个,检查其中的废品数X,这一方案导致二项分布;

另一个方案是先指定一个自然数r,一个一个地从该厂产品中抽样检查,直到发现第r个废品为止。以X记到当时为止已检出的合格品个数。显然,若废率p小,则X倾向于取较大的值;反之当p大时,则X倾向于取小值。故X可用于衡量p的大小。为计算X的分布,假定各次抽取的结果(是否为废品)是独立的,且每次抽得废品的概率保持固定为p。
考察{X=i}这个事件,为使这个事件发生,需要以下两个事件同时发生:

  1. 在前 i+r-1 次抽取中,恰有r-1个废品;
  2. 第 i+r 次抽出废品。

按所作假定,这两个事件的概率分别为b(r-1;i+r-1,p)和p。再由独立性,即得:
P(X=i)=b(r−1;i+r−1,p)p=(r−1i+r−1)pr(1−p)i{\Large P(X=i) = b(r-1;i+r-1,p)p \,\, = \,(^{i+r-1}_{r-1})p^r(1-p)^i}P(X=i)=b(r−1;i+r−1,p)p=(r−1i+r−1​)pr(1−p)i

这个分布称为负二项分布

2.2、负二项分布的由来

  1. 负二项分布这个名称的来由缘由在“负指数二项展开式”:
    (1−x)−r=∑0∞(i−r)(−x)i=∑0∞(ii+r−1)xi=∑0∞(r−1i+r−1)xi{\Large (1-x)^{-r}=\sum\limits_0^∞(^{-r}_{\;\;i})(-x)^i=\sum\limits_0^∞(^{i+r-1}_{\;\;\;i})x^i=\sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})x^i}(1−x)−r=0∑∞​(i−r​)(−x)i=0∑∞​(ii+r−1​)xi=0∑∞​(r−1i+r−1​)xi
    令x=1-p,并在上式左右两边等乘以prp^rpr,得到:
    1=∑0∞(r−1i+r−1)(1−p)ipr1 = \sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})(1-p)^ip^r1=0∑∞​(r−1i+r−1​)(1−p)ipr
    这就证明了负二项分布的所有 P(X=i)的和等于1。
  2. 二项分布在试验抽样时,定下抽样个数n而把废品个数X作为变量,负二项分布则相反,是定下废品个数r,而把总抽样次数减去r作为变量,也基于此称为负二项分布。

老猿注:上面的推导中,用到了负数的组合数和负数的阶乘,相关定义与正数一样,因此有:
(i−r)=(−r)!i!(−r−i)!=(−r)(−r−1)...(−r−i+1)i!{(^{-r}_{\;\;i})=\frac{(-r)!}{i!(-r-i)!}=\frac{(-r)(-r-1)...(-r-i+1)}{i!}}(i−r​)=i!(−r−i)!(−r)!​=i!(−r)(−r−1)...(−r−i+1)​
=(−1)ir(r+1)...(r+i−1)i!=(-1)^i\;\;\frac{r(r+1)...(r+i-1)}{i!}=(−1)ii!r(r+1)...(r+i−1)​
=(−1)i(r+i−1)!(r−1)!i!=(−1)i(ir+i−1)=(-1)^i\;\;\frac{(r+i-1)!}{(r-1)!i!}=(-1)^i\;\;(^{r+i-1}_{\;\;i})=(−1)i(r−1)!i!(r+i−1)!​=(−1)i(ir+i−1​)

2.3、负二项分布的特例

当取负二项分布中的r=1,则负二项分布变为了:
P(X=i)=(0i)p(1−p)i=p(1−p)i{\Large P(X=i) =\,(^{i}_{0})p(1-p)^i=p(1-p)^i}P(X=i)=(0i​)p(1−p)i=p(1−p)i
这是一个公比为(1-p)的等比级数,也称为几何级数,这种情况下的分布称为几何分布

三、小结

本文介绍了离散随机变量的超几何分布、负二项分布、几何分布的概念,以及相关的公式推导,从介绍可知,他们与二项分布有密切的关系。

更多人工智能数学基础请参考专栏《人工智能数学基础》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

人工智能数学基础--概率与统计11:离散随机变量的超几何分布和负二项分布相关推荐

  1. 人工智能数学基础--概率与统计3:随机变量与概率分布

    一.随机变量 假设对一个样本空间的每个点,我们指定一个数,于是就在该样本空间上定义了一个函数,称这个函数为随机变量(random variable)或更确切地称之为随机函数. 随机变量通常用大写字母X ...

  2. 人工智能数学基础--概率与统计13:连续随机变量的标准正态分布

    一.引言 在<人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布>介绍了连续随机变量概率分布及概率密度函数的概念,并介绍了连续随机变量一个重要的概率密度函数:正态分布 ...

  3. 人工智能数学基础--概率与统计14:连续随机变量的指数分布、威布尔分布和均匀分布

    一.引言 在<人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布>介绍了连续随机变量概率分布及概率密度函数以及正态分布,<人工智能数学基础–概率与统计13:连续 ...

  4. 人工智能数学基础--概率与统计1:随机试验、样本空间、事件、概率公理定理以及条件概率和贝叶斯法则

    随机试验 我们都非常熟悉在科学研究和工程中试验的重要性.试验对我们是有用的,因为我们可以假定,在非常接近的确定条件下进行固定的试验,基本上会得到相同的结果.在这样的环境中,我们可以控制那些对试验结果有 ...

  5. 人工智能数学基础--概率与统计7:学习中一些术语的称呼或表示变化说明以及独立事件的一些补充推论

    一.概念表示变化说明 笔者最开始学习概率论时,是以美版M.R.斯皮格尔等著作的<概率与统计>作为教材学习,学习过程中发现部分内容理解困难,之所以这样,一是这本书的内容太古老,教材是2002 ...

  6. 人工智能数学基础--概率与统计2:排列组合的表示方法、二项式系数及斯特林近似

    ### 引言 在很多情况样本空间的样本点数不是非常大,从而直接计数样本点数获得概率并不困难. 当然,有些问题直接计数实际上是不可能的.计数要使用**组合分析**,这也称为一种精细的计数方法. 这些组合 ...

  7. 人工智能数学基础专栏目录

    ☞ ░ 前往老猿Python博文目录 ░ 本专栏为人工智能数学基础,相关内容介绍人工智能相关的数学知识,在老猿学习过程中,会将一些知识的基础知识都在本专栏内体现,尽量做到本专栏涉及知识点的内容闭环. ...

  8. 离散随机变量和连续随机变量_随机变量深度崩溃课程

    离散随机变量和连续随机变量 表中的内容 (Table of Content) Random Variables随机变量 Probability Distribution Functions概率分布函数 ...

  9. 人工智能-数学基础-数据科学必备分布

    正态分布 import numpy as np import scipy.stats as stats #在scipy中把各种分布的函数拿到手 import matplotlib.pyplot as ...

最新文章

  1. RocketMQ NameServer启动要初始化哪些参数
  2. springcloud----负载均衡--Ribbon与LoadBalance
  3. MacBook/MacOS如何写入MacBook特有的符号(例如:⌘/⌥/⎋/⇪)
  4. JavaWeb基础—dbutils的简单入门
  5. PowerDesigner15 下载 数据库建模工具
  6. Logistic逻辑回归用初等数学解读逻辑回归
  7. mysql not in 的坑 -- null 值
  8. 数据结构和算法——八种常用的排序算法----选择排序
  9. 学习自旋电子学的笔记03:初试自旋波模拟
  10. YoloV5 训练长方形图像
  11. 国密SM4算法(简介与C源码)
  12. 入侵检测与防御技术基础
  13. 基于SSM的企业OA办公系统
  14. Java项目:SSM快递取件管理系统
  15. 自己做的Google地图下载工具(一)
  16. HDU 2017 多校联赛 1002 Balala Power!
  17. python郑州就业怎么样_目前学什么技术好
  18. Unity与IOS⭐二、Unity接入IOS版百度语音:语音唤醒
  19. PGP实现安全电子邮件通信
  20. Java获取当前月的上一个月

热门文章

  1. Grads转成Netcdf
  2. 程序员的vbs强势表白
  3. 插入排序,二分版插入排序和希尔排序的差别详解(C语言)
  4. [转]Mysql在大型网站的应用架构演变
  5. 上、下、左、右键的ASCII值
  6. 解决 ubuntu 14.04下,eclipse adt-bundle-linux 闪退的问题,最新ADT-23.0.7
  7. lazyLoadingEnabled和aggressiveLazyLoading作用
  8. 光纤模式图matlab模拟
  9. sklearn自带数据集load_digits(手写数字识别)的线性与对数模型实现,并比较二者性能
  10. 国产化存储的趋势和监控