从随机变量到顺序统计量

考虑如下的游戏:有一个魔盒(随机数生成器),上有一个按钮,每按一下按钮,就均匀地输出一个 U∼[0,1]U\sim[0,1]之间的随机数,现在按上下,得到10个随机数,第7大的数是多少?我更进一步发问,第7大的数,要求猜测不超过0.01才算对。

对上面的游戏作如下的数学抽象:

  1. X1,X2,⋯,Xn∼iidU(0,1)X_1,X_2,\cdots,X_n \sim^{iid} U(0,1)
  2. 把这 nn 个随机变量排序后得到的顺序统计量X(1),X(2),…,X(n)X_{(1)},X_{(2)},\ldots,X_{(n)}
  3. 问 X(k)X_{(k)}的分布是什么?

对于上面的游戏而言 n=10,k=7n=10,k=7,如果我们能求出 X(7)X_{(7)}的分布的概率密度,那么用概率密度的极值点取做猜测是最好的策略。对于一般的情形,X(k)X_{(k)}的分布是什么呢?那么我们尝试计算 X(k)X_{(k)} 落在区间 [x,x+Δx][x,x+\Delta x] 的概率,也即求如下的概率值:

P(x≤X(k)≤x+Δx)=?

P(x\leq X_{(k)}\leq x+\Delta x)=?

把 [0,1][0,1]区间内分为三段 [0,x),[x,x+Δx],(x+Δx,1][0, x), [x,x+\Delta x],(x+\Delta x, 1],我们首先考虑简单的情形(这不正是数学研究的基本方法论吗,从简单到复杂),假设 nn 个数中只有一个落在了区间 [x,x+Δx][x,x+\Delta x]内,则因为要求这个区间的数 X(k)X_{(k)}是第 kk大的,
- 则 [0,x)[0, x)中应该有 k−1k-1个数,
- (x+Δx](x+\Delta x]这个区间中应该有 n−kn-k个数。
不失一般性的,我们先考虑如下的一个符合上述要求的事件 EE:

E={X1∈[x,x+Δx],Xi∈[0,x)(i=2,⋯,k),Xj∈(x+Δx,1](j=k+1,⋯,n)}

\begin{split} E=\{ & X_1\in [x,x+\Delta x],\\ & X_i\in [0, x)\quad (i=2,\cdots,k),\\ & X_j\in (x+\Delta x,1] \quad (j=k+1,\cdots,n)\} \end{split}

则有:

P(E)==∏i=1nP(Xi)xk−1(1−x−Δx)n−kΔx

\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x \end{split}
对 (1−x−Δx)n−k(1-x-\Delta x)^{n-k}应用二项展开,也即:

(1−x−Δx)n−k==(n−k0)(1−x)n−k(−Δx)0+(n−k1)(1−x)n−k−1(−Δx)1+⋯+(n−kn−k)(1−x)0(−Δx)n−k(1−x)n−k+o(Δx)

\begin{split} (1-x-\Delta x)^{n-k}=&\binom{n-k}{0}(1-x)^{n-k}(-\Delta x)^0+\binom{n-k}{1}(1-x)^{n-k-1}(-\Delta x)^1+\cdots+\binom{n-k}{n-k}(1-x)^0(-\Delta x)^{n-k}\\ =&(1-x)^{n-k}+o(\Delta x) \end{split}
其中 o(Δx)o(\Delta x)表示 Δx\Delta x的高阶无穷小,所以,可对 P(E)P(E),继续展开得:

P(E)====∏i=1nP(Xi)xk−1(1−x−Δx)n−kΔxxk−1[(1−x)n−k+o(Δx)]Δxxk−1(1−x)n−kΔx

\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x\\ =&x^{k-1}\left [(1-x)^{n-k}+o(\Delta x)\right ]\Delta x\\ =&x^{k-1}(1-x)^{n-k}\Delta x \end{split}
再来考虑这之中的组合数,也即 nn个数中有一个落在 [x,x+Δx][x,x+\Delta x] 区间得有 nn中取法,余下的 n−1n-1个数中有 k−1k-1个落在 [0,x)[0,x)的有 (n−1k−1)\binom{n-1}{k-1}中组合,故与事件 EE等价的事件一共有 n(n−1k−1)n\binom{n-1}{k-1}个。

继续考虑稍微复杂一点的情形,假设 nn 个数有两个数落在了区间 [x,x+Δx][x,x+\Delta x],

E′={X1,X2∈[x,x+Δx],Xi∈[0,x)(i=3,4,…,k)Xj∈(x+Δx,1](j=k+1,…,n)}

\begin{split} E'=\{&X_1,X_2\in [x,x+\Delta x],\\ &X_i\in [0,x)\quad (i=3,4,\ldots,k) \\ & X_j\in (x+\Delta x,1]\quad (j=k+1,\ldots,n)\} \end{split}
则有:

P(E′)=xk−2(1−x−Δx)n−k(Δx)2=o(Δx)

P(E')=x^{k-2}(1-x-\Delta x)^{n-k}(\Delta x)^2=o(\Delta x)
从以上的分析我们很容易看出,只要落在 [x,x+Δx][x,x+\Delta x]内的数字超过一个,则对应的事件的概率就是 o(Δx)o(\Delta x)。于是:

P(x≤X(k)≤x+Δx)==n(n−1k−1)P(E)n(n−1k−1)xk−1(1−x)n−kΔx+o(Δx)

\begin{split} P(x\leq X_{(k)}\leq x+\Delta x)=&n\binom{n-1}{k-1}P(E)\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\Delta x+o(\Delta x) \end{split}
所以可以得到 X(k)X_{(k)}的概率密度为:

P(X(k))===limΔx→0P(x≤X(k)≤x+Δx)Δxn(n−1k−1)xk−1(1−x)n−kn!(k−1)!(n−k)!xk−1(1−x)n−kx∈[0,1]

\begin{split} P(X_{(k)})=&\lim_{\Delta x\to 0}\frac{P(x\leq X_{(k)}\leq x+\Delta x)}{\Delta x}\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\\ =&\frac{n!}{(k-1)!(n-k)!}x^{k-1}(1-x)^{n-k}\quad x\in [0,1] \end{split}
利用Gamma函数,我们可以把 f(x)f(x)表达为:

f(x)=Γ(n+1)Γ(k)Γ(n−k+1)xk−1(1−x)n−k

f(x)=\frac{\Gamma(n+1)}{\Gamma(k)\Gamma(n-k+1)}x^{k-1}(1-x)^{n-k}

还记得神奇的Gamma函数可以把许多数学概念从整数集合延拓到实数集合
我们记 α=k,β=n−k+1\alpha=k,\beta=n-k+1,于是我们得到:

P(X(k))=Γ(α+β)Γ(α)Γ(β)xα−1(1−x)β−1

P(X_{(k)})=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}
这就是一般意义上的Beta分布。
好,我们回到开始的游戏, n=10,k=7n=10,k=7,我们按照如下的密度分布的峰值取猜测是最有把握的:

f(x)=10!6!3!x6(1−x)3x∈[0,1]

f(x)=\frac{10!}{6!3!}x^6(1-x)^3\quad x\in[0,1]

Beta 分布的应用相关推荐

  1. 关于Beta分布、二项分布与Dirichlet分布、多项分布的关系

    from:http://blog.csdn.net/u010140338/article/details/41344853 From : http://www.cnblogs.com/wybang/p ...

  2. 【LDA学习系列】Beta分布Python代码

    代码: # -*- coding: utf-8 -*- ''' Created on 2018年5月15日 @author: user @attention: beta distribution '' ...

  3. 机器学习知识点(二十八)Beta分布和Dirichlet分布理解

    1.二者关系: Dirichlet分布是Beta分布的多元推广.Beta分布是二项式分布的共轭分布,Dirichlet分布是多项式分布的共轭分布. 通常情况下,我们说的分布都是关于某个参数的函数,把对 ...

  4. 图像添加Beta分布噪声

    Beta分布函数: clc,clear,close all warning off feature jit off im = imread('coloredChips.png'); Z1 = imno ...

  5. 贝叶斯统计:Inverted Beta与Three Parameter Beta分布

    贝叶斯统计:Inverted Beta与Three Parameter Beta分布 Beta分布 Inverted Beta与Three Parameter Beta TPB-Normal Mixt ...

  6. 二项分布和Beta分布

    http://hyry.dip.jp/tech/slice/slice.html/42 本文通过实例介绍二项分布和Beta分布的含义,并使用pymc对抛硬币进行模拟实验,从而获得Beta分布. 二项分 ...

  7. 如何通俗理解beta分布?

    作者:小杰 链接:https://www.zhihu.com/question/30269898/answer/123261564 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...

  8. python 概率分布_python实现beta分布概率密度函数的方法

    如下所示: beta分布的最大特点是其多样性, 从下图可以看出, beta分布具有各种形态, 有U形, 类似正态分布的形状, 类似uniform分布的形状等, 正式这一特质使beta分布在共轭先验的计 ...

  9. 二项分布 , 多项分布, 以及与之对应的beta分布和狄利克雷分布

    1. 二项分布与beta分布对应 2. 多项分布与狄利克雷分布对应 3. 二项分布是什么?n次bernuli试验服从 二项分布 二项分布是N次重复bernuli试验结果的分布. bernuli实验是什 ...

  10. java 采样_Java编程实现beta分布的采样或抽样实例代码

    本文研究的主要是Java编程实现beta分布的采样或抽样,具体如下. 本文将使用math3提供的工具包,对beta分布进行采样.如下程序是对alpha=81,beta=219的beta分布函数,进行抽 ...

最新文章

  1. 这些行业,将率先落地AI芯片 | 星前沿
  2. 死磕Java并发:J.U.C之读写锁:ReentrantReadWriteLock
  3. php 组合模式,php设计模式(十三)透明组合模式
  4. Ubuntu下The program 'python' can be found in the following packages:
  5. 为XHR对象所有方法和属性提供钩子 全局拦截AJAX
  6. 有车的朋友注意了!全语音识别,车载微信终于来了!
  7. 项目中libevent几个问题
  8. java svn 创建分支_Eclipse下svn的创建分支/合并/切换使用
  9. PS 模糊图片背景(滤镜)
  10. nodejs爬虫抓取搜狗微信文章详解
  11. 许知远:嗨!Julia
  12. JDK11下J2Cache序列化器反射异常及--illegal-access解决方案
  13. 王者nba服务器维护,《王者NBA》合服公告
  14. PHP公众号群发用户过多,公众号四次群发用完怎么办?
  15. android sqlite加密数据库,Android Sqlite数据库加密
  16. 【排序】八种常用排序
  17. Qt Windows DPI适配
  18. 【深度学习】利用深度学习监控女朋友的微信聊天?
  19. Be fearful when others are greedy and greedy when others are fearful.
  20. 蚂蚁市场教程 电视上怎么安装看快手TV版

热门文章

  1. Object类的使用,包装类的使用
  2. easyui onclickrow 中获取列名_获取Chrome浏览器历史浏览记录实例
  3. 编写程序,生成一个包含20个随机整数的列表,然后对其中偶数下标的元素进行降序排列,基数下标的元素不变
  4. 剑指offer面试题14- I. 剪绳子(数学推导)
  5. 剑指offer面试题12. 矩阵中的路径(矩阵搜索)(深度优先搜索)(剪枝)
  6. MySQL的主动优化和被动优化_MySQL“被动”性能优化汇总
  7. 至少清楚知道兼容IE8 ie9 ;持续更新
  8. nettry 入站事件如何传递到下一个handler
  9. 基于JavaScript技术完成单击事件完成显示和隐藏
  10. 一篇真正教会你开发移动端页面的文章