Beta 分布的应用

从随机变量到顺序统计量

考虑如下的游戏：有一个魔盒（随机数生成器），上有一个按钮，每按一下按钮，就均匀地输出一个 U∼[0,1]U\sim[0,1]之间的随机数，现在按上下，得到10个随机数，第7大的数是多少？我更进一步发问，第7大的数，要求猜测不超过0.01才算对。

对上面的游戏作如下的数学抽象：

X1,X2,⋯,Xn∼iidU(0,1)X_1,X_2,\cdots,X_n \sim^{iid} U(0,1)
把这 nn 个随机变量排序后得到的顺序统计量X(1),X(2),…,X(n)X_{(1)},X_{(2)},\ldots,X_{(n)}
问 X(k)X_{(k)}的分布是什么？

对于上面的游戏而言 n=10,k=7n=10,k=7，如果我们能求出 X(7)X_{(7)}的分布的概率密度，那么用概率密度的极值点取做猜测是最好的策略。对于一般的情形，X(k)X_{(k)}的分布是什么呢？那么我们尝试计算 X(k)X_{(k)} 落在区间 [x,x+Δx][x,x+\Delta x] 的概率，也即求如下的概率值：

P(x≤X(k)≤x+Δx)=?

P(x\leq X_{(k)}\leq x+\Delta x)=?

把 [0,1][0,1]区间内分为三段 [0,x),[x,x+Δx],(x+Δx,1][0, x), [x,x+\Delta x],(x+\Delta x, 1]，我们首先考虑简单的情形（这不正是数学研究的基本方法论吗，从简单到复杂），假设 nn 个数中只有一个落在了区间 [x,x+Δx][x,x+\Delta x]内，则因为要求这个区间的数 X(k)X_{(k)}是第 kk大的，
- 则 [0,x)[0, x)中应该有 k−1k-1个数，
- (x+Δx](x+\Delta x]这个区间中应该有 n−kn-k个数。
不失一般性的，我们先考虑如下的一个符合上述要求的事件 EE：

E={X1∈[x,x+Δx],Xi∈[0,x)(i=2,⋯,k),Xj∈(x+Δx,1](j=k+1,⋯,n)}

\begin{split} E=\{ & X_1\in [x,x+\Delta x],\\ & X_i\in [0, x)\quad (i=2,\cdots,k),\\ & X_j\in (x+\Delta x,1] \quad (j=k+1,\cdots,n)\} \end{split}

则有：

P(E)==∏i=1nP(Xi)xk−1(1−x−Δx)n−kΔx

\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x \end{split}
对 (1−x−Δx)n−k(1-x-\Delta x)^{n-k}应用二项展开，也即：

(1−x−Δx)n−k==(n−k0)(1−x)n−k(−Δx)0+(n−k1)(1−x)n−k−1(−Δx)1+⋯+(n−kn−k)(1−x)0(−Δx)n−k(1−x)n−k+o(Δx)

\begin{split} (1-x-\Delta x)^{n-k}=&\binom{n-k}{0}(1-x)^{n-k}(-\Delta x)^0+\binom{n-k}{1}(1-x)^{n-k-1}(-\Delta x)^1+\cdots+\binom{n-k}{n-k}(1-x)^0(-\Delta x)^{n-k}\\ =&(1-x)^{n-k}+o(\Delta x) \end{split}
其中 o(Δx)o(\Delta x)表示 Δx\Delta x的高阶无穷小，所以，可对 P(E)P(E)，继续展开得：

P(E)====∏i=1nP(Xi)xk−1(1−x−Δx)n−kΔxxk−1[(1−x)n−k+o(Δx)]Δxxk−1(1−x)n−kΔx

\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x\\ =&x^{k-1}\left [(1-x)^{n-k}+o(\Delta x)\right ]\Delta x\\ =&x^{k-1}(1-x)^{n-k}\Delta x \end{split}
再来考虑这之中的组合数，也即 nn个数中有一个落在 [x,x+Δx][x,x+\Delta x] 区间得有 nn中取法，余下的 n−1n-1个数中有 k−1k-1个落在 [0,x)[0,x)的有 (n−1k−1)\binom{n-1}{k-1}中组合，故与事件 EE等价的事件一共有 n(n−1k−1)n\binom{n-1}{k-1}个。

继续考虑稍微复杂一点的情形，假设 nn 个数有两个数落在了区间 [x,x+Δx][x,x+\Delta x]，

E′={X1,X2∈[x,x+Δx],Xi∈[0,x)(i=3,4,…,k)Xj∈(x+Δx,1](j=k+1,…,n)}

\begin{split} E'=\{&X_1,X_2\in [x,x+\Delta x],\\ &X_i\in [0,x)\quad (i=3,4,\ldots,k) \\ & X_j\in (x+\Delta x,1]\quad (j=k+1,\ldots,n)\} \end{split}
则有：

P(E′)=xk−2(1−x−Δx)n−k(Δx)2=o(Δx)

P(E')=x^{k-2}(1-x-\Delta x)^{n-k}(\Delta x)^2=o(\Delta x)
从以上的分析我们很容易看出，只要落在 [x,x+Δx][x,x+\Delta x]内的数字超过一个，则对应的事件的概率就是 o(Δx)o(\Delta x)。于是：

P(x≤X(k)≤x+Δx)==n(n−1k−1)P(E)n(n−1k−1)xk−1(1−x)n−kΔx+o(Δx)

\begin{split} P(x\leq X_{(k)}\leq x+\Delta x)=&n\binom{n-1}{k-1}P(E)\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\Delta x+o(\Delta x) \end{split}
所以可以得到 X(k)X_{(k)}的概率密度为：

P(X(k))===limΔx→0P(x≤X(k)≤x+Δx)Δxn(n−1k−1)xk−1(1−x)n−kn!(k−1)!(n−k)!xk−1(1−x)n−kx∈[0,1]

\begin{split} P(X_{(k)})=&\lim_{\Delta x\to 0}\frac{P(x\leq X_{(k)}\leq x+\Delta x)}{\Delta x}\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\\ =&\frac{n!}{(k-1)!(n-k)!}x^{k-1}(1-x)^{n-k}\quad x\in [0,1] \end{split}
利用Gamma函数，我们可以把 f(x)f(x)表达为：

f(x)=Γ(n+1)Γ(k)Γ(n−k+1)xk−1(1−x)n−k

f(x)=\frac{\Gamma(n+1)}{\Gamma(k)\Gamma(n-k+1)}x^{k-1}(1-x)^{n-k}

还记得神奇的Gamma函数可以把许多数学概念从整数集合延拓到实数集合。
我们记 α=k,β=n−k+1\alpha=k,\beta=n-k+1，于是我们得到：

P(X(k))=Γ(α+β)Γ(α)Γ(β)xα−1(1−x)β−1

P(X_{(k)})=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}
这就是一般意义上的Beta分布。
好，我们回到开始的游戏， n=10,k=7n=10,k=7，我们按照如下的密度分布的峰值取猜测是最有把握的：

f(x)=10!6!3!x6(1−x)3x∈[0,1]

f(x)=\frac{10!}{6!3!}x^6(1-x)^3\quad x\in[0,1]

Beta 分布的应用相关推荐

关于Beta分布、二项分布与Dirichlet分布、多项分布的关系
from:http://blog.csdn.net/u010140338/article/details/41344853 From : http://www.cnblogs.com/wybang/p ...
【LDA学习系列】Beta分布Python代码
代码: # -*- coding: utf-8 -*- ''' Created on 2018年5月15日 @author: user @attention: beta distribution '' ...
机器学习知识点(二十八)Beta分布和Dirichlet分布理解
1.二者关系: Dirichlet分布是Beta分布的多元推广.Beta分布是二项式分布的共轭分布,Dirichlet分布是多项式分布的共轭分布. 通常情况下,我们说的分布都是关于某个参数的函数,把对 ...
图像添加Beta分布噪声
Beta分布函数: clc,clear,close all warning off feature jit off im = imread('coloredChips.png'); Z1 = imno ...
贝叶斯统计：Inverted Beta与Three Parameter Beta分布
贝叶斯统计:Inverted Beta与Three Parameter Beta分布 Beta分布 Inverted Beta与Three Parameter Beta TPB-Normal Mixt ...
二项分布和Beta分布
http://hyry.dip.jp/tech/slice/slice.html/42 本文通过实例介绍二项分布和Beta分布的含义,并使用pymc对抛硬币进行模拟实验,从而获得Beta分布. 二项分 ...
如何通俗理解beta分布？
作者:小杰链接:https://www.zhihu.com/question/30269898/answer/123261564 来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...
python 概率分布_python实现beta分布概率密度函数的方法
如下所示: beta分布的最大特点是其多样性, 从下图可以看出, beta分布具有各种形态, 有U形, 类似正态分布的形状, 类似uniform分布的形状等, 正式这一特质使beta分布在共轭先验的计 ...
二项分布，多项分布，以及与之对应的beta分布和狄利克雷分布
1. 二项分布与beta分布对应 2. 多项分布与狄利克雷分布对应 3. 二项分布是什么?n次bernuli试验服从二项分布二项分布是N次重复bernuli试验结果的分布. bernuli实验是什 ...
java 采样_Java编程实现beta分布的采样或抽样实例代码
本文研究的主要是Java编程实现beta分布的采样或抽样,具体如下. 本文将使用math3提供的工具包,对beta分布进行采样.如下程序是对alpha=81,beta=219的beta分布函数,进行抽 ...

Beta 分布的应用

从随机变量到顺序统计量

Beta 分布的应用相关推荐

最新文章

热门文章