Beta 分布的应用
从随机变量到顺序统计量
考虑如下的游戏:有一个魔盒(随机数生成器),上有一个按钮,每按一下按钮,就均匀地输出一个 U∼[0,1]U\sim[0,1]之间的随机数,现在按上下,得到10个随机数,第7大的数是多少?我更进一步发问,第7大的数,要求猜测不超过0.01才算对。
对上面的游戏作如下的数学抽象:
- X1,X2,⋯,Xn∼iidU(0,1)X_1,X_2,\cdots,X_n \sim^{iid} U(0,1)
- 把这 nn 个随机变量排序后得到的顺序统计量X(1),X(2),…,X(n)X_{(1)},X_{(2)},\ldots,X_{(n)}
- 问 X(k)X_{(k)}的分布是什么?
对于上面的游戏而言 n=10,k=7n=10,k=7,如果我们能求出 X(7)X_{(7)}的分布的概率密度,那么用概率密度的极值点取做猜测是最好的策略。对于一般的情形,X(k)X_{(k)}的分布是什么呢?那么我们尝试计算 X(k)X_{(k)} 落在区间 [x,x+Δx][x,x+\Delta x] 的概率,也即求如下的概率值:
P(x\leq X_{(k)}\leq x+\Delta x)=?
把 [0,1][0,1]区间内分为三段 [0,x),[x,x+Δx],(x+Δx,1][0, x), [x,x+\Delta x],(x+\Delta x, 1],我们首先考虑简单的情形(这不正是数学研究的基本方法论吗,从简单到复杂),假设 nn 个数中只有一个落在了区间 [x,x+Δx][x,x+\Delta x]内,则因为要求这个区间的数 X(k)X_{(k)}是第 kk大的,
- 则 [0,x)[0, x)中应该有 k−1k-1个数,
- (x+Δx](x+\Delta x]这个区间中应该有 n−kn-k个数。
不失一般性的,我们先考虑如下的一个符合上述要求的事件 EE:
\begin{split} E=\{ & X_1\in [x,x+\Delta x],\\ & X_i\in [0, x)\quad (i=2,\cdots,k),\\ & X_j\in (x+\Delta x,1] \quad (j=k+1,\cdots,n)\} \end{split}
则有:
\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x \end{split}
对 (1−x−Δx)n−k(1-x-\Delta x)^{n-k}应用二项展开,也即:
\begin{split} (1-x-\Delta x)^{n-k}=&\binom{n-k}{0}(1-x)^{n-k}(-\Delta x)^0+\binom{n-k}{1}(1-x)^{n-k-1}(-\Delta x)^1+\cdots+\binom{n-k}{n-k}(1-x)^0(-\Delta x)^{n-k}\\ =&(1-x)^{n-k}+o(\Delta x) \end{split}
其中 o(Δx)o(\Delta x)表示 Δx\Delta x的高阶无穷小,所以,可对 P(E)P(E),继续展开得:
\begin{split} P(E)=&\prod_{i=1}^nP(X_i)\\ =&x^{k-1}(1-x-\Delta x)^{n-k}\Delta x\\ =&x^{k-1}\left [(1-x)^{n-k}+o(\Delta x)\right ]\Delta x\\ =&x^{k-1}(1-x)^{n-k}\Delta x \end{split}
再来考虑这之中的组合数,也即 nn个数中有一个落在 [x,x+Δx][x,x+\Delta x] 区间得有 nn中取法,余下的 n−1n-1个数中有 k−1k-1个落在 [0,x)[0,x)的有 (n−1k−1)\binom{n-1}{k-1}中组合,故与事件 EE等价的事件一共有 n(n−1k−1)n\binom{n-1}{k-1}个。
继续考虑稍微复杂一点的情形,假设 nn 个数有两个数落在了区间 [x,x+Δx][x,x+\Delta x],
\begin{split} E'=\{&X_1,X_2\in [x,x+\Delta x],\\ &X_i\in [0,x)\quad (i=3,4,\ldots,k) \\ & X_j\in (x+\Delta x,1]\quad (j=k+1,\ldots,n)\} \end{split}
则有:
P(E')=x^{k-2}(1-x-\Delta x)^{n-k}(\Delta x)^2=o(\Delta x)
从以上的分析我们很容易看出,只要落在 [x,x+Δx][x,x+\Delta x]内的数字超过一个,则对应的事件的概率就是 o(Δx)o(\Delta x)。于是:
\begin{split} P(x\leq X_{(k)}\leq x+\Delta x)=&n\binom{n-1}{k-1}P(E)\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\Delta x+o(\Delta x) \end{split}
所以可以得到 X(k)X_{(k)}的概率密度为:
\begin{split} P(X_{(k)})=&\lim_{\Delta x\to 0}\frac{P(x\leq X_{(k)}\leq x+\Delta x)}{\Delta x}\\ =&n\binom{n-1}{k-1}x^{k-1}(1-x)^{n-k}\\ =&\frac{n!}{(k-1)!(n-k)!}x^{k-1}(1-x)^{n-k}\quad x\in [0,1] \end{split}
利用Gamma函数,我们可以把 f(x)f(x)表达为:
f(x)=\frac{\Gamma(n+1)}{\Gamma(k)\Gamma(n-k+1)}x^{k-1}(1-x)^{n-k}
还记得神奇的Gamma函数可以把许多数学概念从整数集合延拓到实数集合。
我们记 α=k,β=n−k+1\alpha=k,\beta=n-k+1,于是我们得到:
P(X_{(k)})=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}
这就是一般意义上的Beta分布。
好,我们回到开始的游戏, n=10,k=7n=10,k=7,我们按照如下的密度分布的峰值取猜测是最有把握的:
f(x)=\frac{10!}{6!3!}x^6(1-x)^3\quad x\in[0,1]
Beta 分布的应用相关推荐
- 关于Beta分布、二项分布与Dirichlet分布、多项分布的关系
from:http://blog.csdn.net/u010140338/article/details/41344853 From : http://www.cnblogs.com/wybang/p ...
- 【LDA学习系列】Beta分布Python代码
代码: # -*- coding: utf-8 -*- ''' Created on 2018年5月15日 @author: user @attention: beta distribution '' ...
- 机器学习知识点(二十八)Beta分布和Dirichlet分布理解
1.二者关系: Dirichlet分布是Beta分布的多元推广.Beta分布是二项式分布的共轭分布,Dirichlet分布是多项式分布的共轭分布. 通常情况下,我们说的分布都是关于某个参数的函数,把对 ...
- 图像添加Beta分布噪声
Beta分布函数: clc,clear,close all warning off feature jit off im = imread('coloredChips.png'); Z1 = imno ...
- 贝叶斯统计:Inverted Beta与Three Parameter Beta分布
贝叶斯统计:Inverted Beta与Three Parameter Beta分布 Beta分布 Inverted Beta与Three Parameter Beta TPB-Normal Mixt ...
- 二项分布和Beta分布
http://hyry.dip.jp/tech/slice/slice.html/42 本文通过实例介绍二项分布和Beta分布的含义,并使用pymc对抛硬币进行模拟实验,从而获得Beta分布. 二项分 ...
- 如何通俗理解beta分布?
作者:小杰 链接:https://www.zhihu.com/question/30269898/answer/123261564 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载 ...
- python 概率分布_python实现beta分布概率密度函数的方法
如下所示: beta分布的最大特点是其多样性, 从下图可以看出, beta分布具有各种形态, 有U形, 类似正态分布的形状, 类似uniform分布的形状等, 正式这一特质使beta分布在共轭先验的计 ...
- 二项分布 , 多项分布, 以及与之对应的beta分布和狄利克雷分布
1. 二项分布与beta分布对应 2. 多项分布与狄利克雷分布对应 3. 二项分布是什么?n次bernuli试验服从 二项分布 二项分布是N次重复bernuli试验结果的分布. bernuli实验是什 ...
- java 采样_Java编程实现beta分布的采样或抽样实例代码
本文研究的主要是Java编程实现beta分布的采样或抽样,具体如下. 本文将使用math3提供的工具包,对beta分布进行采样.如下程序是对alpha=81,beta=219的beta分布函数,进行抽 ...
最新文章
- 这些行业,将率先落地AI芯片 | 星前沿
- 死磕Java并发:J.U.C之读写锁:ReentrantReadWriteLock
- php 组合模式,php设计模式(十三)透明组合模式
- Ubuntu下The program 'python' can be found in the following packages:
- 为XHR对象所有方法和属性提供钩子 全局拦截AJAX
- 有车的朋友注意了!全语音识别,车载微信终于来了!
- 项目中libevent几个问题
- java svn 创建分支_Eclipse下svn的创建分支/合并/切换使用
- PS 模糊图片背景(滤镜)
- nodejs爬虫抓取搜狗微信文章详解
- 许知远:嗨!Julia
- JDK11下J2Cache序列化器反射异常及--illegal-access解决方案
- 王者nba服务器维护,《王者NBA》合服公告
- PHP公众号群发用户过多,公众号四次群发用完怎么办?
- android sqlite加密数据库,Android Sqlite数据库加密
- 【排序】八种常用排序
- Qt Windows DPI适配
- 【深度学习】利用深度学习监控女朋友的微信聊天?
- Be fearful when others are greedy and greedy when others are fearful.
- 蚂蚁市场教程 电视上怎么安装看快手TV版
热门文章
- Object类的使用,包装类的使用
- easyui onclickrow 中获取列名_获取Chrome浏览器历史浏览记录实例
- 编写程序,生成一个包含20个随机整数的列表,然后对其中偶数下标的元素进行降序排列,基数下标的元素不变
- 剑指offer面试题14- I. 剪绳子(数学推导)
- 剑指offer面试题12. 矩阵中的路径(矩阵搜索)(深度优先搜索)(剪枝)
- MySQL的主动优化和被动优化_MySQL“被动”性能优化汇总
- 至少清楚知道兼容IE8 ie9 ;持续更新
- nettry 入站事件如何传递到下一个handler
- 基于JavaScript技术完成单击事件完成显示和隐藏
- 一篇真正教会你开发移动端页面的文章