原文地址1：https://www.face2ai.com/Math-Probability-5-2-the-Bernoulli-and-Binomial-Distributions转载请标明出处

Abstract: 本文介绍Bernoulli Distribution （伯努利分布）和Binomial Distribution（二项分布）
Keywords: Bernoulli Distributions，Binomial Distributions

伯努利和二项分布

吐血更，一天三篇，虽然上一篇只能算一段，但是确实应该加快总结的步伐了，给后面的新内容腾出足够的时间

一杯敬自由，一杯敬死亡

在本章的开始，我们从离散分布下手，看看每个分布有这什么样的特点，然后用我们的工具分析研究其内在的性质，当然要从最简单的开始，逐步构建出我们要研究的有代表性的这些分布，第一个被处理的就是伯努利分布（bernoulli Distribution）
随机变量 XXX 只有两个取值，0或者1，并且取1的概率固定是ppp 那么我们就说 XXX 有一个参数为 ppp 的伯努利分布。如果我们只知道试验输出对应的随机变量只有两个结果，非此即彼，那么这个随机变量的分布就是伯努利族中的一个随机变量。
如果随机变量 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 有相同的伯努利分布，他们的和就是其中为1的随机变量的个数，这个个数也是随机的，其对应的分布为二项分布。

伯努利分布 The Bernoulli Distributions

上来先来个例子：

临床试验，对于某种治疗，我们简单的把结果划分成两种，一种有效，一种无效，我们用随机变量来表示这两个结果，X=1X=1X=1 表示治疗有效 X=0X=0X=0 表示治疗无效，那么我们要做的是得到这个概率就是 Pr(X=1)=pPr(X=1)=pPr(X=1)=p 的值就是我们关心的结果。ppp 的取值范围在 [0,1][0,1][0,1] 对应于不同的 ppp 我们就有了伯努利分布族。

Definition Bernoulli Distribution.A random variable X has the Bernoulli distribution with parameter ppp ( 0≤p≤10\leq p\leq 10≤p≤1 )if X can take only the values 0 and 1 and the probabilities are
Pr(X=1)=pPr(X=1)=p Pr(X=1)=p
and
Pr(X=0)=1−pPr(X=0)=1-p Pr(X=0)=1−p

其概率函数可以被写成：
f(x∣p)={px(1−p)1−xfor x=0,10otherwisef(x|p)= \begin{cases} p^x(1-p)^{1-x}&\text{ for }x=0,1\\ 0&\text{otherwise} \end{cases} f(x∣p)={px(1−p)1−x0 for x=0,1otherwise
p.f.的表示方法可以看出伯努利分布是依赖于参数 ppp 的，所以 ppp 可以看成一个条件，那么我们后面所有类似的分布都可以将其p.f.或者p.d.f.写成这种形式。
c.d.f.（似乎我们学c.d.f的时候已经讲过了）可以被写成：
F(x∣p)={0for x<01−pfor 0<x<11for x≥1F(x|p)= \begin{cases} 0&\text{ for }x<0 \\ 1-p&\text{ for }0 < x < 1 \\ 1&\text{ for }x\geq 1 \end{cases} F(x∣p)=⎩⎪⎨⎪⎧01−p1 for x<0 for 0<x<1 for x≥1

期望 Expectation

当我们研究完其p.f.和c.d.f.以后就研究研究他的期望吧，也没啥可研究的了，随机变量 XXX 有参数为 ppp 的伯努利分布，那么其期望：
E(X)=p×1+0×(1−p)=pE(X)=p\times1 + 0\times(1-p)=p E(X)=p×1+0×(1−p)=p
然后我们研究一下随机变量 X2X^2X2 的概率分布
E(X2)=p×12+(1−p)×02=pE(X^2)=p\times1^2 + (1-p)\times0^2=p E(X2)=p×12+(1−p)×02=p

方差 Variance

期望完了当然是方差了，同样是随机变量 XXX 有参数为 ppp 的伯努利分布，那么其方差：
Var(X)=E[(X−E(X))2]=(1−p)2p+(−p)2(1−p)=p(1−p)(1−p+p)=p(1−p)Var(X)=E[(X-E(X))^2]=(1-p)^2p+(-p)^2(1-p)=p(1-p)(1-p+p)=p(1-p) Var(X)=E[(X−E(X))2]=(1−p)2p+(−p)2(1−p)=p(1−p)(1−p+p)=p(1−p)
或者通过更简单的公式：
Var(X)=E[X2]−E2[X]=p−p2=p(1−p)Var(X)=E[X^2]-E^2[X]=p-p^2=p(1-p) Var(X)=E[X2]−E2[X]=p−p2=p(1−p)
结果一致。

距生成函数 m.g.f.

我们说过除了p.d.f./p.f.和c.d.f.，m.g.f.也是非常重要的分布标书工具，所以伯努利分布自然也有m.g.f.
ψ(t)=E[etX]=p(et×1)+(1−p)(et×0)for −∞<t<∞\begin {aligned} \psi(t)=E[e^{tX}]=p(e^{t\times 1})+(1-p)(e^{t\times 0}) &\text{ for } -\infty<t<\infty \end {aligned} ψ(t)=E[etX]=p(et×1)+(1−p)(et×0) for −∞<t<∞
这个写起来应该没啥难度，注意好 XXX 就行，然后就是期望对应的概率值。

伯努利过程 Bernoulli Trials/Process

说到序列我就想起了数学分析，Tao的分析我们已经开始更新了，但是我想把概率基础部分先写完，然后一边研究数理统计一边写分析的博客，想到分析的原因是我看到了序列
如果一个序列不论是否有限，每一个元素都是独立同分布的（i.i.d.）的伯努利随机变量，那么我们就叫他们伯努利序列或者伯努利过程。

Definition Bernoulli Trails/Process.If the random variables in a finite or infinite sequence X1,X2,…X_1,X_2,\dotsX1,X2,… and i.i.d.,and if each random variable XiX_iXi has the Bernoulli distribution with parameter p,then it is said that X1,X2,…X_1,X_2,\dotsX1,X2,… are Bernoulli trials with parameter ppp .An infinite sequence of Bernoulli trials is also called a Bernoulli Process.

伯努利过程的例子最简单的就是连续丢同一枚硬币，组成的结果正反，就组成了伯努利过程。

二项分布 The Binomial Distributions

举个例子，这个例子和上面伯努利过程有关，连续生产一批零件，每个零件有一定的合格率，，所有零件组成的序列是一个伯努利过程，那么么我们想知道这些随机变量的和满足怎么样的分布。

Definition Binomial Distribution.A random variable XXX has the binomial distribution with parameters nnn and ppp if XXX has a discrete distribution for which the p.f. is as follow:
f(x∣n,p)={(nx)px(1−p)n−xfor x=0,1,…0otherwisef(x|n,p)= \begin{cases} \begin{pmatrix}n\\x\end{pmatrix} p^x(1-p)^{n-x }&\text{ for }x=0,1,\dots\\ 0&\text{otherwise} \end{cases} f(x∣n,p)=⎩⎨⎧(nx)px(1−p)n−x0 for x=0,1,…otherwise
in this distribution ,nnn must be a positive integer, and ppp must lie in the interval 0≤p≤10\leq p\leq 10≤p≤1

这个定义确实是以定义的语言风格来写的，直接明了的告诉你，什么东西，叫什么名字，来源出处并不是定义要阐述的，但是我们要从理论上分析为啥这就是二项分布了呢？二项分布首先是因为这个分布产生系数和二项式系数一致，而且中有两个项，而其来源是多个独立同分布的伯努利分布随机变量求和结果。

注意：二项分布是概率论和数理统计的重要基础！

Theorem If the random varibales X1,…,XnX_1,\dots,X_nX1,…,Xn from nnn Bernoulli trials with parameter ppp ,and if X=X1+⋯+XnX=X_1+\dots+X_nX=X1+⋯+Xn ,then XXX has the binomial distribution with parameters nnn and ppp

这个定理的证明用到的是前面计数方法以及乘法法则，加法法则，也就是 nnn 个样本中每一个都有 ppp 的概率是1，其余是0，总和是 xxx 的组合方法共有 (nx)\begin{pmatrix}n\\x\end{pmatrix}(nx) 种，所以把这些种概率 px(1−p)n−xp^x(1-p)^{n-x }px(1−p)n−x 相加就得到了结果，被定义为二项分布。

根据上面这条定理，我们可以很轻松的计算二项分布的数字特征了。终于知道学习那些数字特征的计算法则的用途了，下面将会非常简单。

期望 Expectation

随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布，那么其期望是：
E(X)=∑i=0nE(Xi)=npE(X)=\sum^{n}_{i=0}E(X_i)=np E(X)=i=0∑nE(Xi)=np
用到的法则：

独立的随机变量的和的期望，等于期望的和

方差 Variance

随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布，那么其方差是：
Var(X)=∑i=1n=np(1−p)Var(X)=\sum^{n}_{i=1}=np(1-p) Var(X)=i=1∑n=np(1−p)
用到的法则：

独立的随机变量的和的方差，等于方差的和

如果使用别的方法求方差会非常麻烦，比如定义或者 Var(X)=E[X2]−E2[X]Var(X)=E[X^2]-E^2[X]Var(X)=E[X2]−E2[X] 别问我怎么知道的。

距生成函数 m.g.f.

随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布，那么其距生成函数是：
ψ(t)=E(etX)=Πi=1nE(etXi)=(pet+1−p)n\psi(t)=E(e^{tX})=\Pi^{n}_{i=1}E(e^{tX_i})=(pe^t+1-p)^n ψ(t)=E(etX)=Πi=1nE(etXi)=(pet+1−p)n
用到的法则：

独立的随机变量的和的m.g.f.，等于m.g.f.的累积

二项分布随机变量相加

Theorem If X1,…,XnX_1,\dots,X_nX1,…,Xn are independent random varibales,and if XiX_iXi has the binomial distribution with parameters nin_ini and ppp ( i=1,…,ki=1,\dots,ki=1,…,k ) ,then the sum X1+⋯+XkX_1+\dots+X_kX1+⋯+Xk has the binomial distribution with parameters n=n1+⋯+nkn=n_1+\dots+n_kn=n1+⋯+nk and ppp .

当多个二项分布有不同的 nnn 但是有相同的 ppp 那么他们可以相加，nnn 是所有 nnn 的和， ppp 不变，这个可以根据将二项分布打散成伯努利分布然后再加起来可以看出来定理是正确的

那么什么时候可以使用上述定理呢？

所有随机变量相互独立
参数 ppp 必须相同

这两点有任何一点不成立，上面的定理都不成立。
书上接着给了个大长例子，讲的是血液检验，还有到了二分查找法，可以看看

总结

本文介绍伯努利分布和二项分布，分析了其对应数字特征，和m.g.f下一篇我们继续研究分布——超几何分布。
待续。。。

【概率论】5-2:伯努利和二项分布(The Bernoulli and Binomial Distributions)相关推荐

概率论笔记1.5伯努利模型(二项分布)
1.5伯努利模型(二项分布) 定义 n重独立实验序列:E1 E2-En 事件之间互相独立结果只有两种! n重伯努利实验:n次独立实验但是结果只有两种定理:A的概率是p,A逆:1-p,n重伯努利实验 ...
#概率论#n重伯努利实验
概率论：古典概型与伯努利概型
古典概型不要在意伯努利就是二项分布伯努利其实就是建模型出的题什么模型都没告诉你的叫你自己建立模型一般情况都是伯努利正态分布模型,指数分布模型题上都会直接告诉你的比如某随机变量服从正态分布什么话 ...
二项分布算法（伯努利实验）
二项分布问题描述: 二项分布就是重复n次独立的伯努利试验.在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保 ...
【概率论基础进阶】随机事件和概率-古典概型与伯努利概型
文章目录一.古典概型二.几何概型三.伯努利概型一.古典概型定义:当试验结果为有限nnn个样本点,且每个样本点的发生具有相等的可能性,如果事件AAA由nAn_{A}nA个样本点组成,则事件A ...
概率论大作业C语言验证伯努利大数定律以及相对应的强大数定律、棣莫弗-拉普拉斯中心极限定理
验证伯努利大数定律以及相对应的强大数定律.棣莫弗-拉普拉斯中心极限定理代码如下: //编程环境:Xcode //编程语言:C语言 #include <stdio.h> #include ...
三种常用的朴素贝叶斯实现算法——高斯朴素贝叶斯、伯努利朴素贝叶斯、多项式朴素贝叶斯
朴素贝叶斯在机器学习中,朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器. 朴素贝叶斯算法Naive Bayes定义中有两个关键定义:特征之间强假设独立和贝 ...
matlab模拟伯努利实验,matlab仿真随机数的发生
概率论和数理统计实验(matlab中实现) 一.伯努利漫衍 R=binornd(N,P); //N,P为二次漫衍的俩个参数,返回遵守参数为N,P的二项漫衍的随机数,且N,P,R的形式相同. R=bin ...
sklearn模块之朴素贝叶斯：（二）伯努利模型的实现
多元Bernoulli模型的朴素贝叶斯分类器适用于离散数据.与MultinomialNB不同之处为: MultinomialNB使用出现次数(频数) BernoulliNB设计用于二进制/布尔特征 ...

【概率论】5-2:伯努利和二项分布(The Bernoulli and Binomial Distributions)

伯努利和二项分布

伯努利分布 The Bernoulli Distributions

期望 Expectation

方差 Variance

距生成函数 m.g.f.

伯努利过程 Bernoulli Trials/Process

二项分布 The Binomial Distributions

期望 Expectation

方差 Variance

距生成函数 m.g.f.

二项分布随机变量相加

总结

【概率论】5-2:伯努利和二项分布(The Bernoulli and Binomial Distributions)相关推荐

最新文章

热门文章