【概率论】5-2:伯努利和二项分布(The Bernoulli and Binomial Distributions)
原文地址1:https://www.face2ai.com/Math-Probability-5-2-the-Bernoulli-and-Binomial-Distributions转载请标明出处
Abstract: 本文介绍Bernoulli Distribution (伯努利分布)和Binomial Distribution(二项分布)
Keywords: Bernoulli Distributions,Binomial Distributions
伯努利和二项分布
吐血更,一天三篇,虽然上一篇只能算一段,但是确实应该加快总结的步伐了,给后面的新内容腾出足够的时间
一杯敬自由,一杯敬死亡
在本章的开始,我们从离散分布下手,看看每个分布有这什么样的特点,然后用我们的工具分析研究其内在的性质,当然要从最简单的开始,逐步构建出我们要研究的有代表性的这些分布,第一个被处理的就是伯努利分布(bernoulli Distribution)
随机变量 XXX 只有两个取值,0或者1,并且取1的概率固定是ppp 那么我们就说 XXX 有一个参数为 ppp 的伯努利分布。如果我们只知道试验输出对应的随机变量只有两个结果,非此即彼,那么这个随机变量的分布就是伯努利族中的一个随机变量。
如果随机变量 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 有相同的伯努利分布,他们的和就是其中为1的随机变量的个数,这个个数也是随机的,其对应的分布为二项分布。
伯努利分布 The Bernoulli Distributions
上来先来个例子:
临床试验,对于某种治疗,我们简单的把结果划分成两种,一种有效,一种无效,我们用随机变量来表示这两个结果,X=1X=1X=1 表示治疗有效 X=0X=0X=0 表示治疗无效,那么我们要做的是得到这个概率就是 Pr(X=1)=pPr(X=1)=pPr(X=1)=p 的值就是我们关心的结果。ppp 的取值范围在 [0,1][0,1][0,1] 对应于不同的 ppp 我们就有了伯努利分布族。
Definition Bernoulli Distribution.A random variable X has the Bernoulli distribution with parameter ppp ( 0≤p≤10\leq p\leq 10≤p≤1 )if X can take only the values 0 and 1 and the probabilities are
Pr(X=1)=pPr(X=1)=p Pr(X=1)=p
and
Pr(X=0)=1−pPr(X=0)=1-p Pr(X=0)=1−p
其概率函数可以被写成:
f(x∣p)={px(1−p)1−xfor x=0,10otherwisef(x|p)= \begin{cases} p^x(1-p)^{1-x}&\text{ for }x=0,1\\ 0&\text{otherwise} \end{cases} f(x∣p)={px(1−p)1−x0 for x=0,1otherwise
p.f.的表示方法可以看出伯努利分布是依赖于参数 ppp 的,所以 ppp 可以看成一个条件,那么我们后面所有类似的分布都可以将其p.f.或者p.d.f.写成这种形式。
c.d.f.(似乎我们学c.d.f的时候已经讲过了)可以被写成:
F(x∣p)={0for x<01−pfor 0<x<11for x≥1F(x|p)= \begin{cases} 0&\text{ for }x<0 \\ 1-p&\text{ for }0 < x < 1 \\ 1&\text{ for }x\geq 1 \end{cases} F(x∣p)=⎩⎪⎨⎪⎧01−p1 for x<0 for 0<x<1 for x≥1
期望 Expectation
当我们研究完其p.f.和c.d.f.以后就研究研究他的期望吧,也没啥可研究的了,随机变量 XXX 有参数为 ppp 的伯努利分布,那么其期望:
E(X)=p×1+0×(1−p)=pE(X)=p\times1 + 0\times(1-p)=p E(X)=p×1+0×(1−p)=p
然后我们研究一下随机变量 X2X^2X2 的概率分布
E(X2)=p×12+(1−p)×02=pE(X^2)=p\times1^2 + (1-p)\times0^2=p E(X2)=p×12+(1−p)×02=p
方差 Variance
期望完了当然是方差了,同样是随机变量 XXX 有参数为 ppp 的伯努利分布,那么其方差:
Var(X)=E[(X−E(X))2]=(1−p)2p+(−p)2(1−p)=p(1−p)(1−p+p)=p(1−p)Var(X)=E[(X-E(X))^2]=(1-p)^2p+(-p)^2(1-p)=p(1-p)(1-p+p)=p(1-p) Var(X)=E[(X−E(X))2]=(1−p)2p+(−p)2(1−p)=p(1−p)(1−p+p)=p(1−p)
或者通过更简单的公式:
Var(X)=E[X2]−E2[X]=p−p2=p(1−p)Var(X)=E[X^2]-E^2[X]=p-p^2=p(1-p) Var(X)=E[X2]−E2[X]=p−p2=p(1−p)
结果一致。
距生成函数 m.g.f.
我们说过除了p.d.f./p.f.和c.d.f.,m.g.f.也是非常重要的分布标书工具,所以伯努利分布自然也有m.g.f.
ψ(t)=E[etX]=p(et×1)+(1−p)(et×0)for −∞<t<∞\begin {aligned} \psi(t)=E[e^{tX}]=p(e^{t\times 1})+(1-p)(e^{t\times 0}) &\text{ for } -\infty<t<\infty \end {aligned} ψ(t)=E[etX]=p(et×1)+(1−p)(et×0) for −∞<t<∞
这个写起来应该没啥难度,注意好 XXX 就行,然后就是期望对应的概率值。
伯努利过程 Bernoulli Trials/Process
说到序列我就想起了数学分析,Tao的分析我们已经开始更新了,但是我想把概率基础部分先写完,然后一边研究数理统计一边写分析的博客,想到分析的原因是我看到了序列
如果一个序列不论是否有限,每一个元素都是独立同分布的(i.i.d.)的伯努利随机变量,那么我们就叫他们伯努利序列或者伯努利过程。
Definition Bernoulli Trails/Process.If the random variables in a finite or infinite sequence X1,X2,…X_1,X_2,\dotsX1,X2,… and i.i.d.,and if each random variable XiX_iXi has the Bernoulli distribution with parameter p,then it is said that X1,X2,…X_1,X_2,\dotsX1,X2,… are Bernoulli trials with parameter ppp .An infinite sequence of Bernoulli trials is also called a Bernoulli Process.
伯努利过程的例子最简单的就是连续丢同一枚硬币,组成的结果正反,就组成了伯努利过程。
二项分布 The Binomial Distributions
举个例子,这个例子和上面伯努利过程有关,连续生产一批零件,每个零件有一定的合格率,,所有零件组成的序列是一个伯努利过程,那么么我们想知道这些随机变量的和满足怎么样的分布。
Definition Binomial Distribution.A random variable XXX has the binomial distribution with parameters nnn and ppp if XXX has a discrete distribution for which the p.f. is as follow:
f(x∣n,p)={(nx)px(1−p)n−xfor x=0,1,…0otherwisef(x|n,p)= \begin{cases} \begin{pmatrix}n\\x\end{pmatrix} p^x(1-p)^{n-x }&\text{ for }x=0,1,\dots\\ 0&\text{otherwise} \end{cases} f(x∣n,p)=⎩⎨⎧(nx)px(1−p)n−x0 for x=0,1,…otherwise
in this distribution ,nnn must be a positive integer, and ppp must lie in the interval 0≤p≤10\leq p\leq 10≤p≤1
这个定义确实是以定义的语言风格来写的,直接明了的告诉你,什么东西,叫什么名字,来源出处并不是定义要阐述的,但是我们要从理论上分析为啥这就是二项分布了呢?二项分布首先是因为这个分布产生系数和二项式系数一致,而且中有两个项,而其来源是多个独立同分布的伯努利分布随机变量求和结果。
注意:二项分布是概率论和数理统计的重要基础!
Theorem If the random varibales X1,…,XnX_1,\dots,X_nX1,…,Xn from nnn Bernoulli trials with parameter ppp ,and if X=X1+⋯+XnX=X_1+\dots+X_nX=X1+⋯+Xn ,then XXX has the binomial distribution with parameters nnn and ppp
这个定理的证明用到的是前面计数方法以及乘法法则,加法法则,也就是 nnn 个样本中每一个都有 ppp 的概率是1,其余是0,总和是 xxx 的组合方法共有 (nx)\begin{pmatrix}n\\x\end{pmatrix}(nx) 种,所以把这些种概率 px(1−p)n−xp^x(1-p)^{n-x }px(1−p)n−x 相加就得到了结果,被定义为二项分布。
根据上面这条定理,我们可以很轻松的计算二项分布的数字特征了。终于知道学习那些数字特征的计算法则的用途了,下面将会非常简单。
期望 Expectation
随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布,那么其期望是:
E(X)=∑i=0nE(Xi)=npE(X)=\sum^{n}_{i=0}E(X_i)=np E(X)=i=0∑nE(Xi)=np
用到的法则:
- 独立的随机变量的和的期望,等于期望的和
方差 Variance
随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布,那么其方差是:
Var(X)=∑i=1n=np(1−p)Var(X)=\sum^{n}_{i=1}=np(1-p) Var(X)=i=1∑n=np(1−p)
用到的法则:
- 独立的随机变量的和的方差,等于方差的和
如果使用别的方法求方差会非常麻烦,比如定义或者 Var(X)=E[X2]−E2[X]Var(X)=E[X^2]-E^2[X]Var(X)=E[X2]−E2[X] 别问我怎么知道的。
距生成函数 m.g.f.
随机变量 XXX 是一个参数为 nnn 和 ppp 的二项分布,那么其距生成函数是:
ψ(t)=E(etX)=Πi=1nE(etXi)=(pet+1−p)n\psi(t)=E(e^{tX})=\Pi^{n}_{i=1}E(e^{tX_i})=(pe^t+1-p)^n ψ(t)=E(etX)=Πi=1nE(etXi)=(pet+1−p)n
用到的法则:
- 独立的随机变量的和的m.g.f.,等于m.g.f.的累积
二项分布随机变量相加
Theorem If X1,…,XnX_1,\dots,X_nX1,…,Xn are independent random varibales,and if XiX_iXi has the binomial distribution with parameters nin_ini and ppp ( i=1,…,ki=1,\dots,ki=1,…,k ) ,then the sum X1+⋯+XkX_1+\dots+X_kX1+⋯+Xk has the binomial distribution with parameters n=n1+⋯+nkn=n_1+\dots+n_kn=n1+⋯+nk and ppp .
当多个二项分布有不同的 nnn 但是有相同的 ppp 那么他们可以相加,nnn 是所有 nnn 的和, ppp 不变,这个可以根据将二项分布打散成伯努利分布然后再加起来可以看出来定理是正确的
那么什么时候可以使用上述定理呢?
- 所有随机变量相互独立
- 参数 ppp 必须相同
这两点有任何一点不成立,上面的定理都不成立。
书上接着给了个大长例子,讲的是血液检验,还有到了二分查找法,可以看看
总结
本文介绍伯努利分布和二项分布,分析了其对应数字特征,和m.g.f下一篇我们继续研究分布——超几何分布。
待续。。。
【概率论】5-2:伯努利和二项分布(The Bernoulli and Binomial Distributions)相关推荐
- 概率论笔记1.5伯努利模型(二项分布)
1.5伯努利模型(二项分布) 定义 n重独立实验序列:E1 E2-En 事件之间互相独立 结果只有两种! n重伯努利实验:n次独立实验但是结果只有两种 定理:A的概率是p,A逆:1-p,n重伯努利实验 ...
- #概率论#n重伯努利实验
- 概率论:古典概型与伯努利概型
古典概型不要在意伯努利就是二项分布伯努利其实就是建模型 出的题什么模型都没告诉你的叫你自己建立模型 一般情况都是伯努利正态分布模型,指数分布模型题上都会直接告诉你的 比如某随机变量服从正态分布 什么话 ...
- 二项分布算法(伯努利实验)
二项分布 问题描述: 二项分布就是重复n次独立的伯努利试验.在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保 ...
- 【概率论基础进阶】随机事件和概率-古典概型与伯努利概型
文章目录 一.古典概型 二.几何概型 三.伯努利概型 一.古典概型 定义:当试验结果为有限nnn个样本点,且每个样本点的发生具有相等的可能性,如果事件AAA由nAn_{A}nA个样本点组成,则事件A ...
- 概率论大作业C语言验证伯努利大数定律以及相对应的强大数定律、棣莫弗-拉普拉斯中心极限定理
验证伯努利大数定律以及相对应的强大数定律.棣莫弗-拉普拉斯中心极限定理 代码如下: //编程环境:Xcode //编程语言:C语言 #include <stdio.h> #include ...
- 三种常用的朴素贝叶斯实现算法——高斯朴素贝叶斯、伯努利朴素贝叶斯、多项式朴素贝叶斯
朴素贝叶斯 在机器学习中,朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器. 朴素贝叶斯算法Naive Bayes定义中有两个关键定义:特征之间强假设独立和贝 ...
- matlab模拟伯努利实验,matlab仿真随机数的发生
概率论和数理统计实验(matlab中实现) 一.伯努利漫衍 R=binornd(N,P); //N,P为二次漫衍的俩个参数,返回遵守参数为N,P的二项漫衍的随机数,且N,P,R的形式相同. R=bin ...
- sklearn模块之朴素贝叶斯:(二)伯努利模型的实现
多元Bernoulli模型的朴素贝叶斯分类器适用于离散数据.与MultinomialNB不同之处为: MultinomialNB使用出现次数(频数) BernoulliNB设计用于二进制/布尔特征 ...
最新文章
- Ubuntu16.04下arm-linux-gcc交叉编译环境搭建
- 13.5.虚拟化工具--jhat详解、13.6.虚拟化工具--jstack详解
- 就是现在!2020 求职加薪手册,人手一份!
- MVC3实现多个按钮提交
- 20220213:力扣第280场周赛(上)
- Qt线程间信号槽传递自定义数据类型(qRegisterMetaType的使用)
- 从零开始刷Leetcode——数组(896.905.914.922)
- thymeleaf学习笔记
- stm32f072--定时器17使用CH1N通道输出pwm时没有波形的原因
- linux红帽子桌面模式ftp,linux红帽子VSFTPD配置.doc
- 使用SpringSecurity 实现 OAuth2 资源服务器认证服务器分离( 注册码模式)
- 输入一行文字,找出其中大写字母、小写字母、空格、数字以及其他字符各有多少。(指针)
- 动作游戏设计三部曲 之一 交互至上
- Xilium.CefGlue与CEF库的版本匹配关系
- mysql slave 1062_mysql主从同步slave错误1062
- 精短高效的XML解析器,纯C单一程序,应用于银行的国税库行横向联网接口系统中,稳定可靠,运行速度飞快
- JAXWS CXF JAXB + MyEclipse + Maven Byron自學視頻04
- Linux Socket编程(不限Linux)基本函数用法
- 正大期货新闻:油价今年有望“长期”处在100美元上方
- 从零开始构建根文件系统
热门文章
- UNITY 使用代码更换地形中草的贴图
- wampserver在线但localhost打不开 解决方法
- ssti练习之[CSCCTF 2019 Qual]FlaskLight 1
- android中如何保存对象集合中,如何序列化对象并将其保存到Android中的文件?
- 深入剖析Android中最简单的数据存储方式:SharedPreferences
- 使用python计算行列式
- 使用ROS-I接口通过MoveIt包安装和操作ABB机器人
- 空间大战java_回忆S60(塞班)年代的JAVA游戏:有没有哪一款是你在课堂偷偷玩的?...
- 婚宴座位图html5,婚礼酒席座位该怎么安排好?婚宴座位安排图解
- 洛谷P2071 座位安排