概率论与数理统计——常用结论
1 随机事件和概率
若A⊆BA\subseteq BA⊆B,则:
P(A)≤P(B)P(AB)≤min(P(A),P(B))\begin{aligned}&P(A) \leq P(B)\\ &P(AB)\leq \min(P(A),P(B))\\\end{aligned} P(A)≤P(B)P(AB)≤min(P(A),P(B))
本章出题一般是考察时间的构造、化自然语言为数学语言之后,用本章公式求解
有时需要时间的等价转化(正难则反,转化为数学描述不一样的等价事件)
式子P(XY≤0)=P(X≥0,Y≤0)+P(X≤0,Y≥0)P(XY \leq0)=P(X \geq0,Y \leq0)+P(X \leq0,Y \geq0)P(XY≤0)=P(X≥0,Y≤0)+P(X≤0,Y≥0)成立的直观原因在于P(A+B)=P(A)+P(B)−P(AB)P(A+B)=P(A)+P(B)-P(AB)P(A+B)=P(A)+P(B)−P(AB)
对立事件是“非此即彼”的
古典概型注意找对总事件
注意区分“所取产品中有一件是不合格品,另一件也是不合格品”与“第一次取为不合格品第二次也是不合格品“的不同
注意用条件概率P(B∣Ai)P(B|A_i)P(B∣Ai)求P(B)P(B)P(B),除了贝叶斯公式P(B∣Ai)=p(Ai∣B)P(B)P(Ai)P(B|A_i)=\frac{p(A_i|B)P(B)}{P(A_i)}P(B∣Ai)=P(Ai)p(Ai∣B)P(B),还有全概率公式P(B)=∑i=1nP(B∣Ai)P(Ai)P(B)=\sum\limits_{i=1}^{n}P(B|A_i)P(A_i)P(B)=i=1∑nP(B∣Ai)P(Ai)
若0<P(A)<1,0<P(B)<10<P(A)<1,0<P(B)<10<P(A)<1,0<P(B)<1,有:
A与B相互独立⇔P(A∣B)=P(A∣Bˉ)=1−P(Aˉ∣Bˉ)⇔P(A∣B)+P(Aˉ∣Bˉ)=1A与B相互独立 \Leftrightarrow P(A|B)=P(A|\bar B)=1-P(\bar A| \bar B) \Leftrightarrow P(A|B)+P(\bar A| \bar B)=1 A与B相互独立⇔P(A∣B)=P(A∣Bˉ)=1−P(Aˉ∣Bˉ)⇔P(A∣B)+P(Aˉ∣Bˉ)=1
注意选择题的组合随机事件选项,如”至少发生2个“,”恰好发生两个“等,可以考虑代入值,查看什么时候结果是真来判断:
如事件:(A+B)(B+C)(C+D)(A+B)(B+C)(C+D)(A+B)(B+C)(C+D),
注意事件A,BA,BA,B恰好有一个发生的概率是P(AˉB+ABˉ)P(\bar AB+A\bar B)P(AˉB+ABˉ),不是P(AˉB)+P(ABˉ)P(\bar AB)+P(A\bar B)P(AˉB)+P(ABˉ)
注意一种特殊的事件表达形式:AB=AˉBˉAB=\bar A\bar BAB=AˉBˉ,可以得出ABAˉBˉ=∅AB\bar A \bar B=\emptysetABAˉBˉ=∅,即ABABAB与AˉBˉ\bar A \bar BAˉBˉ至少有一个是空集,由于二者相同,故两者都是空集。且AˉBˉ=(A+B)‾=∅\bar A \bar B=\overline {(A+B)} = \emptysetAˉBˉ=(A+B)=∅,那么A+B=ΩA+B=\OmegaA+B=Ω,即AB=∅,A+B=ΩAB=\emptyset,A+B=\OmegaAB=∅,A+B=Ω,那么A,BA,BA,B为对立事件,那么P(A∣Bˉ)=P(A∣A)=1P(A|\bar B)=P(A|A)=1P(A∣Bˉ)=P(A∣A)=1
2 一维随机变量及其分布
假设连续型随机变量XXX的概率密度f(x)f(x)f(x)为偶函数,且F(x)F(x)F(x)为其分布函数,有:
F(a)+F(−a)=1P(∣x∣≤a)=2F(a)−1P(∣x∣>a)=2−2F(a)\begin{aligned} &F(a)+F(-a)=1\\ &P(|x| \leq a)=2F(a)-1\\ &P(|x|>a)=2-2F(a)\\ \end{aligned} F(a)+F(−a)=1P(∣x∣≤a)=2F(a)−1P(∣x∣>a)=2−2F(a)
注意Z=max{X,1}Z=\max\{X,1\}Z=max{X,1}与Z=max{X,Y}Z=\max\{X,Y\}Z=max{X,Y},前者为一维随机变量,后者为多维随机变量
挑选个数类分布可能为二项分布,毕竟多次挑项,选中和没选中,符合B(n,p)B(n,p)B(n,p)的定义,且不一定是二类挑选,多类挑选亦可
独立的正态分布的和仍是正态分布
多个不独立的正态分布的和不一定是正态分布。
对于二维正态分布(X,Y)(X,Y)(X,Y),有:X,Y独立⇔X,Y不相关X,Y独立 \Leftrightarrow X,Y不相关X,Y独立⇔X,Y不相关。
但是对于一般的两个分布X,YX,YX,Y(不知道其联合分布是否为二维正态分布),则二者不相关不一定推得二者独立
3 一维随机变量函数的分布
常见函数的可加性:
- B(n,p)B(n,p)B(n,p)
- P(λ)P(\lambda)P(λ)
- N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
- χ2(n)\chi^2(n)χ2(n)
对于求解幂级数的无穷分布律,注意多化为P(X>a)P(X>a)P(X>a)的形式,而不要写为1−P(X≤a)1-P(X\leq a)1−P(X≤a)的形式,因为前者可能涉及到等差数列求和,在n→∞n \rightarrow \inftyn→∞时,某项为1的情况。
例:设随机变量XXX的分布律为P(X=k)=(1−p)k−1p,k=1,2,⋯P(X=k)=(1-p)^{k-1}p,k=1,2,\cdotsP(X=k)=(1−p)k−1p,k=1,2,⋯,其中0<p<10<p<10<p<1,求P(X>m+n)P(X>m)\frac{P(X>m+n)}{P(X>m)}P(X>m)P(X>m+n):
解:有:
P(X>m+n)P(X>m)=∑k=m+n+1∞p(1−p)k−1∑k=m+1∞p(1−p)k−1=等差数列求和公式(1−p)m+n(1−p)m=(1−p)n\frac{P(X>m+n)}{P(X>m)}=\frac{\sum\limits_{k=m+n+1}^{\infty}p(1-p)^{k-1}}{\sum\limits_{k=m+1}^{\infty}p(1-p)^{k-1}}\stackrel{\mathrm{等差数列求和公式}}{=}\frac{(1-p)^{m+n}}{(1-p)^m}=(1-p)^n P(X>m)P(X>m+n)=k=m+1∑∞p(1−p)k−1k=m+n+1∑∞p(1−p)k−1=等差数列求和公式(1−p)m(1−p)m+n=(1−p)n
PS:如果这里贸然将P(X>m)P(X>m)P(X>m)化为P(X>m)=1−P(X≤m)=1−∑k=1mp(1−p)k−1P(X>m)=1-P(X\leq m)=1-\sum\limits_{k=1}^{m}p(1-p)^{k-1}P(X>m)=1−P(X≤m)=1−k=1∑mp(1−p)k−1,虽然能用等比数列求和公式p1(1−(1−p)n)1−(1−p)p\frac{1(1-(1-p)^n)}{1-(1-p)}p1−(1−p)1(1−(1−p)n),但是不能将(1−p)n(1-p)^n(1−p)n视为0,且后续与分子不好一起化简处理
在计算形如∫e−x2dx,∫xe−x2dx,∫x2e−x2dx\int e^{-x^2}dx,\int xe^{-x^2}dx,\int x^2e^{-x^2}dx∫e−x2dx,∫xe−x2dx,∫x2e−x2dx的积分时,有两种常用解法:
转换为正态函数的数字特征去求解
利用gamma函数Γ(s)\Gamma(s)Γ(s):
Γ(s)=∫0+∞xs−1e−xdx(s>0)Γ(s+1)=sΓ(s)=s!Γ(1)=∫0+∞e−xdx=1Γ(12)=∫0∞x−12e−xdx=π=∫−∞+∞e−x2dx=∫−∞+∞x2e−x2dx\begin{aligned} &\Gamma(s)=\int_{0}^{+\infty}x^{s-1}e^{-x}dx {\kern 5pt}(s>0)\\ &\Gamma(s+1)=s\Gamma(s)=s!\\ &\Gamma(1)=\int_{0}^{+\infty}e^{-x}dx=1\\ &\Gamma(\frac{1}{2})=\int_{0}^{\infty}x^{-\frac{1}{2}}e^{-x}dx=\sqrt{\pi}\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}e^{-x^2}dx\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}x^2e^{-x^2}dx\\ \end{aligned} Γ(s)=∫0+∞xs−1e−xdx(s>0)Γ(s+1)=sΓ(s)=s!Γ(1)=∫0+∞e−xdx=1Γ(21)=∫0∞x−21e−xdx=π=∫−∞+∞e−x2dx=∫−∞+∞x2e−x2dx
4 多维随机变量及其分布
若XXX与YYY相互独立,则X2X^2X2与YYY相互独立
若XXX与YYY相互独立,则有以下四个结论:
F(x,y)=FX(x)FY(y)f(x,y)=fX(x)fY(y)E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)\begin{aligned} &F(x,y)=F_X(x)F_Y(y)\\ &f(x,y)=f_X(x)f_Y(y)\\ &E(XY)=E(X)E(Y)\\ &D(X \pm Y)=D(X)+D(Y)\\ \end{aligned} F(x,y)=FX(x)FY(y)f(x,y)=fX(x)fY(y)E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)
但是需要注意的是X,YX,YX,Y不相关与E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)是充分条件,所以单独的E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)推不出X,YX,YX,Y相互独立
无论X,YX,YX,Y有没有关系都有E(aX+bY)=aE(X)+bE(Y)E(aX+bY)=aE(X)+bE(Y)E(aX+bY)=aE(X)+bE(Y)
注意相关式的充要条件E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)的使用:
知道联合概密f(x,y)f(x,y)f(x,y):
直接E(XY)=∬xyf(x,y)dxdyE(XY)=\iint xyf(x,y)dxdyE(XY)=∬xyf(x,y)dxdy。
不知道联合概密f(x,y)f(x,y)f(x,y),但知道分布X,YX,YX,Y的关系式Y=g(X)Y=g(X)Y=g(X),与XXX的概密f(x)f(x)f(x):
有E(XY)=E(Xg(X))=∫xg(x)dxE(XY)=E(Xg(X))=\int xg(x)dxE(XY)=E(Xg(X))=∫xg(x)dx
讨论变量X,YX,YX,Y相互独立性的方法:
从分布函数讨论:P(X≤x,Y≤y)=F(x,y)=FX(x)FY(y)P(X \leq x,Y \leq y)=F(x,y)=F_X(x)F_Y(y)P(X≤x,Y≤y)=F(x,y)=FX(x)FY(y)
从概率密度函数讨论:f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)f(x,y)=fX(x)fY(y)
从事件的包含与被包含来讨论:
注意一种特殊情况,即若:B⊂AB\subset AB⊂A,那么有P(A)P(B)<P(AB)=P(B)P(A)P(B)<P(AB)=P(B)P(A)P(B)<P(AB)=P(B),那么就不相互独立
比如选取B={∣X≤x0∣},A={X≤x0}B=\{|X \leq x_0|\},A=\{X \leq x_0\}B={∣X≤x0∣},A={X≤x0},那么显然XXX与Y=∣X∣Y=|X|Y=∣X∣就不独立
关于max函数的两个变换式:
max(a+bX1,a+bX2)=a+bmax(X1,X2)max(X1,X2)=12(X1+X2+∣X1−X2∣)\begin{aligned} &\max(a+bX_1,a+bX_2)=a+b\max(X_1,X_2)\\ &\max(X_1,X_2)=\frac{1}{2}(X_1+X_2+|X_1-X_2|)\\ \end{aligned} max(a+bX1,a+bX2)=a+bmax(X1,X2)max(X1,X2)=21(X1+X2+∣X1−X2∣)
若已知连续变量的概密与离散变量的分布,则“(连,离)→连”“(连,离)\rightarrow连”“(连,离)→连”的分布函数还是可以积分求得的
“(连,离)→连”“(连,离)\rightarrow连”“(连,离)→连”常用全概率公式,但如果变量不相互独立,则不可以全概率展开
“(离,离)→离”“(离,离)\rightarrow离”“(离,离)→离”常用完备事件展开
5 多维随机变量函数的分布
对于联合分布F(x,y)F(x,y)F(x,y)的求解,常用的几种方式:
积分:知道f(x,y)f(x,y)f(x,y),直接在对应区域上求积分
独立性:若F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y),且分布X,YX,YX,Y相互独立,又已知FX(x),FY(y)F_X(x),F_Y(y)FX(x),FY(y),则有F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)F(x,y)=FX(x)FY(y)
未知转化成已知:
若不知道f(x,y)f(x,y)f(x,y),且F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y),X,YX,YX,Y由一些其余的分布X1,X2,⋯,XkX_1,X_2,\cdots, X_kX1,X2,⋯,Xk构成,若最后可转化为已知概密的联合分布(比如最后转化为了F(x,y)=P(X1≤x,X2≤y)F(x,y)=P(X_1 \leq x,X_2 \leq y)F(x,y)=P(X1≤x,X2≤y),且已知联合概密fX1X2(x,y)f_{X_1X_2}(x,y)fX1X2(x,y)),那么就在这个已知联合概密上积分求解
对于联合密度函数f(x,y)f(x,y)f(x,y)的求解,常用的几种方式:
- 求导
- 独立性
注意联合概率密度函数没有”用已知求未知“的方法,因为分布函数有F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y)的定义,所以方便已知求未知,但是概率密度函数则没有。所以面对分布之间有已知关系,但是联合密度与联合分布均未知时,优先考虑计算联合分布。
但是有些联合分布是求不出来的,这种情况下要考虑是否真的有必要求联合分布。(如想利用F(x,y)=独FX(x)FY(y)F(x,y)\stackrel{\mathrm{独}}{=}F_X(x)F_Y(y)F(x,y)=独FX(x)FY(y)进行独立性判断,但是有时F(x,y)F(x,y)F(x,y)就是求不出来,此时可考虑用别的方法)
注意对于特殊多维随机变量函数max,min\max,\minmax,min的处理,简单的可以用公式,复杂的还是要理解推导的:
且注意对于概率P(X≤x,Y≤y)P(X \leq x,Y \leq y)P(X≤x,Y≤y),其内部相当于积事件P(AB)P(AB)P(AB),而不是和事件P(A+B)P(A+B)P(A+B)
由于分布函数的FZ(z)F_Z(z)FZ(z)的概率形式是P(Z≤z)P(Z \leq z)P(Z≤z),所以常遇见的都是P(max{X,Y}≤z)或P(min{X,Y}≤z)P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} \leq z )P(max{X,Y}≤z)或P(min{X,Y}≤z),且要注意是否有独立条件。
对于不常见的P(max{X,Y}>z)或P(min{X,Y}>z)P(\max\{X,Y\} > z )或P(\min\{X,Y\} > z )P(max{X,Y}>z)或P(min{X,Y}>z),最终一般还是需要变成1−P(max{X,Y}≤z)或1−P(min{X,Y}≤z)1-P(\max\{X,Y\} \leq z )或1-P(\min\{X,Y\} \leq z )1−P(max{X,Y}≤z)或1−P(min{X,Y}≤z)即可。事实上,两种形态随意转换,一般哪种简单用哪种。但是从计算的角度来讲,只用到联合分布是比较方便的(如果独立就更方便了,联合分布为各分布的积),所以最常用的还是P(max{X,Y}≤z)或P(min{X,Y}>z)P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} > z )P(max{X,Y}≤z)或P(min{X,Y}>z)形态
- max\maxmax函数:
max{X,Y}≤z⇔{X≤z}∩{Y≤z}max{X,Y}>z⇔{X>z}∪{Y>z}\begin{aligned} &\max\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cap \{Y \leq z\}\\ &\max\{X,Y\} > z \Leftrightarrow\{X > z\} \cup \{Y > z\}\\ \end{aligned} max{X,Y}≤z⇔{X≤z}∩{Y≤z}max{X,Y}>z⇔{X>z}∪{Y>z}
即有:
P(max{X,Y}≤z)=P({X≤z}∩{Y≤z})=P(X≤z,Y≤z)=F(z,z)=独FX(z)FY(z)P(\max\{X,Y\} \leq z )=P(\{X \leq z\} \cap \{Y \leq z\})=P(X \leq z,Y \leq z)=F(z,z)\stackrel{\mathrm{独}}{=}F_X(z)F_Y(z) P(max{X,Y}≤z)=P({X≤z}∩{Y≤z})=P(X≤z,Y≤z)=F(z,z)=独FX(z)FY(z)
- min\minmin函数:
min{X,Y}≤z⇔{X≤z}∪{Y≤z}={X≤z}+{Y≤z}−{{X≤z}∩{Y≤z}}min{X,Y}>z⇔{X>z}∩{Y>z}\begin{aligned} &\min\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cup \{Y \leq z\} = \{X \leq z\}+\{Y \leq z\} -\{\{X \leq z\} \cap \{Y \leq z\}\}\\ &\min\{X,Y\} > z \Leftrightarrow\{X > z\} \cap \{Y > z\}\\ \end{aligned} min{X,Y}≤z⇔{X≤z}∪{Y≤z}={X≤z}+{Y≤z}−{{X≤z}∩{Y≤z}}min{X,Y}>z⇔{X>z}∩{Y>z}
即有:
P(min{X,Y}≤z)=FX(z)+FZ(z)−FXY(z,z)P(\min\{X,Y\} \leq z )=F_X(z)+F_Z(z)-F_{XY}(z,z) P(min{X,Y}≤z)=FX(z)+FZ(z)−FXY(z,z)
特别地,当X,YX,YX,Y相互独立时有:
P(min{X,Y}≤z)=1−P(min{X,Y}>z)=1−P(X>z)P(Y>z)=1−[1−FX(z)][1−FY(z)]P(\min\{X,Y\} \leq z )=1-P(\min\{X,Y\} > z )=1-P(X>z)P(Y>z)=1-[1-F_X(z)][1-F_Y(z)] P(min{X,Y}≤z)=1−P(min{X,Y}>z)=1−P(X>z)P(Y>z)=1−[1−FX(z)][1−FY(z)]
真正常用的还是max{X,Y}≤z\max\{X,Y\} \leq zmax{X,Y}≤z或者min{X,Y}≤z\min\{X,Y\} \leq zmin{X,Y}≤z,毕竟与分布函数相联系,其余的两种情况类似
例:已知X1,X2X_1,X_2X1,X2的分布函数F(x)F(x)F(x),且X=max{X1,X2},Y=min{X1,X2}X=\max\{X_1,X_2\},Y=\min\{X_1,X_2\}X=max{X1,X2},Y=min{X1,X2},求(X,Y)(X,Y)(X,Y)的分布函数F(x,y)F(x,y)F(x,y):
解:易有:
F(x,y)=P(max{X1,X2}≤x,min{X1,X2}≤y)=P({X1≤x}∩{X2≤x}∩{{X1≤y}∪{X2≤y}})\begin{aligned} &F(x,y)=P(\max\{X_1,X_2\}\leq x,\min\{X_1,X_2\}\leq y)=P(\{X_1 \leq x\}\cap\{X_2 \leq x\}\cap\{\{X_1 \leq y\}\cup\{X_2 \leq y\}\})\\ \end{aligned} F(x,y)=P(max{X1,X2}≤x,min{X1,X2}≤y)=P({X1≤x}∩{X2≤x}∩{{X1≤y}∪{X2≤y}})
令:{X1≤x},{X2≤x},{X1≤y},{X2≤y}\{X_1 \leq x\},\{X_2 \leq x\},\{X_1 \leq y\},\{X_2 \leq y\}{X1≤x},{X2≤x},{X1≤y},{X2≤y}分别为A,B,C,DA,B,C,DA,B,C,D,有:
F(x,y)=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)−P(ABCD)=P(AC)P(B)+P(BD)P(A)−P(AC)P(BD)\begin{aligned} F(x,y)&=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)-P(ABCD)\\ &=P(AC)P(B)+P(BD)P(A)-P(AC)P(BD)\\ \end{aligned} F(x,y)=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)−P(ABCD)=P(AC)P(B)+P(BD)P(A)−P(AC)P(BD)
接下来分类讨论。x≤yx \leq yx≤y时,P(AC)=P(A),P(BD)=P(B)P(AC)=P(A),P(BD)=P(B)P(AC)=P(A),P(BD)=P(B);当x>yx>yx>y时,P(AC)=P(C),P(BD)=P(D)P(AC)=P(C),P(BD)=P(D)P(AC)=P(C),P(BD)=P(D)。
注意常见的题目,若已知随机变量XXX的分布函数fX(x)f_X(x)fX(x),又知道随机变量XXX与YYY的关系Y=g(X)Y=g(X)Y=g(X),与反函数g−1(Y)g^{-1}(Y)g−1(Y),若让求YYY的分布函数,那么显然用
P(Y≤y)=P(g(X)≤y)=P(X≤g−1(y))P(Y \leq y)=P(g(X) \leq y)=P(X \leq g^{-1}(y)) P(Y≤y)=P(g(X)≤y)=P(X≤g−1(y))
注意这里关于P(X≤g−1(y))P(X \leq g^{-1}(y))P(X≤g−1(y))的求解,不要直接由fX(x)f_X(x)fX(x)积分,而是要实现求出分布函数FX(x)F_X(x)FX(x),再代入分布函数。因为由于一般来讲都要根据g−1(y)g^{-1}(y)g−1(y)的值分段讨论,有的甚至能分4,5个段以上,重复求4,5个积分及其麻烦,不如事先求好分布函数再代入。
拓展:对于已知(X,Y)(X,Y)(X,Y)的联合分布密度f(x,y)f(x,y)f(x,y),与ZZZ的分布律,让求U=X+Y+ZU=X+Y+ZU=X+Y+Z的分布函数,那么可以先令V=X+YV=X+YV=X+Y,利用f(x,y)f(x,y)f(x,y)求FV(v)F_V(v)FV(v),那么就变成了求U=V+ZU=V+ZU=V+Z的分布函数,剩下的参考上面内容
6 数字特征
常用的分布及数字特征:
$$
\begin{array}{ccc}
\hline
分布&期望&方差\
\hline
B(1,p)&p&p(1-p)\
B(n,p)&np&np(1-p)\
p(\lambda)& \lambda & \lambda \
U(a,b)&\frac{a+b}{2}&\frac{(b-a)^2}{12}\
E( \lambda )&\frac{1}{ \lambda }&\frac{1}{ \lambda ^2}\
G§&\frac{1}{p}&\frac{1}{p^2}\
H(N,M,n)&\frac{nM}{N}&\frac{nM}{N}(1-\frac{M}{N})\frac{N-n}{N-1}\
\chi^2(n)&n&2n\
t(n)&0&\frac{n}{n-2}\
\hline
\end{array}
$$
超几何分布H(N,M,n)H(N,M,n)H(N,M,n):NNN件物品中,MMM个指定类,抽nnn次(不放回),抽到指定类的次数的概率:
P(x=k)=CMkCN−Mn−kCNn,k=0,1,⋯,min{n,m}P(x=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},\quad k=0,1,\cdots,\min\{n,m\} P(x=k)=CNnCMkCN−Mn−k,k=0,1,⋯,min{n,m}
求Y=g(X)Y=g(X)Y=g(X)的均值,即可以考虑先求YYY的分布,再求均值,也可以考虑利用公式E(g(x))=∫−∞+∞g(x)f(x)dxE(g(x))=\int_{-\infty}^{+\infty}g(x)f(x)dxE(g(x))=∫−∞+∞g(x)f(x)dx求解
分布律P(xi)=pi,i=1,2,⋯,∞P(x_i)=p_i,\quad i=1,2,\cdots,\inftyP(xi)=pi,i=1,2,⋯,∞的期望存在的充要条件是∑i=1∞anpn\sum\limits_{i=1}^{\infty}a_np_ni=1∑∞anpn绝对收敛
若分布X,YX,YX,Y的相关系数为±1\pm 1±1,则二者满足Y=aX+bY=aX+bY=aX+b,具体a,ba,ba,b可用数字特征求解
若相关系数存在,且f(x,y)=f(−x,y)f(x,y)=f(-x,y)f(x,y)=f(−x,y)或f(x,y)=f(x,−y)f(x,y)=f(x,-y)f(x,y)=f(x,−y),则二者相关系数系数为0
对于二维均匀分布,若区域DDD为矩形,则X,YX,YX,Y独立,反之则不独立。若DDD关于xxx轴或yyy轴对称,则X,YX,YX,Y不相关
方差D(X)D(X)D(X)并没有专门的积分公式进行求解,但是可以用积分求解E(X)E(X)E(X)与E(X2)E(X^2)E(X2),再用D(X)=E(X2)−E2(X)D(X)=E(X^2)-E^2(X)D(X)=E(X2)−E2(X)
注意牛顿二项式公式:(p+q)n=∑k=0nCnkpkqn−k(p+q)^n=\sum\limits_{k=0}^{n}C_n^kp^kq^{n-k}(p+q)n=k=0∑nCnkpkqn−k,注意其与伯努利分布的结合
如:X∼B(n,p),Y=eXX \sim B(n,p),Y=e^XX∼B(n,p),Y=eX,则:
EY=∑k=0nekpk(1−p)n−k=∑k=0n(pe)k(1−p)n−k=(pe+1−p)nEY=\sum\limits_{k=0}^{n}e^kp^k(1-p)^{n-k}=\sum\limits_{k=0}^{n}(pe)^k(1-p)^{n-k}=(pe+1-p)^n EY=k=0∑nekpk(1−p)n−k=k=0∑n(pe)k(1−p)n−k=(pe+1−p)n
当让求和式之间的协方差时(如COV(X,X+Y)\text{COV}(X,X+Y)COV(X,X+Y)),可以考虑利用协方差计算的性质;但是若计算乘式之间的协方差时(如COV(X,XY)\text{COV}(X,XY)COV(X,XY)),则需要考虑公式COV(X,Y)=E(XY)−E(X)E(Y)\text{COV}(X,Y)=E(XY)-E(X)E(Y)COV(X,Y)=E(XY)−E(X)E(Y)
让求二维正态分布的相关系数,勿忘凑二维正态分布的相关系数矩阵形式:
f(x,y)=12πσ1σ21−ρ2exp{12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)(y−μ2)σ1σ2+(y−μ2)2σ22]}f(x,y)=\frac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\{\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\} f(x,y)=2πσ1σ21−ρ21exp{2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]}
7 大数定理与中心极限定理
一共有3个大数定律,三者归根到底都是在讲一定条件下:
1n∑i=1nXi⟶p1n∑i=1nEXi\frac{1}{n}\sum\limits_{i=1}^{n}X_i\stackrel{p}\longrightarrow \frac{1}{n}\sum\limits_{i=1}^{n}EX_i n1i=1∑nXi⟶pn1i=1∑nEXi
即用样本均值来逼近分布均值
三种大数定理及其条件:
切比雪夫大数定理条件
- 独立(并未要求同分布)
- 方差一致且有上界(有方差)
伯努利大数定理
可由切比雪夫大数定理推得,很少用
辛钦大数定理:
$$
\begin{aligned}
\forall \epsilon>0,\quad&\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|<\epsilon}=1或\
&\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|\geq\epsilon}=0\
\end{aligned}
$$条件:
- 独立;
- 同分布;
- 期望存在(并未要求方差存在,方差不存在指方差趋近于∞\infty∞)
注意切比雪夫不等式与辛钦大数定理由于PPP中含有绝对值,所以有时用之前应该凑一下形式,补一下绝对值号,才能看出来
中心极限定理:
limn→∞1n∑i=1nXi=X‾⟶pN(μ,σ2n)或:limn→∞∑i=1nXi⟶pN(nμ,nσ2)\begin{aligned} &\lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}X_i=\overline{X} \stackrel{p}\longrightarrow N(\mu,\frac{\sigma^2}{n})\quad或:\\ &\lim\limits_{n \rightarrow \infty}\sum\limits_{i=1}^{n}X_i \stackrel{p}\longrightarrow N(n\mu,n\sigma^2)\\ \end{aligned} n→∞limn1i=1∑nXi=X⟶pN(μ,nσ2)或:n→∞limi=1∑nXi⟶pN(nμ,nσ2)
具体应用时记住,只要题目涉及独立同分布随机变量的和∑X\sum\limits_{}^{}X∑X,就要考虑这个中心极限定理
如:知道每个元器件正常工作的概率为ppp,求n个元器件一起工作时,至少m个正常工作的概率,那么就是∑1100Xi∼N(np,np(1−p))\sum\limits_{1}^{100}X_i \sim N(np,np(1-p))1∑100Xi∼N(np,np(1−p)),然后再求P(∑1100Xi≥m)P(\sum\limits_{1}^{100}X_i \geq m)P(1∑100Xi≥m)即可(转化为标准正态分布)
题目要证明依概率收敛的话,可以考虑用切比雪夫不等式,令n→∞n \rightarrow \inftyn→∞时,取极限为0或1
若果题目是问依概率收敛为何值,那么已经默认是收敛,就不用切比雪夫不等式,应该利用结论:若XiX_iXi独立同分布,则E(Xi2)E(X_i^2)E(Xi2)存在,且有limn→∞1n∑i=1n⟶pE(Xik)\lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}\stackrel{p}\longrightarrow E(X_i^k)n→∞limn1i=1∑n⟶pE(Xik),将原式子展开分别去求即可
切比雪夫不等式并没有n→∞n \rightarrow \inftyn→∞的要求
8 统计量及其分布
S2S^2S2为σ2\sigma^2σ2的无偏估计与一致估计,SSS为σ\sigmaσ的无偏估计,但不一定是一致估计
本章涉及的分布多是∑X2\sum X^2∑X2类型的,要是有(∑X)2(\sum X)^2(∑X)2的,那么考虑分布Y=∑XY=\sum XY=∑X,进而求Y2Y^2Y2的分布
均值与方差的统计特征:
E(X‾)=E(X),D(X‾)=D(X)nE(S2)=D(X)\begin{aligned} &E(\overline X)=E(X),\quad D(\overline X)=\frac{D(X)}{n}\\ &E(S^2)=D(X)\\ \end{aligned} E(X)=E(X),D(X)=nD(X)E(S2)=D(X)
特别地,若是有Xi∼N(μ,σ2)X_i \sim N(\mu,\sigma^2)Xi∼N(μ,σ2),则有(n−1)S2σ2∼χ2(n−1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1),则此时可求D(S2)D(S^2)D(S2),但如果是一般性的分布,其方差就不一定有这个性质了;同理,对于正态分布的D(Xˉ2)D(\bar X^2)D(Xˉ2)也可以利用χ(n)\chi(n)χ(n)分布来进行计算。
来自正态分布总体的样本的均值与方差相互独立,这一点有时可以帮助分布之间的独立性:
例:设X1,X2X_1,X_2X1,X2是来自正态总体的简单随机样本,证明(X1+X2)2(X_1+X_2)^2(X1+X2)2与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立
解:易有Xˉ=X1+X22\bar X=\frac{X_1+X_2}{2}Xˉ=2X1+X2与方差S2S^2S2相互独立,而:
S2=∑i=1n(Xi−Xˉ)2n−1=(X1−X1+X22)2+(X2−X1+X22)2=(X1−X2)22S^2=\frac{ \sum\limits_{i=1}^{n}(X_i-\bar X)^2}{n-1}=(X_1-\frac{X_1+X_2}{2})^2+(X_2-\frac{X_1+X_2}{2})^2=\frac{(X_1-X_2)^2}{2} S2=n−1i=1∑n(Xi−Xˉ)2=(X1−2X1+X2)2+(X2−2X1+X2)2=2(X1−X2)2
所以(X1+X2)(X_1+X_2)(X1+X2)与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立,即(X1+X2)2(X_1+X_2)^2(X1+X2)2与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立
χ2(2)\chi^2(2)χ2(2)与E(12)E(\frac{1}{2})E(21)的概率密度函数相同
9 参数估计与假设检验
区分好α\alphaα——显著性水平,与1−α1-\alpha1−α——置信水平
区间估计与假设检验的核心公式:
估μ{(X‾−σnZα1,X‾+σnZα2)(X‾−Sntα1(n−1),X‾+Sntα1(n−1)α1+α2=1Φ(Zα1)=1−α1,Φ(Zα2)=1−α2估\mu\begin{cases} &(\overline X-\frac{\sigma}{\sqrt{n}}Z_{\alpha_1},\overline X+\frac{\sigma}{\sqrt{n}}Z_{\alpha_2})\\ &(\overline X-\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1),\overline X+\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1)\\ &\alpha_1+\alpha_2=1\\ &\Phi(Z\alpha_1)=1-\alpha_1, \quad \Phi(Z\alpha_2)=1-\alpha_2\\ \end{cases} 估μ⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧(X−nσZα1,X+nσZα2)(X−nStα1(n−1),X+nStα1(n−1)α1+α2=1Φ(Zα1)=1−α1,Φ(Zα2)=1−α2
若是令α1=α2=α2\alpha_1=\alpha_2=\frac{\alpha}{2}α1=α2=2α,则称其为等尾置信区间,最为常用
假设检验是在区间估计的基础上推导的。共2(1+2)=62(1+2)=62(1+2)=6种。
假设检验的假设一般是两个对立假设成对出现,即原假设H0H_0H0,对立假设H1H_1H1,其中原假设必须包含等号,H1H_1H1对应的区间为拒绝域。
为了简便起见,以下仅讨论知道σ2\sigma^2σ2的等尾置信区间:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QM0vVlFj-1668578412518)(https://s3-us-west-2.amazonaws.com/secure.notion-static.com/a6a61ea0-97cf-4176-bfbf-6cc116d2fba9/Untitled.png)]
那么对应的H0H_0H0,H1H_1H1及拒绝域为:
H0H1拒绝域μ=μ0μ≠μ0U1+U2μ≥μ0μ<μ0U1μ≤μ0μ>μ0U2\begin{array}{ccc}\hline H_0&H_1&拒绝域\\ \hline \mu=\mu_0&\mu \neq\mu_0&U_1+U_2\\ \mu \geq \mu_0&\mu<\mu_0&U_1\\ \mu \leq \mu_0&\mu> \mu_0&U_2\\ \hline\end{array} H0μ=μ0μ≥μ0μ≤μ0H1μ=μ0μ<μ0μ>μ0拒绝域U1+U2U1U2
有效是在无偏的基础上,故题目让判断是否有效,应先判断是否无偏
原假设必须包含等号,有一类题目会让检验什么东西,且这个东西不一定就要是原假设
如果分布XXX为偶函数(如学生氏分布),则有X1−α=−XαX_{1-\alpha}=-X_\alphaX1−α=−Xα
什么时候用二阶矩:
- 包含双参数,那么可以考虑通过一二阶矩方程构建方程组求解
- 虽然只有单参数,但是仅由一阶矩方程无法解出(如超越方程),此时可考虑建立二阶矩方程
注意第一类错误率与第二类错误率的计算式实际上就是条件概率,直接计算即可:
例:设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体X∼N(μ,1)X \sim N(\mu,1)X∼N(μ,1)的随机样本,Xˉ\bar XXˉ为样本均值,证明对于假设检验H0:μ=μ0H_0:\mu=\mu_0H0:μ=μ0,若取拒绝域Rα={Xˉ>μ0+1.96n}R_\alpha=\{\bar X > \mu_0+\frac{1.96}{\sqrt{n}}\}Rα={Xˉ>μ0+n1.96},则第一类错误率α\alphaα为1−Φ(1.96)1- \Phi(1.96)1−Φ(1.96):
解:易有:
α=P{拒绝H0∣H0为真}=P{Xˉ>μ0+1.96n∣μ=μ0}\alpha=P\{拒绝H_0|H_0为真\}=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}|\mu=\mu_0\} α=P{拒绝H0∣H0为真}=P{Xˉ>μ0+n1.96∣μ=μ0}
当μ=μ0\mu=\mu_0μ=μ0
α=P{Xˉ>μ0+1.96n}=1−P{Xˉ−μ01n≤1.96}=1−Φ(1.96)\alpha=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}\}=1-P\{\frac{\bar X-\mu_0}{\sqrt{\frac{1}{n}}} \leq 1.96\}=1-\Phi(1.96) α=P{Xˉ>μ0+n1.96}=1−P{n1Xˉ−μ0≤1.96}=1−Φ(1.96)
注意,若θ\thetaθ的置信区间为(a,b)(a,b)(a,b)的置信度为ppp,那么有公式P(a<θ<b)=pP(a<\theta<b)=pP(a<θ<b)=p
概率论与数理统计——常用结论相关推荐
- 概率论与数理统计常用英文词汇对照
概率论与数理统计常用英文词汇对照 Probability Theory 概率论 Trial 试验 intersection交 union 并 frequency 频率 difference 差 add ...
- [概率论与数理统计] 常用定义与公式
随机事件运算律 交换律: AUB = BUA AB = BA 结合律 (AUB)UC = AU(BUC) = AUBUC (AB)C = A(BC) = ABC 分配律 A(BUC) = ABUAC ...
- 概率论与数理统计——常用的概率分布表
- 概率论与数理统计【二】随机事件与概率(2) - 常用求概率公式与例题两道
本节为概率论与数理统计复习笔记的第二节,随机事件与概率(2),主要包括:加法公式.减法公式.条件概率公式.乘法公式.全概率公式.贝叶斯公式以及两道例题. 1.常用的求概率公式 1.加法公式 P(A∪B ...
- 概率论由相关性求数学期望和方差的公式_2020.3.30 | 考研数学—概率论与数理统计:各章节考试重点...
考研数学有两大重点,基础要打好,练习要多做,错题要巩固.下面来看下有关概率论与数理统计相关复习内容,一起来学习吧! 一.概率与数理统计学科的特点(1)研究对象是随机现象高数是研究确定的现象,而概率研究 ...
- 概率论与数理统计复习
文章目录 第一章 随机事件及其概率 随机事件 频率与概率 古典概型与几何概型 条件概率与事件的独立性 全概率公式与贝叶斯公式 第二章 随机变量及其分布 随机变量的概念 常用分布表(随机变量的离散连续与 ...
- 概率论与数理统计(Probability Statistics I)
Table of Contents 概率论的基本概念(The Basic Concept of Probability Theory) 随机变量及其分布(Random Variable and Its ...
- 1 - 概率论与数理统计
1 - 概率论与数理统计 文章目录 1 - 概率论与数理统计 一.随机事件与概率 1)集合的运算法则 2)概率的基本运算与公式 3)独立与对立 1. 两事件相互独立 2. 三事件两两独立 3. 三事件 ...
- 【2020/07/16修订】概率论与数理统计(电子科技大学) 知识梳理 · 第一版(1到8章 · 度盘)
概率论与数理统计 知 识 梳 理 (第一版) 建议先修课程:高等数学(微积分) 配套课程: 1.慕课(MOOC):概率论与数理统计(电子科技大学) 2.教材:概率论与数理统计 电子科技大学应用数学学院 ...
- 概率论与数理统计-下篇
概率论与数理统计-下篇 4 一维随机变量 4.1 分布函数 4.1.1 定义与充要条件 定义: FX(x)=P{X⩽x},x∈RF_{_{X}}(x)=P\{X\leqslant x\}\ ,\ x\ ...
最新文章
- Android常见面试题
- java if在内存中_全面理解Java内存模型
- 数据库中的DML,DCL,DDL分别是那些操作?
- Activity与Intent
- 笨办法学 Python · 续 练习 32:扫描器
- java ee课程目标
- 管理新语:软件工作考评的设计思路
- VM虚拟机去虚拟化教程(三)修改内存品牌和序列号
- 监控系统为什么要加流媒体服务器,视频监控系统为什么要使用流媒体服务器做视频分发?...
- 简洁版Featured Category/Shop by Category模块
- 《上古天真论》第三讲文字版
- 设计色计算机色相对比知识,色彩要合理运用!色相对比原理!
- 人脸表情系列——人脸表情识别(Facial Expression Recognization/FER)
- input标签的默认样式导致的左上边框和右下边框颜色不一致问题
- 疯狂python讲义课后题答案_疯狂Python讲义
- 闲鱼自动抓取/筛选/发送系统 V13发布
- android inset 标签,InsetDrawable
- 图神经网络入门课程推荐
- 2023年郑州Java培训机构排名新鲜出炉,快来看看都有哪些!
- 介绍纳米团簇表征手段
热门文章
- 边际成本,机会成本,沉默成本
- 【Scrum】借由数个冲刺,实现产品的敏捷开发!
- SCI收录期刊——声学学科 (转载)
- 一招教你解决“删除:需要管理员权限才能删除的文件夹”
- 夏普Sharp MX-B6581D 一体机驱动
- 中国云计算市场“三足鼎立”
- python人民币转大写_Python人民币大写转换代码
- Vue3 的新特性(二) —— Composition-Api
- Java导出Word文档的实现
- python注释可用于表明作者和版权信息_vs2017 新建Class 文件时,自动添加作者版权声明注释...