1 随机事件和概率

若A⊆BA\subseteq BA⊆B，则:

P(A)≤P(B)P(AB)≤min⁡(P(A),P(B))\begin{aligned}&P(A) \leq P(B)\\ &P(AB)\leq \min(P(A),P(B))\\\end{aligned} P(A)≤P(B)P(AB)≤min(P(A),P(B))

本章出题一般是考察时间的构造、化自然语言为数学语言之后，用本章公式求解

有时需要时间的等价转化（正难则反，转化为数学描述不一样的等价事件）

式子P(XY≤0)=P(X≥0,Y≤0)+P(X≤0,Y≥0)P(XY \leq0)=P(X \geq0,Y \leq0)+P(X \leq0,Y \geq0)P(XY≤0)=P(X≥0,Y≤0)+P(X≤0,Y≥0)成立的直观原因在于P(A+B)=P(A)+P(B)−P(AB)P(A+B)=P(A)+P(B)-P(AB)P(A+B)=P(A)+P(B)−P(AB)

对立事件是“非此即彼”的

古典概型注意找对总事件

注意区分“所取产品中有一件是不合格品，另一件也是不合格品”与“第一次取为不合格品第二次也是不合格品“的不同

注意用条件概率P(B∣Ai)P(B|A_i)P(B∣Ai)求P(B)P(B)P(B)，除了贝叶斯公式P(B∣Ai)=p(Ai∣B)P(B)P(Ai)P(B|A_i)=\frac{p(A_i|B)P(B)}{P(A_i)}P(B∣Ai)=P(Ai)p(Ai∣B)P(B)，还有全概率公式P(B)=∑i=1nP(B∣Ai)P(Ai)P(B)=\sum\limits_{i=1}^{n}P(B|A_i)P(A_i)P(B)=i=1∑nP(B∣Ai)P(Ai)

若0<P(A)<1,0<P(B)<10<P(A)<1,0<P(B)<10<P(A)<1,0<P(B)<1，有：

注意选择题的组合随机事件选项，如”至少发生2个“，”恰好发生两个“等，可以考虑代入值，查看什么时候结果是真来判断：

如事件：(A+B)(B+C)(C+D)(A+B)(B+C)(C+D)(A+B)(B+C)(C+D)，

注意事件A,BA,BA,B恰好有一个发生的概率是P(AˉB+ABˉ)P(\bar AB+A\bar B)P(AˉB+ABˉ)，不是P(AˉB)+P(ABˉ)P(\bar AB)+P(A\bar B)P(AˉB)+P(ABˉ)

注意一种特殊的事件表达形式：AB=AˉBˉAB=\bar A\bar BAB=AˉBˉ，可以得出ABAˉBˉ=∅AB\bar A \bar B=\emptysetABAˉBˉ=∅，即ABABAB与AˉBˉ\bar A \bar BAˉBˉ至少有一个是空集，由于二者相同，故两者都是空集。且AˉBˉ=(A+B)‾=∅\bar A \bar B=\overline {(A+B)} = \emptysetAˉBˉ=(A+B)=∅，那么A+B=ΩA+B=\OmegaA+B=Ω，即AB=∅,A+B=ΩAB=\emptyset,A+B=\OmegaAB=∅,A+B=Ω，那么A,BA,BA,B为对立事件，那么P(A∣Bˉ)=P(A∣A)=1P(A|\bar B)=P(A|A)=1P(A∣Bˉ)=P(A∣A)=1

2 一维随机变量及其分布

假设连续型随机变量XXX的概率密度f(x)f(x)f(x)为偶函数，且F(x)F(x)F(x)为其分布函数，有：

F(a)+F(−a)=1P(∣x∣≤a)=2F(a)−1P(∣x∣>a)=2−2F(a)\begin{aligned} &F(a)+F(-a)=1\\ &P(|x| \leq a)=2F(a)-1\\ &P(|x|>a)=2-2F(a)\\ \end{aligned} F(a)+F(−a)=1P(∣x∣≤a)=2F(a)−1P(∣x∣>a)=2−2F(a)

注意Z=max⁡{X,1}Z=\max\{X,1\}Z=max{X,1}与Z=max⁡{X,Y}Z=\max\{X,Y\}Z=max{X,Y}，前者为一维随机变量，后者为多维随机变量

挑选个数类分布可能为二项分布，毕竟多次挑项，选中和没选中，符合B(n,p)B(n,p)B(n,p)的定义，且不一定是二类挑选，多类挑选亦可

独立的正态分布的和仍是正态分布

多个不独立的正态分布的和不一定是正态分布。

对于二维正态分布(X,Y)(X,Y)(X,Y)，有：X,Y独立⇔X,Y不相关X,Y独立 \Leftrightarrow X,Y不相关X,Y独立⇔X,Y不相关。

但是对于一般的两个分布X,YX,YX,Y（不知道其联合分布是否为二维正态分布），则二者不相关不一定推得二者独立

3 一维随机变量函数的分布

常见函数的可加性：

B(n,p)B(n,p)B(n,p)
P(λ)P(\lambda)P(λ)
N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
χ2(n)\chi^2(n)χ2(n)

对于求解幂级数的无穷分布律，注意多化为P(X>a)P(X>a)P(X>a)的形式，而不要写为1−P(X≤a)1-P(X\leq a)1−P(X≤a)的形式，因为前者可能涉及到等差数列求和，在n→∞n \rightarrow \inftyn→∞时，某项为1的情况。

例：设随机变量XXX的分布律为P(X=k)=(1−p)k−1p,k=1,2,⋯P(X=k)=(1-p)^{k-1}p,k=1,2,\cdotsP(X=k)=(1−p)k−1p,k=1,2,⋯，其中0<p<10<p<10<p<1，求P(X>m+n)P(X>m)\frac{P(X>m+n)}{P(X>m)}P(X>m)P(X>m+n)：

解：有：

P(X>m+n)P(X>m)=∑k=m+n+1∞p(1−p)k−1∑k=m+1∞p(1−p)k−1=等差数列求和公式(1−p)m+n(1−p)m=(1−p)n\frac{P(X>m+n)}{P(X>m)}=\frac{\sum\limits_{k=m+n+1}^{\infty}p(1-p)^{k-1}}{\sum\limits_{k=m+1}^{\infty}p(1-p)^{k-1}}\stackrel{\mathrm{等差数列求和公式}}{=}\frac{(1-p)^{m+n}}{(1-p)^m}=(1-p)^n P(X>m)P(X>m+n)=k=m+1∑∞p(1−p)k−1k=m+n+1∑∞p(1−p)k−1=等差数列求和公式(1−p)m(1−p)m+n=(1−p)n

PS：如果这里贸然将P(X>m)P(X>m)P(X>m)化为P(X>m)=1−P(X≤m)=1−∑k=1mp(1−p)k−1P(X>m)=1-P(X\leq m)=1-\sum\limits_{k=1}^{m}p(1-p)^{k-1}P(X>m)=1−P(X≤m)=1−k=1∑mp(1−p)k−1，虽然能用等比数列求和公式p1(1−(1−p)n)1−(1−p)p\frac{1(1-(1-p)^n)}{1-(1-p)}p1−(1−p)1(1−(1−p)n)，但是不能将(1−p)n(1-p)^n(1−p)n视为0，且后续与分子不好一起化简处理

在计算形如∫e−x2dx,∫xe−x2dx,∫x2e−x2dx\int e^{-x^2}dx,\int xe^{-x^2}dx,\int x^2e^{-x^2}dx∫e−x2dx,∫xe−x2dx,∫x2e−x2dx的积分时，有两种常用解法：

转换为正态函数的数字特征去求解
利用gamma函数Γ(s)\Gamma(s)Γ(s)：

Γ(s)=∫0+∞xs−1e−xdx(s>0)Γ(s+1)=sΓ(s)=s!Γ(1)=∫0+∞e−xdx=1Γ(12)=∫0∞x−12e−xdx=π=∫−∞+∞e−x2dx=∫−∞+∞x2e−x2dx\begin{aligned} &\Gamma(s)=\int_{0}^{+\infty}x^{s-1}e^{-x}dx {\kern 5pt}(s>0)\\ &\Gamma(s+1)=s\Gamma(s)=s!\\ &\Gamma(1)=\int_{0}^{+\infty}e^{-x}dx=1\\ &\Gamma(\frac{1}{2})=\int_{0}^{\infty}x^{-\frac{1}{2}}e^{-x}dx=\sqrt{\pi}\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}e^{-x^2}dx\\ &{\kern 22pt}=\int_{-\infty}^{+\infty}x^2e^{-x^2}dx\\ \end{aligned} Γ(s)=∫0+∞xs−1e−xdx(s>0)Γ(s+1)=sΓ(s)=s!Γ(1)=∫0+∞e−xdx=1Γ(21)=∫0∞x−21e−xdx=π=∫−∞+∞e−x2dx=∫−∞+∞x2e−x2dx

4 多维随机变量及其分布

若XXX与YYY相互独立，则X2X^2X2与YYY相互独立

若XXX与YYY相互独立，则有以下四个结论：

F(x,y)=FX(x)FY(y)f(x,y)=fX(x)fY(y)E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)\begin{aligned} &F(x,y)=F_X(x)F_Y(y)\\ &f(x,y)=f_X(x)f_Y(y)\\ &E(XY)=E(X)E(Y)\\ &D(X \pm Y)=D(X)+D(Y)\\ \end{aligned} F(x,y)=FX(x)FY(y)f(x,y)=fX(x)fY(y)E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)

但是需要注意的是X,YX,YX,Y不相关与E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)是充分条件，所以单独的E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)推不出X,YX,YX,Y相互独立

无论X,YX,YX,Y有没有关系都有E(aX+bY)=aE(X)+bE(Y)E(aX+bY)=aE(X)+bE(Y)E(aX+bY)=aE(X)+bE(Y)

注意相关式的充要条件E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)的使用：

知道联合概密f(x,y)f(x,y)f(x,y)：

直接E(XY)=∬xyf(x,y)dxdyE(XY)=\iint xyf(x,y)dxdyE(XY)=∬xyf(x,y)dxdy。
不知道联合概密f(x,y)f(x,y)f(x,y)，但知道分布X,YX,YX,Y的关系式Y=g(X)Y=g(X)Y=g(X)，与XXX的概密f(x)f(x)f(x)：

有E(XY)=E(Xg(X))=∫xg(x)dxE(XY)=E(Xg(X))=\int xg(x)dxE(XY)=E(Xg(X))=∫xg(x)dx

讨论变量X,YX,YX,Y相互独立性的方法：

从分布函数讨论：P(X≤x,Y≤y)=F(x,y)=FX(x)FY(y)P(X \leq x,Y \leq y)=F(x,y)=F_X(x)F_Y(y)P(X≤x,Y≤y)=F(x,y)=FX(x)FY(y)
从概率密度函数讨论：f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)f(x,y)=fX(x)fY(y)
从事件的包含与被包含来讨论：

注意一种特殊情况，即若：B⊂AB\subset AB⊂A，那么有P(A)P(B)<P(AB)=P(B)P(A)P(B)<P(AB)=P(B)P(A)P(B)<P(AB)=P(B)，那么就不相互独立

比如选取B={∣X≤x0∣},A={X≤x0}B=\{|X \leq x_0|\},A=\{X \leq x_0\}B={∣X≤x0∣},A={X≤x0}，那么显然XXX与Y=∣X∣Y=|X|Y=∣X∣就不独立

关于max函数的两个变换式：

max⁡(a+bX1,a+bX2)=a+bmax⁡(X1,X2)max⁡(X1,X2)=12(X1+X2+∣X1−X2∣)\begin{aligned} &\max(a+bX_1,a+bX_2)=a+b\max(X_1,X_2)\\ &\max(X_1,X_2)=\frac{1}{2}(X_1+X_2+|X_1-X_2|)\\ \end{aligned} max(a+bX1,a+bX2)=a+bmax(X1,X2)max(X1,X2)=21(X1+X2+∣X1−X2∣)

若已知连续变量的概密与离散变量的分布，则“(连，离)→连”“(连，离)\rightarrow连”“(连，离)→连”的分布函数还是可以积分求得的

“(连，离)→连”“(连，离)\rightarrow连”“(连，离)→连”常用全概率公式，但如果变量不相互独立，则不可以全概率展开

“(离，离)→离”“(离，离)\rightarrow离”“(离，离)→离”常用完备事件展开

5 多维随机变量函数的分布

对于联合分布F(x,y)F(x,y)F(x,y)的求解，常用的几种方式：

积分：知道f(x,y)f(x,y)f(x,y)，直接在对应区域上求积分
独立性：若F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y)，且分布X,YX,YX,Y相互独立，又已知FX(x),FY(y)F_X(x),F_Y(y)FX(x),FY(y)，则有F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)F(x,y)=FX(x)FY(y)
未知转化成已知：

若不知道f(x,y)f(x,y)f(x,y)，且F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y)，X,YX,YX,Y由一些其余的分布X1,X2,⋯,XkX_1,X_2,\cdots, X_kX1,X2,⋯,Xk构成，若最后可转化为已知概密的联合分布（比如最后转化为了F(x,y)=P(X1≤x,X2≤y)F(x,y)=P(X_1 \leq x,X_2 \leq y)F(x,y)=P(X1≤x,X2≤y)，且已知联合概密fX1X2(x,y)f_{X_1X_2}(x,y)fX1X2(x,y)），那么就在这个已知联合概密上积分求解

对于联合密度函数f(x,y)f(x,y)f(x,y)的求解，常用的几种方式：

求导
独立性

注意联合概率密度函数没有”用已知求未知“的方法，因为分布函数有F(x,y)=P(X≤x,Y≤y)F(x,y)=P(X \leq x,Y \leq y)F(x,y)=P(X≤x,Y≤y)的定义，所以方便已知求未知，但是概率密度函数则没有。所以面对分布之间有已知关系，但是联合密度与联合分布均未知时，优先考虑计算联合分布。

但是有些联合分布是求不出来的，这种情况下要考虑是否真的有必要求联合分布。（如想利用F(x,y)=独FX(x)FY(y)F(x,y)\stackrel{\mathrm{独}}{=}F_X(x)F_Y(y)F(x,y)=独FX(x)FY(y)进行独立性判断，但是有时F(x,y)F(x,y)F(x,y)就是求不出来，此时可考虑用别的方法）

注意对于特殊多维随机变量函数max⁡,min⁡\max,\minmax,min的处理，简单的可以用公式，复杂的还是要理解推导的：

且注意对于概率P(X≤x,Y≤y)P(X \leq x,Y \leq y)P(X≤x,Y≤y)，其内部相当于积事件P(AB)P(AB)P(AB)，而不是和事件P(A+B)P(A+B)P(A+B)

由于分布函数的FZ(z)F_Z(z)FZ(z)的概率形式是P(Z≤z)P(Z \leq z)P(Z≤z)，所以常遇见的都是P(max⁡{X,Y}≤z)或P(min⁡{X,Y}≤z)P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} \leq z )P(max{X,Y}≤z)或P(min{X,Y}≤z)，且要注意是否有独立条件。

对于不常见的P(max⁡{X,Y}>z)或P(min⁡{X,Y}>z)P(\max\{X,Y\} > z )或P(\min\{X,Y\} > z )P(max{X,Y}>z)或P(min{X,Y}>z)，最终一般还是需要变成1−P(max⁡{X,Y}≤z)或1−P(min⁡{X,Y}≤z)1-P(\max\{X,Y\} \leq z )或1-P(\min\{X,Y\} \leq z )1−P(max{X,Y}≤z)或1−P(min{X,Y}≤z)即可。事实上，两种形态随意转换，一般哪种简单用哪种。但是从计算的角度来讲，只用到联合分布是比较方便的（如果独立就更方便了，联合分布为各分布的积），所以最常用的还是P(max⁡{X,Y}≤z)或P(min⁡{X,Y}>z)P(\max\{X,Y\} \leq z )或P(\min\{X,Y\} > z )P(max{X,Y}≤z)或P(min{X,Y}>z)形态

max⁡\maxmax函数：

max⁡{X,Y}≤z⇔{X≤z}∩{Y≤z}max⁡{X,Y}>z⇔{X>z}∪{Y>z}\begin{aligned} &\max\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cap \{Y \leq z\}\\ &\max\{X,Y\} > z \Leftrightarrow\{X > z\} \cup \{Y > z\}\\ \end{aligned} max{X,Y}≤z⇔{X≤z}∩{Y≤z}max{X,Y}>z⇔{X>z}∪{Y>z}

即有：

P(max⁡{X,Y}≤z)=P({X≤z}∩{Y≤z})=P(X≤z,Y≤z)=F(z,z)=独FX(z)FY(z)P(\max\{X,Y\} \leq z )=P(\{X \leq z\} \cap \{Y \leq z\})=P(X \leq z,Y \leq z)=F(z,z)\stackrel{\mathrm{独}}{=}F_X(z)F_Y(z) P(max{X,Y}≤z)=P({X≤z}∩{Y≤z})=P(X≤z,Y≤z)=F(z,z)=独FX(z)FY(z)

min⁡\minmin函数：

min⁡{X,Y}≤z⇔{X≤z}∪{Y≤z}={X≤z}+{Y≤z}−{{X≤z}∩{Y≤z}}min⁡{X,Y}>z⇔{X>z}∩{Y>z}\begin{aligned} &\min\{X,Y\} \leq z \Leftrightarrow\{X \leq z\} \cup \{Y \leq z\} = \{X \leq z\}+\{Y \leq z\} -\{\{X \leq z\} \cap \{Y \leq z\}\}\\ &\min\{X,Y\} > z \Leftrightarrow\{X > z\} \cap \{Y > z\}\\ \end{aligned} min{X,Y}≤z⇔{X≤z}∪{Y≤z}={X≤z}+{Y≤z}−{{X≤z}∩{Y≤z}}min{X,Y}>z⇔{X>z}∩{Y>z}

即有：

P(min⁡{X,Y}≤z)=FX(z)+FZ(z)−FXY(z,z)P(\min\{X,Y\} \leq z )=F_X(z)+F_Z(z)-F_{XY}(z,z) P(min{X,Y}≤z)=FX(z)+FZ(z)−FXY(z,z)

特别地，当X,YX,YX,Y相互独立时有：

P(min⁡{X,Y}≤z)=1−P(min⁡{X,Y}>z)=1−P(X>z)P(Y>z)=1−[1−FX(z)][1−FY(z)]P(\min\{X,Y\} \leq z )=1-P(\min\{X,Y\} > z )=1-P(X>z)P(Y>z)=1-[1-F_X(z)][1-F_Y(z)] P(min{X,Y}≤z)=1−P(min{X,Y}>z)=1−P(X>z)P(Y>z)=1−[1−FX(z)][1−FY(z)]

真正常用的还是max⁡{X,Y}≤z\max\{X,Y\} \leq zmax{X,Y}≤z或者min⁡{X,Y}≤z\min\{X,Y\} \leq zmin{X,Y}≤z，毕竟与分布函数相联系，其余的两种情况类似

例：已知X1,X2X_1,X_2X1,X2的分布函数F(x)F(x)F(x)，且X=max⁡{X1,X2},Y=min⁡{X1,X2}X=\max\{X_1,X_2\},Y=\min\{X_1,X_2\}X=max{X1,X2},Y=min{X1,X2}，求(X,Y)(X,Y)(X,Y)的分布函数F(x,y)F(x,y)F(x,y)：

解：易有：

F(x,y)=P(max⁡{X1,X2}≤x,min⁡{X1,X2}≤y)=P({X1≤x}∩{X2≤x}∩{{X1≤y}∪{X2≤y}})\begin{aligned} &F(x,y)=P(\max\{X_1,X_2\}\leq x,\min\{X_1,X_2\}\leq y)=P(\{X_1 \leq x\}\cap\{X_2 \leq x\}\cap\{\{X_1 \leq y\}\cup\{X_2 \leq y\}\})\\ \end{aligned} F(x,y)=P(max{X1,X2}≤x,min{X1,X2}≤y)=P({X1≤x}∩{X2≤x}∩{{X1≤y}∪{X2≤y}})

令：{X1≤x},{X2≤x},{X1≤y},{X2≤y}\{X_1 \leq x\},\{X_2 \leq x\},\{X_1 \leq y\},\{X_2 \leq y\}{X1≤x},{X2≤x},{X1≤y},{X2≤y}分别为A,B,C,DA,B,C,DA,B,C,D，有：

F(x,y)=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)−P(ABCD)=P(AC)P(B)+P(BD)P(A)−P(AC)P(BD)\begin{aligned} F(x,y)&=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)-P(ABCD)\\ &=P(AC)P(B)+P(BD)P(A)-P(AC)P(BD)\\ \end{aligned} F(x,y)=P(AB(C+D))=P(ABC+ABD)=P(ABC)+P(ABD)−P(ABCD)=P(AC)P(B)+P(BD)P(A)−P(AC)P(BD)

接下来分类讨论。x≤yx \leq yx≤y时，P(AC)=P(A),P(BD)=P(B)P(AC)=P(A),P(BD)=P(B)P(AC)=P(A),P(BD)=P(B)；当x>yx>yx>y时，P(AC)=P(C),P(BD)=P(D)P(AC)=P(C),P(BD)=P(D)P(AC)=P(C),P(BD)=P(D)。

注意常见的题目，若已知随机变量XXX的分布函数fX(x)f_X(x)fX(x)，又知道随机变量XXX与YYY的关系Y=g(X)Y=g(X)Y=g(X)，与反函数g−1(Y)g^{-1}(Y)g−1(Y)，若让求YYY的分布函数，那么显然用

P(Y≤y)=P(g(X)≤y)=P(X≤g−1(y))P(Y \leq y)=P(g(X) \leq y)=P(X \leq g^{-1}(y)) P(Y≤y)=P(g(X)≤y)=P(X≤g−1(y))

注意这里关于P(X≤g−1(y))P(X \leq g^{-1}(y))P(X≤g−1(y))的求解，不要直接由fX(x)f_X(x)fX(x)积分，而是要实现求出分布函数FX(x)F_X(x)FX(x)，再代入分布函数。因为由于一般来讲都要根据g−1(y)g^{-1}(y)g−1(y)的值分段讨论，有的甚至能分4,5个段以上，重复求4,5个积分及其麻烦，不如事先求好分布函数再代入。

拓展：对于已知(X,Y)(X,Y)(X,Y)的联合分布密度f(x,y)f(x,y)f(x,y)，与ZZZ的分布律，让求U=X+Y+ZU=X+Y+ZU=X+Y+Z的分布函数，那么可以先令V=X+YV=X+YV=X+Y，利用f(x,y)f(x,y)f(x,y)求FV(v)F_V(v)FV(v)，那么就变成了求U=V+ZU=V+ZU=V+Z的分布函数，剩下的参考上面内容

6 数字特征

常用的分布及数字特征：

\begin{array}{ccc}
\hline
分布&期望&方差\
\hline
B(1,p)&p&p(1-p)\
B(n,p)&np&np(1-p)\
p(\lambda)& \lambda & \lambda \
U(a,b)&\frac{a+b}{2}&\frac{(b-a)^2}{12}\
E( \lambda )&\frac{1}{ \lambda }&\frac{1}{ \lambda ^2}\
G§&\frac{1}{p}&\frac{1}{p^2}\
H(N,M,n)&\frac{nM}{N}&\frac{nM}{N}(1-\frac{M}{N})\frac{N-n}{N-1}\
\chi^2(n)&n&2n\
t(n)&0&\frac{n}{n-2}\
\hline

\end{array}

超几何分布H(N,M,n)H(N,M,n)H(N,M,n)：NNN件物品中，MMM个指定类，抽nnn次（不放回），抽到指定类的次数的概率：

P(x=k)=CMkCN−Mn−kCNn,k=0,1,⋯,min⁡{n,m}P(x=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},\quad k=0,1,\cdots,\min\{n,m\} P(x=k)=CNnCMkCN−Mn−k,k=0,1,⋯,min{n,m}

求Y=g(X)Y=g(X)Y=g(X)的均值，即可以考虑先求YYY的分布，再求均值，也可以考虑利用公式E(g(x))=∫−∞+∞g(x)f(x)dxE(g(x))=\int_{-\infty}^{+\infty}g(x)f(x)dxE(g(x))=∫−∞+∞g(x)f(x)dx求解

分布律P(xi)=pi,i=1,2,⋯,∞P(x_i)=p_i,\quad i=1,2,\cdots,\inftyP(xi)=pi,i=1,2,⋯,∞的期望存在的充要条件是∑i=1∞anpn\sum\limits_{i=1}^{\infty}a_np_ni=1∑∞anpn绝对收敛

若分布X,YX,YX,Y的相关系数为±1\pm 1±1，则二者满足Y=aX+bY=aX+bY=aX+b，具体a,ba,ba,b可用数字特征求解

若相关系数存在，且f(x,y)=f(−x,y)f(x,y)=f(-x,y)f(x,y)=f(−x,y)或f(x,y)=f(x,−y)f(x,y)=f(x,-y)f(x,y)=f(x,−y)，则二者相关系数系数为0

对于二维均匀分布，若区域DDD为矩形，则X，YX，YX，Y独立，反之则不独立。若DDD关于xxx轴或yyy轴对称，则X，YX，YX，Y不相关

方差D(X)D(X)D(X)并没有专门的积分公式进行求解，但是可以用积分求解E(X)E(X)E(X)与E(X2)E(X^2)E(X2)，再用D(X)=E(X2)−E2(X)D(X)=E(X^2)-E^2(X)D(X)=E(X2)−E2(X)

注意牛顿二项式公式：(p+q)n=∑k=0nCnkpkqn−k(p+q)^n=\sum\limits_{k=0}^{n}C_n^kp^kq^{n-k}(p+q)n=k=0∑nCnkpkqn−k，注意其与伯努利分布的结合

如：X∼B(n,p),Y=eXX \sim B(n,p),Y=e^XX∼B(n,p),Y=eX，则：

EY=∑k=0nekpk(1−p)n−k=∑k=0n(pe)k(1−p)n−k=(pe+1−p)nEY=\sum\limits_{k=0}^{n}e^kp^k(1-p)^{n-k}=\sum\limits_{k=0}^{n}(pe)^k(1-p)^{n-k}=(pe+1-p)^n EY=k=0∑nekpk(1−p)n−k=k=0∑n(pe)k(1−p)n−k=(pe+1−p)n

当让求和式之间的协方差时（如COV(X,X+Y)\text{COV}(X,X+Y)COV(X,X+Y)），可以考虑利用协方差计算的性质；但是若计算乘式之间的协方差时（如COV(X,XY)\text{COV}(X,XY)COV(X,XY)），则需要考虑公式COV(X,Y)=E(XY)−E(X)E(Y)\text{COV}(X,Y)=E(XY)-E(X)E(Y)COV(X,Y)=E(XY)−E(X)E(Y)

让求二维正态分布的相关系数，勿忘凑二维正态分布的相关系数矩阵形式：

f(x,y)=12πσ1σ21−ρ2exp⁡{12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)(y−μ2)σ1σ2+(y−μ2)2σ22]}f(x,y)=\frac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\{\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\} f(x,y)=2πσ1σ21−ρ21exp{2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]}

7 大数定理与中心极限定理

一共有3个大数定律，三者归根到底都是在讲一定条件下：

1n∑i=1nXi⟶p1n∑i=1nEXi\frac{1}{n}\sum\limits_{i=1}^{n}X_i\stackrel{p}\longrightarrow \frac{1}{n}\sum\limits_{i=1}^{n}EX_i n1i=1∑nXi⟶pn1i=1∑nEXi

即用样本均值来逼近分布均值

三种大数定理及其条件：

切比雪夫大数定理条件
1. 独立（并未要求同分布）
2. 方差一致且有上界（有方差）
伯努利大数定理

可由切比雪夫大数定理推得，很少用
辛钦大数定理：

$$
\begin{aligned}
\forall \epsilon>0,\quad

&\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|<\epsilon}=1或\
&\lim\limits_{n \rightarrow \infty}P{|\frac{1}{n}\sum\limits_{i=1}^{n}X_i-\mu|\geq\epsilon}=0\
\end{aligned}
$$

条件：
1. 独立；
2. 同分布；
3. 期望存在（并未要求方差存在，方差不存在指方差趋近于∞\infty∞）

注意切比雪夫不等式与辛钦大数定理由于PPP中含有绝对值，所以有时用之前应该凑一下形式，补一下绝对值号，才能看出来

中心极限定理：

lim⁡n→∞1n∑i=1nXi=X‾⟶pN(μ,σ2n)或：lim⁡n→∞∑i=1nXi⟶pN(nμ,nσ2)\begin{aligned} &\lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}X_i=\overline{X} \stackrel{p}\longrightarrow N(\mu,\frac{\sigma^2}{n})\quad或：\\ &\lim\limits_{n \rightarrow \infty}\sum\limits_{i=1}^{n}X_i \stackrel{p}\longrightarrow N(n\mu,n\sigma^2)\\ \end{aligned} n→∞limn1i=1∑nXi=X⟶pN(μ,nσ2)或：n→∞limi=1∑nXi⟶pN(nμ,nσ2)

具体应用时记住，只要题目涉及独立同分布随机变量的和∑X\sum\limits_{}^{}X∑X，就要考虑这个中心极限定理

如：知道每个元器件正常工作的概率为ppp，求n个元器件一起工作时，至少m个正常工作的概率，那么就是∑1100Xi∼N(np,np(1−p))\sum\limits_{1}^{100}X_i \sim N(np,np(1-p))1∑100Xi∼N(np,np(1−p))，然后再求P(∑1100Xi≥m)P(\sum\limits_{1}^{100}X_i \geq m)P(1∑100Xi≥m)即可（转化为标准正态分布）

题目要证明依概率收敛的话，可以考虑用切比雪夫不等式，令n→∞n \rightarrow \inftyn→∞时，取极限为0或1

若果题目是问依概率收敛为何值，那么已经默认是收敛，就不用切比雪夫不等式，应该利用结论：若XiX_iXi独立同分布，则E(Xi2)E(X_i^2)E(Xi2)存在，且有lim⁡n→∞1n∑i=1n⟶pE(Xik)\lim\limits_{n \rightarrow \infty}\frac{1}{n}\sum\limits_{i=1}^{n}\stackrel{p}\longrightarrow E(X_i^k)n→∞limn1i=1∑n⟶pE(Xik)，将原式子展开分别去求即可

切比雪夫不等式并没有n→∞n \rightarrow \inftyn→∞的要求

8 统计量及其分布

S2S^2S2为σ2\sigma^2σ2的无偏估计与一致估计，SSS为σ\sigmaσ的无偏估计，但不一定是一致估计

本章涉及的分布多是∑X2\sum X^2∑X2类型的，要是有(∑X)2(\sum X)^2(∑X)2的，那么考虑分布Y=∑XY=\sum XY=∑X，进而求Y2Y^2Y2的分布

均值与方差的统计特征：

E(X‾)=E(X),D(X‾)=D(X)nE(S2)=D(X)\begin{aligned} &E(\overline X)=E(X),\quad D(\overline X)=\frac{D(X)}{n}\\ &E(S^2)=D(X)\\ \end{aligned} E(X)=E(X),D(X)=nD(X)E(S2)=D(X)

特别地，若是有Xi∼N(μ,σ2)X_i \sim N(\mu,\sigma^2)Xi∼N(μ,σ2)，则有(n−1)S2σ2∼χ2(n−1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1)，则此时可求D(S2)D(S^2)D(S2)，但如果是一般性的分布，其方差就不一定有这个性质了；同理，对于正态分布的D(Xˉ2)D(\bar X^2)D(Xˉ2)也可以利用χ(n)\chi(n)χ(n)分布来进行计算。

来自正态分布总体的样本的均值与方差相互独立，这一点有时可以帮助分布之间的独立性：

例：设X1,X2X_1,X_2X1,X2是来自正态总体的简单随机样本，证明(X1+X2)2(X_1+X_2)^2(X1+X2)2与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立

解：易有Xˉ=X1+X22\bar X=\frac{X_1+X_2}{2}Xˉ=2X1+X2与方差S2S^2S2相互独立，而：

S2=∑i=1n(Xi−Xˉ)2n−1=(X1−X1+X22)2+(X2−X1+X22)2=(X1−X2)22S^2=\frac{ \sum\limits_{i=1}^{n}(X_i-\bar X)^2}{n-1}=(X_1-\frac{X_1+X_2}{2})^2+(X_2-\frac{X_1+X_2}{2})^2=\frac{(X_1-X_2)^2}{2} S2=n−1i=1∑n(Xi−Xˉ)2=(X1−2X1+X2)2+(X2−2X1+X2)2=2(X1−X2)2

所以(X1+X2)(X_1+X_2)(X1+X2)与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立，即(X1+X2)2(X_1+X_2)^2(X1+X2)2与(X1−X2)2(X_1-X_2)^2(X1−X2)2相互独立

χ2(2)\chi^2(2)χ2(2)与E(12)E(\frac{1}{2})E(21)的概率密度函数相同

9 参数估计与假设检验

区分好α\alphaα——显著性水平，与1−α1-\alpha1−α——置信水平

区间估计与假设检验的核心公式：

估μ{(X‾−σnZα1,X‾+σnZα2)(X‾−Sntα1(n−1),X‾+Sntα1(n−1)α1+α2=1Φ(Zα1)=1−α1,Φ(Zα2)=1−α2估\mu\begin{cases} &(\overline X-\frac{\sigma}{\sqrt{n}}Z_{\alpha_1},\overline X+\frac{\sigma}{\sqrt{n}}Z_{\alpha_2})\\ &(\overline X-\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1),\overline X+\frac{S}{\sqrt{n}}t_{\alpha_1}(n-1)\\ &\alpha_1+\alpha_2=1\\ &\Phi(Z\alpha_1)=1-\alpha_1, \quad \Phi(Z\alpha_2)=1-\alpha_2\\ \end{cases} 估μ⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧(X−nσZα1,X+nσZα2)(X−nStα1(n−1),X+nStα1(n−1)α1+α2=1Φ(Zα1)=1−α1,Φ(Zα2)=1−α2

若是令α1=α2=α2\alpha_1=\alpha_2=\frac{\alpha}{2}α1=α2=2α，则称其为等尾置信区间，最为常用

假设检验是在区间估计的基础上推导的。共2(1+2)=62(1+2)=62(1+2)=6种。

假设检验的假设一般是两个对立假设成对出现，即原假设H0H_0H0，对立假设H1H_1H1，其中原假设必须包含等号，H1H_1H1对应的区间为拒绝域。

为了简便起见，以下仅讨论知道σ2\sigma^2σ2的等尾置信区间：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QM0vVlFj-1668578412518)(https://s3-us-west-2.amazonaws.com/secure.notion-static.com/a6a61ea0-97cf-4176-bfbf-6cc116d2fba9/Untitled.png)]

那么对应的H0H_0H0，H1H_1H1及拒绝域为：

H0H1拒绝域μ=μ0μ≠μ0U1+U2μ≥μ0μ<μ0U1μ≤μ0μ>μ0U2\begin{array}{ccc}\hline H_0&H_1&拒绝域\\ \hline \mu=\mu_0&\mu \neq\mu_0&U_1+U_2\\ \mu \geq \mu_0&\mu<\mu_0&U_1\\ \mu \leq \mu_0&\mu> \mu_0&U_2\\ \hline\end{array} H0μ=μ0μ≥μ0μ≤μ0H1μ=μ0μ<μ0μ>μ0拒绝域U1+U2U1U2

有效是在无偏的基础上，故题目让判断是否有效，应先判断是否无偏

原假设必须包含等号，有一类题目会让检验什么东西，且这个东西不一定就要是原假设

如果分布XXX为偶函数（如学生氏分布），则有X1−α=−XαX_{1-\alpha}=-X_\alphaX1−α=−Xα

什么时候用二阶矩：

包含双参数，那么可以考虑通过一二阶矩方程构建方程组求解
虽然只有单参数，但是仅由一阶矩方程无法解出（如超越方程），此时可考虑建立二阶矩方程

注意第一类错误率与第二类错误率的计算式实际上就是条件概率，直接计算即可：

例：设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体X∼N(μ,1)X \sim N(\mu,1)X∼N(μ,1)的随机样本，Xˉ\bar XXˉ为样本均值，证明对于假设检验H0:μ=μ0H_0:\mu=\mu_0H0:μ=μ0，若取拒绝域Rα={Xˉ>μ0+1.96n}R_\alpha=\{\bar X > \mu_0+\frac{1.96}{\sqrt{n}}\}Rα={Xˉ>μ0+n1.96}，则第一类错误率α\alphaα为1−Φ(1.96)1- \Phi(1.96)1−Φ(1.96)：

解：易有：

α=P{拒绝H0∣H0为真}=P{Xˉ>μ0+1.96n∣μ=μ0}\alpha=P\{拒绝H_0|H_0为真\}=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}|\mu=\mu_0\} α=P{拒绝H0∣H0为真}=P{Xˉ>μ0+n1.96∣μ=μ0}

当μ=μ0\mu=\mu_0μ=μ0

α=P{Xˉ>μ0+1.96n}=1−P{Xˉ−μ01n≤1.96}=1−Φ(1.96)\alpha=P\{\bar X>\mu_0+\frac{1.96}{\sqrt{n}}\}=1-P\{\frac{\bar X-\mu_0}{\sqrt{\frac{1}{n}}} \leq 1.96\}=1-\Phi(1.96) α=P{Xˉ>μ0+n1.96}=1−P{n1Xˉ−μ0≤1.96}=1−Φ(1.96)

注意，若θ\thetaθ的置信区间为(a,b)(a,b)(a,b)的置信度为ppp，那么有公式P(a<θ<b)=pP(a<\theta<b)=pP(a<θ<b)=p

概率论与数理统计——常用结论相关推荐

概率论与数理统计常用英文词汇对照
概率论与数理统计常用英文词汇对照 Probability Theory 概率论 Trial 试验 intersection交 union 并 frequency 频率 difference 差 add ...
[概率论与数理统计] 常用定义与公式
随机事件运算律交换律: AUB = BUA AB = BA 结合律 (AUB)UC = AU(BUC) = AUBUC (AB)C = A(BC) = ABC 分配律 A(BUC) = ABUAC ...
概率论与数理统计——常用的概率分布表
概率论与数理统计【二】随机事件与概率(2) - 常用求概率公式与例题两道
本节为概率论与数理统计复习笔记的第二节,随机事件与概率(2),主要包括:加法公式.减法公式.条件概率公式.乘法公式.全概率公式.贝叶斯公式以及两道例题. 1.常用的求概率公式 1.加法公式 P(A∪B ...
概率论由相关性求数学期望和方差的公式_2020.3.30 | 考研数学—概率论与数理统计：各章节考试重点...
考研数学有两大重点,基础要打好,练习要多做,错题要巩固.下面来看下有关概率论与数理统计相关复习内容,一起来学习吧! 一.概率与数理统计学科的特点(1)研究对象是随机现象高数是研究确定的现象,而概率研究 ...
概率论与数理统计复习
文章目录第一章随机事件及其概率随机事件频率与概率古典概型与几何概型条件概率与事件的独立性全概率公式与贝叶斯公式第二章随机变量及其分布随机变量的概念常用分布表(随机变量的离散连续与 ...
概率论与数理统计(Probability Statistics I)
Table of Contents 概率论的基本概念(The Basic Concept of Probability Theory) 随机变量及其分布(Random Variable and Its ...
1 - 概率论与数理统计
1 - 概率论与数理统计文章目录 1 - 概率论与数理统计一.随机事件与概率 1)集合的运算法则 2)概率的基本运算与公式 3)独立与对立 1. 两事件相互独立 2. 三事件两两独立 3. 三事件 ...
【2020/07/16修订】概率论与数理统计（电子科技大学）知识梳理 · 第一版（1到8章 · 度盘）
概率论与数理统计知识梳理 (第一版) 建议先修课程:高等数学(微积分) 配套课程: 1.慕课(MOOC):概率论与数理统计(电子科技大学) 2.教材:概率论与数理统计电子科技大学应用数学学院 ...
概率论与数理统计-下篇
概率论与数理统计-下篇 4 一维随机变量 4.1 分布函数 4.1.1 定义与充要条件定义: FX(x)=P{X⩽x},x∈RF_{_{X}}(x)=P\{X\leqslant x\}\ ,\ x\ ...

概率论与数理统计——常用结论