概率论与数理统计-下篇

4 一维随机变量

4.1 分布函数

4.1.1 定义与充要条件

定义:

FX(x)=P{X⩽x},x∈RF_{_{X}}(x)=P\{X\leqslant x\}\ ,\ x\in\mathbb{R}FX​​(x)=P{X⩽x} , x∈R

充要条件:

  1. 值域:0=F(−∞)⩽F(x)⩽F(+∞)=10=F(-\infty)\leqslant F(x) \leqslant F(+\infty)=10=F(−∞)⩽F(x)⩽F(+∞)=1

  2. 单调不减:∀x1<x2,F(x1)⩽F(x2)\forall x_1<x_2\ ,\ F(x_1)\leqslant F(x_2)∀x1​<x2​ , F(x1​)⩽F(x2​)

  3. 右连续性:F(x)=F(x+0)F(x)=F(x+0)F(x)=F(x+0)

4.1.2 概率计算

∀x∈R,P{X=x0}=F(x0)−F(x0−0)=F∈C(U(x0,δ))0\forall x\in\mathbb{R},\ P\{X=x_0\}=F(x_0)-F(x_0-0)\xlongequal{F\in C(U(x_0,\delta))}0∀x∈R, P{X=x0​}=F(x0​)−F(x0​−0)F∈C(U(x0​,δ))0

∀x1<x2,P{x1<X⩽x2}=P{X⩽x2}−P{X⩽x1}=F(x2)−F(x1)\forall x_1<x_2,\ P\{x_1<X\leqslant x_2\}=P\{X\leqslant x_2\}-P\{X\leqslant x_1\}=F(x_2)-F(x_1)∀x1​<x2​, P{x1​<X⩽x2​}=P{X⩽x2​}−P{X⩽x1​}=F(x2​)−F(x1​)

4.1.3 分布函数判别

  1. F(ax+b),a>0F(ax+b),a>0F(ax+b),a>0 仍为分布函数,a<0a<0a<0 不是分布函数.

  2. a1F(x)+a2F(x),a1+a2=1,ai⩾0a_1F(x)+a_2F(x),a_1+a_2=1,a_i\geqslant 0a1​F(x)+a2​F(x),a1​+a2​=1,ai​⩾0 仍为分布函数.

  3. F1(x)F2(x),1−[1−F1(x)][1−F2(x)]F_1(x)F_2(x)\ ,\ 1-[1-F_1(x)][1-F_2(x)]F1​(x)F2​(x) , 1−[1−F1​(x)][1−F2​(x)] 仍为分布函数.

4.1.4 最值函数

最大值:
FZ(z)=P{max⁡(X,Y)⩽z}=P{X⩽z,Y⩽z}=X,Y互独P{X⩽z}P{Y⩽z}=FX(z)FY(z)=X,Y同分布[FX(z)]2\begin{aligned} F_{_Z}(z)&=P\{\max(X,Y)\leqslant z\}=P\{X\leqslant z,Y\leqslant z\} \\&\xlongequal{X,Y互独}P\{X\leqslant z\}P\{Y\leqslant z\} =F_{_X}(z)F_{_Y}(z) \\&\xlongequal{X,Y同分布}[F_{_X}(z)]^2 \end{aligned}FZ​​(z)​=P{max(X,Y)⩽z}=P{X⩽z,Y⩽z}X,Y互独P{X⩽z}P{Y⩽z}=FX​​(z)FY​​(z)X,Y同分布[FX​​(z)]2​

U=max⁡{X1,X2,⋯,Xn},FU(x)=Xi独立同分布[FX(x)]nU=\max\{X_1,X_2,\cdots,X_n\}\ ,\ F_{_U}(x)\xlongequal{X_i独立同分布}[F_{_X}(x)]^nU=max{X1​,X2​,⋯,Xn​} , FU​​(x)Xi​独立同分布[FX​​(x)]n

最小值:
FZ(z)=P{min⁡(X,Y)⩽z}=P{(X⩽z)∪(Y⩽z)}=X,Y互独P{X⩽z}+P{Y⩽z}−P{X⩽z,Y⩽z}=FX(z)+FY(z)−F(z,z)=X,Y互独FX(z)+FY(z)−FX(z)FY(z)\begin{aligned} F_Z(z)&=P\{\min(X,Y)\leqslant z\}=P\{(X\leqslant z)\cup (Y\leqslant z)\} \\&\xlongequal{X,Y互独}P\{X\leqslant z\}+P\{Y\leqslant z\}-P\{X\leqslant z,Y\leqslant z\} \\&=F_X(z)+F_Y(z)-F(z,z) \\&\xlongequal{X,Y互独}F_X(z)+F_Y(z)-F_X(z)F_Y(z) \end{aligned}FZ​(z)​=P{min(X,Y)⩽z}=P{(X⩽z)∪(Y⩽z)}X,Y互独P{X⩽z}+P{Y⩽z}−P{X⩽z,Y⩽z}=FX​(z)+FY​(z)−F(z,z)X,Y互独FX​(z)+FY​(z)−FX​(z)FY​(z)​

FZ(z)=P{min⁡(X,Y)⩽z}=1−P{X>z,Y>z}=X,Y互独1−P{X>z}P{Y>z}=1−[1−FX(z)][1−FY(z)]=X,Y互独1−[1−FX(z)]2\begin{aligned} F_{_Z}(z)&=P\{\min(X,Y)\leqslant z\}=1-P\{X>z,Y>z\} \\&\xlongequal{X,Y互独}1-P\{X>z\}P\{Y>z\} \\&=1-[1-F_{_X}(z)][1-F_{_Y}(z)]\xlongequal{X,Y互独}1-[1-F_{_X}(z)]^2 \end{aligned}FZ​​(z)​=P{min(X,Y)⩽z}=1−P{X>z,Y>z}X,Y互独1−P{X>z}P{Y>z}=1−[1−FX​​(z)][1−FY​​(z)]X,Y互独1−[1−FX​​(z)]2​

V=max⁡{X1,X2,⋯,Xn},FV(x)=Xi独立同分布1−[1−FX(x)]nV=\max\{X_1,X_2,\cdots,X_n\}\ ,F_{_V}(x)\xlongequal{X_i\ 独立同分布}1-[1-F_{_X}(x)]^nV=max{X1​,X2​,⋯,Xn​} ,FV​​(x)Xi​ 独立同分布1−[1−FX​​(x)]n

4.2 随机变量

4.2.1 离散型

4.2.1.1 分布律及充要条件

X∼P{X=xi}=pi(i∈N+)⇔{非负性:pi⩾0正则性(规范性):∑i=1∞pi=1X\sim P\{X=x_i\}=p_i\ (i\in\mathbb{N}^+)\ \Leftrightarrow \left\{\begin{array}{l} 非负性:p_i\geqslant 0\\ \displaystyle 正则性(规范性):\sum\limits_{i=1}^{\infty}p_i=1\\ \end{array}\right. X∼P{X=xi​}=pi​ (i∈N+) ⇔⎩⎨⎧​非负性:pi​⩾0正则性(规范性):i=1∑∞​pi​=1​

4.2.1.2 分布函数

F(x)=P{X⩽x}=∑xi⩽xP{X=xi}F(x)=P\{X\leqslant x\}=\sum_{x_i\leqslant x}P\{X=x_i\}F(x)=P{X⩽x}=xi​⩽x∑​P{X=xi​}

4.2.2 连续型

4.2.2.1 概率密度

充要条件:
X∼fX(x)⇔{非负性:f(x)⩾0正则性(规范性):∫−∞+∞f(x)dx=1X\sim f_{_X}(x) \Leftrightarrow \left\{\begin{array}{l} 非负性: f(x) \geqslant 0\\ 正则性(规范性): \displaystyle\int_{-\infty}^{+\infty}f(x)\mathrm{d}x=1\\ \end{array}\right. X∼fX​​(x)⇔⎩⎨⎧​非负性:f(x)⩾0正则性(规范性):∫−∞+∞​f(x)dx=1​

性质:

  1. ∀x1<x2,P{x1<X⩽x2}=F(x2)−F(x1)=∫x1x2f(t)dt\displaystyle \forall x_1<x_2\ ,P\{x_1<X\leqslant x_2\}=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(t)\mathrm{d}t∀x1​<x2​ ,P{x1​<X⩽x2​}=F(x2​)−F(x1​)=∫x1​x2​​f(t)dt

  2. 有限个点不影响区间面积,即概率,故
    (1) P{X=x0}=F(x0)−F(x0−0)=F在x0处连续0P\{X=x_0\}=F(x_0)-F(x_0-0)\xlongequal{F在x_0处连续} 0P{X=x0​}=F(x0​)−F(x0​−0)F在x0​处连续0
    (2) P{a<X<b}=P{a⩽x⩽b}=P{a<x⩽b}=P{a⩽x<b}P\{a<X<b\}=P\{a\leqslant x\leqslant b\}=P\{a<x\leqslant b\}=P\{a\leqslant x<b\}P{a<X<b}=P{a⩽x⩽b}=P{a<x⩽b}=P{a⩽x<b}

  3. f(x)f(x)f(x) 在 xxx 处连续,则 F′(x)=f(x)F'(x)=f(x)F′(x)=f(x)

  4. (1) F(x)F(x)F(x) 必连续,f(x)f(x)f(x) 未必(函数连续可积性质)
    (2) F(x)F(x)F(x) 不连续则非连续型,无概率密度.
    例如:F(x)={0,x<0x/2,0⩽x<11,x⩾1,P{X=1}=F(1)−F(1−0)=12\displaystyle F(x)=\left\{ \begin{array}{l}0\quad,x<0\\ x/2,0\leqslant x<1\\1\quad,x\geqslant 1\\\end{array}\right.,P\{X=1\}=F(1)-F(1-0)=\frac{1}{2}F(x)=⎩⎨⎧​0,x<0x/2,0⩽x<11,x⩾1​,P{X=1}=F(1)−F(1−0)=21​ 为混合型.

概率密度判别:

  1. af(ax+b)af(ax+b)af(ax+b) 仍为密度,因为 ∫−∞+∞f(ax+b)d(ax+b)=1\displaystyle \int_{-\infty}^{+\infty}f(ax+b)\mathrm{d}(ax+b)=1∫−∞+∞​f(ax+b)d(ax+b)=1.

  2. a1f1(x)+a2f(x2),a1+a2=1,ai⩾0a_1f_1(x)+a_2f(x_2),a_1+a_2=1,a_i \geqslant 0a1​f1​(x)+a2​f(x2​),a1​+a2​=1,ai​⩾0 仍为密度 .

  3. f1(x)⋅f2(x)f_1(x)\cdot f_2(x)f1​(x)⋅f2​(x) 未必是密度.

  4. f1(x)F1(x)+f2(x)F2(x)=d[F1(x)F2(x)]dx\displaystyle f_1(x)F_1(x)+f_2(x)F_2(x)=\frac{\mathrm{d}[F_1(x)F_2(x)]}{\mathrm{d}x}f1​(x)F1​(x)+f2​(x)F2​(x)=dxd[F1​(x)F2​(x)]​ 仍为密度.

4.2.2.2 分布函数

F(x)=P{X⩽x}=∫−∞xf(t)dt,f(x)⩾0;P{X<x}=F(x−0)F(x)=P\{X\leqslant x\}=\int_{-\infty}^{x}f(t)\mathrm{d}t,f(x)\geqslant 0\ ; \\P\{X<x\}=F(x-0) F(x)=P{X⩽x}=∫−∞x​f(t)dt,f(x)⩾0 ;P{X<x}=F(x−0)

4.2.2.3 推论

X∼FX(x)∈C(R)⇒Y=FX(X)∼U(0,1)X\sim F_{_X}(x)\in C(\mathbb{R})\ \Rightarrow\ Y=F_{_X}(X)\sim U(0,1)X∼FX​​(x)∈C(R) ⇒ Y=FX​​(X)∼U(0,1)

proof:
∀y∈[0,1],\forall\ y\in [0,1],∀ y∈[0,1],
P{Y=FX(X)⩽y}=P{X⩽FX−1(y)}=FX[FX−1(y)]=yP\{Y=F_{_X}(X)\leqslant y\}=P\{X \leqslant F_{_X}^{-1}(y)\}=F_{_X}[F_{_X}^{-1}(y)]=y P{Y=FX​​(X)⩽y}=P{X⩽FX​−1​(y)}=FX​​[FX​−1​(y)]=y

故 Y=FX(X)∼U(0,1)Y=F_{_X}(X)\sim U(0,1)Y=FX​​(X)∼U(0,1)

4.3 Y=g(X) 概率分布

4.3.1 离散型

P{X=xi}=pi⇒Y=g(X)P{Y=g(xi)}=piP\{X=x_i\}=p_i \ \xRightarrow{\ Y=g(X)\ }\ P\{Y=g(x_i)\}=p_iP{X=xi​}=pi​  Y=g(X) ​ P{Y=g(xi​)}=pi​

4.3.2 连续型

mathod1:(图像)

Y=g(X)⊂(α,β)Y=g(X)\subset (\alpha,\beta)Y=g(X)⊂(α,β),由 Y=yY=yY=y 确定 g(X)⩽yg(X)\leqslant yg(X)⩽y 的 XXX 范围,

  1. y<α,FY(y)=0y<\alpha,F_{_Y}(y)=0y<α,FY​​(y)=0
  2. y⩾β,FY(y)=1y\geqslant \beta,F_{_Y}(y)=1y⩾β,FY​​(y)=1
  3. α⩽y<β,P{g(X)⩽y}=P{φ1(y)⩽X⩽φ2(y)}=∫φ1(y)φ2(y)fX(t)dt⇒{可积:直接计算分布函数不可积:变限积分求导,求解概率密度\displaystyle\alpha\leqslant y< \beta,P\{g(X)\leqslant y\}=P\{\varphi_1(y)\leqslant X\leqslant \varphi_2(y)\}=\int_{\varphi_1(y)}^{\varphi_2(y)}f_{_X}(t)\mathrm{d}t \\ \Rightarrow \left\{\begin{array}{l}可积:直接计算分布函数\\ 不可积:变限积分求导,求解概率密度\end{array}\right.α⩽y<β,P{g(X)⩽y}=P{φ1​(y)⩽X⩽φ2​(y)}=∫φ1​(y)φ2​(y)​fX​​(t)dt⇒{可积:直接计算分布函数不可积:变限积分求导,求解概率密度​

mathod2:(公式)
FY(y)=P{Y=g(X)⩽y}=P{X⩽g−1(y)}=FX[g−1(y)]=∫−∞g−1(y)fX(t)dtF_{_Y}(y)=P\{Y=g(X)\leqslant y\}=P\{X\leqslant g^{-1}(y)\}=F_{_X}[g^{-1}(y)]=\int_{-\infty}^{g^{-1}(y)}f_{_X}(t)\mathrm{d}t FY​​(y)=P{Y=g(X)⩽y}=P{X⩽g−1(y)}=FX​​[g−1(y)]=∫−∞g−1(y)​fX​​(t)dt

fY(y)={FY′(y)=[∫−∞g−1(y)fX(t)dt]′=fX[g−1(y)]⋅∣[g−1(y)]′∣,y∈I0,otherwisef_{_Y}(y)=\left\{\begin{array}{l} \displaystyle F_{_Y}'(y)=\left[\int_{-\infty}^{g^{-1}(y)}f_{_X}(t)\mathrm{d}t\right]'=f_{_X}[g^{-1}(y)]\cdot|[g^{-1}(y)]'|\ ,y\in I\\ 0\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\ ,\ otherwise\\\end{array}\right. fY​​(y)=⎩⎨⎧​FY​′​(y)=[∫−∞g−1(y)​fX​​(t)dt]′=fX​​[g−1(y)]⋅∣[g−1(y)]′∣ ,y∈I0 , otherwise​
Tips: 此处反函数仅展示运算过程,实际反函数未必存在。

4.3.3 混合型

不存在分布律和密度,仅求解 FY(y)F_{_Y}(y)FY​​(y).

5 二维随机变量

5.1 分布函数

5.1.1 联合分布函数

定义:
F(x,y)=P{(X⩽x)∩(Y⩽y)}=P{X⩽x,Y⩽y}(x,y∈R)F(x,y)=P\{(X\leqslant x)\cap (Y\leqslant y)\}=P\{X\leqslant x,Y\leqslant y\}\ (x,y\in\mathbb{R})F(x,y)=P{(X⩽x)∩(Y⩽y)}=P{X⩽x,Y⩽y} (x,y∈R)

值域:
0⩽F(−∞,y)F(x,−∞)F(−∞,+∞)⩽F(x,y)⩽F(−∞,+∞)=10 \leqslant \begin{array}{l}F(-\infty,y)\\F(x,-\infty)\\F(-\infty,+\infty)\end{array} \leqslant F(x,y)\leqslant F(-\infty,+\infty)=1 0⩽F(−∞,y)F(x,−∞)F(−∞,+∞)​⩽F(x,y)⩽F(−∞,+∞)=1

右连续性:
F(x,y)=F(x+0,y)=F(x,y+0)F(x,y)=F(x+0\ ,y)=F(x\ ,y+0)F(x,y)=F(x+0 ,y)=F(x ,y+0)

区域计算:
P{(X,Y)∈D}=P{x1<X⩽x2,y1<Y⩽y2}=F(x2,y2)−F(x2,y1)+F(x1,y1)−F(x1,y2)\begin{aligned} P\{(X,Y)\in D\}&=P\{x_1<X\leqslant x_2\ ,\ y_1<Y\leqslant y_2\} \\&=F(x_2,y_2)-F(x_2,y_1)+F(x_1,y_1)-F(x_1,y_2) \end{aligned}P{(X,Y)∈D}​=P{x1​<X⩽x2​ , y1​<Y⩽y2​}=F(x2​,y2​)−F(x2​,y1​)+F(x1​,y1​)−F(x1​,y2​)​

5.1.2 边缘分布函数

FX(x)=P{X⩽x}=P{X⩽x,Y⩽+∞}=F(x,+∞)FY(y)=P{Y⩽y}=P{X⩽+∞,Y⩽y}=F(+∞,y)\begin{aligned} F_{_X}(x)&=P\{X\leqslant x\}=P\{X\leqslant x,Y\leqslant +\infty\}=F(x,+\infty) \\ \\F_{_Y}(y)&=P\{Y\leqslant y\}=P\{X\leqslant +\infty,Y\leqslant y\}=F(+\infty,y) \end{aligned}FX​​(x)FY​​(y)​=P{X⩽x}=P{X⩽x,Y⩽+∞}=F(x,+∞)=P{Y⩽y}=P{X⩽+∞,Y⩽y}=F(+∞,y)​

5.2 概率密度

5.2.1 离散型

5.2.1.1 联合概率分布
pij⩾0yx\begin{matrix}p_{ij}\geqslant 0 & y\\ \quad & \quad\\ x& \quad\\ \end{matrix}pij​⩾0x​y​ y1y_1y1​ y2y_2y2​ ⋯\cdots⋯ yny_nyn​ ⋯\cdots⋯ pi⋅=∑i=1∞pij=1p_{i\cdot}=\sum\limits_{i=1}^{\infty}p_{ij}=1pi⋅​=i=1∑∞​pij​=1
x1x_1x1​ p11p_{11}p11​ p12p_{12}p12​ ⋯\cdots⋯ p1np_{1n}p1n​ ⋯\cdots⋯ p1⋅p_{1\cdot}p1⋅​
x2x_2x2​ p21p_{21}p21​ p22p_{22}p22​ ⋯\cdots⋯ p2np_{2n}p2n​ ⋯\cdots⋯ p2⋅p_{2\cdot}p2⋅​
⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮
xnx_nxn​ pn1p_{n1}pn1​ pn2p_{n2}pn2​ ⋯\cdots⋯ pnmp_{nm}pnm​ ⋯\cdots⋯ pm⋅p_{m\cdot}pm⋅​
⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮ ⋮\vdots⋮
p⋅j=∑j=1∞pij=1p_{\cdot j}=\sum\limits_{j=1}^{\infty}p_{ij}=1p⋅j​=j=1∑∞​pij​=1 p⋅1p_{\cdot 1}p⋅1​ p⋅2p_{\cdot 2}p⋅2​ ⋯\cdots⋯ p⋅np_{\cdot n}p⋅n​ ⋯\cdots⋯ ∑i=1∞∑j=1∞pij=1\sum\limits_{i=1}^{\infty}\sum\limits_{j=1}^{\infty}p_{ij}=1i=1∑∞​j=1∑∞​pij​=1
5.2.1.2 条件概率分布

P{X=xi∣Y=yi}=P{X=xi,Y=yi}P{Y=yi}=pijp⋅jP{Y=yi∣X=xi}=P{Y=yi,X=xi}P{X=xi}=pijpi⋅P\{X=x_i|Y=y_i\}=\frac{P\{X=x_i,Y=y_i\}}{P\{Y=y_i\}}=\frac{p_{ij}}{p_{\cdot j}} \\ \\ \\P\{Y=y_i|X=x_i\}=\frac{P\{Y=y_i,X=x_i\}}{P\{X=x_i\}}=\frac{p_{ij}}{p_{i \cdot }} P{X=xi​∣Y=yi​}=P{Y=yi​}P{X=xi​,Y=yi​}​=p⋅j​pij​​P{Y=yi​∣X=xi​}=P{X=xi​}P{Y=yi​,X=xi​}​=pi⋅​pij​​

5.2.2 连续型

5.2.2.1 联合概率密度

定义:
FFF 为分布函数,∃0<f∈R,s.t.F(x,y)=∫−∞x∫−∞yf(u,v)dudv\displaystyle\exists\ 0<f\in R,\ \mathrm{s.t.}\ F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)\mathrm{d}u\mathrm{d}v∃ 0<f∈R, s.t. F(x,y)=∫−∞x​∫−∞y​f(u,v)dudv

性质:

  1. f(x,y)⩾0,∫−∞+∞∫−∞+∞f(u,v)dudv=F(+∞,+∞)=1\displaystyle f(x,y)\geqslant 0,\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(u,v)\mathrm{d}u\mathrm{d}v=F(+\infty,+\infty)=1f(x,y)⩾0,∫−∞+∞​∫−∞+∞​f(u,v)dudv=F(+∞,+∞)=1
  2. P{(X,Y)∈G}=∬Gf(x,y)dxdy\displaystyle P\{(X,Y)\in G\}=\iint_{_G}f(x,y)\mathrm{d}x\mathrm{d}yP{(X,Y)∈G}=∬G​​f(x,y)dxdy
  3. f(x,y)f(x,y)f(x,y) 在 (x,y)(x,y)(x,y) 连续,则 ∂2F(x,y)∂x∂y=f(x,y)\displaystyle \frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)∂x∂y∂2F(x,y)​=f(x,y)
5.2.2.2 边缘概率密度

FX(x)=∫−∞x[∫−∞+∞f(x,y)dy]dx⇒fX(x)=∫−∞+∞f(x,y)dyFY(y)=∫−∞y[∫−∞+∞f(x,y)dx]dy⇒fY(y)=∫−∞+∞f(x,y)dxF_{_X}(x)=\int_{-\infty}^x\left[\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\right]\mathrm{d}x \ \Rightarrow\ f_{_X}(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y \\\quad \\F_{_Y}(y)=\int_{-\infty}^y\left[\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\right]\mathrm{d}y \ \Rightarrow\ f_{_Y}(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x FX​​(x)=∫−∞x​[∫−∞+∞​f(x,y)dy]dx ⇒ fX​​(x)=∫−∞+∞​f(x,y)dyFY​​(y)=∫−∞y​[∫−∞+∞​f(x,y)dx]dy ⇒ fY​​(y)=∫−∞+∞​f(x,y)dx

5.2.2.2 条件概率密度

FY∣X(y∣x)=∫−∞yf(x,t)fX(x)dt⇒fY∣X(y∣x)=f(x,y)fX(x),fX(x)>0FX∣Y(x∣y)=∫−∞xf(t,y)fY(y)dt⇒fX∣Y(x∣y)=f(x,y)fY(y),fY(y)>0\begin{aligned} F_{_{Y|X}}(y|x)=\int_{-\infty}^y\frac{f(x,t)}{f_{_X}(x)}\mathrm{d}t \ &\Rightarrow\ f_{_{Y|X}}(y|x)=\frac{f(x,y)}{f_{_X}(x)},\ f_{_X}(x)>0 \\ \\ F_{_{X|Y}}(x|y)=\int_{-\infty}^x\frac{f(t,y)}{f_{_Y}(y)}\mathrm{d}t \ &\Rightarrow\ f_{_{X|Y}}(x|y)=\frac{f(x,y)}{f_{_Y}(y)},\ f_{_Y}(y)>0 \end{aligned}FY∣X​​(y∣x)=∫−∞y​fX​​(x)f(x,t)​dt FX∣Y​​(x∣y)=∫−∞x​fY​​(y)f(t,y)​dt ​⇒ fY∣X​​(y∣x)=fX​​(x)f(x,y)​, fX​​(x)>0⇒ fX∣Y​​(x∣y)=fY​​(y)f(x,y)​, fY​​(y)>0​

注意:求解应确保作为条件的边缘概率为正,除去边缘概率为零的点.

5.3 独立

X,Y互独⇔defP{X⩽x,Y⩽y}=P{X⩽x}P{Y⩽y}⇔F(x,y)=FX(x)FY(y)⇔离散型P{X=xi,Y=yi}=P{X=xi}P{Y=yi}⇔连续型f(x,y)=fX(x)fY(y)⇔条件密度fX∣Y(x∣y)=fX(x)⇒⇍f(X),g(Y)\begin{aligned} X,Y 互独 &\xLeftrightarrow{\mathrm{\ def\ }}\ P\{X\leqslant x,Y\leqslant y\}=P\{X\leqslant x\}P\{Y\leqslant y\} \\&\Leftrightarrow F(x,y)=F_{_X}(x)F_{_Y}(y) \\&\xLeftrightarrow{\ _{离散型}\ } P\{X=x_i,Y=y_i\}=P\{X=x_i\}P\{Y=y_i\} \\&\xLeftrightarrow{\ _{连续型}\ } f(x,y)=f_{_X}(x)f_{_Y}(y) \\&\xLeftrightarrow{\ _{条件密度}\ } f_{_{X|Y}}(x|y)=f_{_X}(x) \\&\begin{array}{l}\Rightarrow\\ \nLeftarrow\\\end{array}\ f(X)\ ,\ g(Y) \end{aligned}X,Y互独​ def ​ P{X⩽x,Y⩽y}=P{X⩽x}P{Y⩽y}⇔F(x,y)=FX​​(x)FY​​(y) 离散型​ ​P{X=xi​,Y=yi​}=P{X=xi​}P{Y=yi​} 连续型​ ​f(x,y)=fX​​(x)fY​​(y) 条件密度​ ​fX∣Y​​(x∣y)=fX​​(x)⇒⇍​ f(X) , g(Y)​

5.4 r.v.函数

FZ(z)=P{g(X,Y)⩽z}={∑g(xi,yi)⩽zpij∬g(xi,yi)⩽zf(x,y)dxdy=X,Y互独{∑g(xi,yi)⩽zpipj∬g(xi,yi)⩽zfX(x)fY(y)dxdyF_{_Z}(z)=P\{g(X,Y)\leqslant z\}=\left\{\begin{array}{l}{\displaystyle \sum\limits_{g(x_i,y_i)\leqslant z}}p_{ij}\\ \\ {\displaystyle \iint\limits_{g(x_i,y_i)\leqslant z}f(x,y)\mathrm{d}x\mathrm{d}y}\\ \end{array}\right. \xlongequal{X,Y互独}\left\{\begin{array}{l} {\displaystyle \sum\limits_{g(x_i,y_i)\leqslant z}}p_ip_j\\ \\ {\displaystyle \iint\limits_{g(x_i,y_i)\leqslant z}f_{_X}(x)f_{_Y}(y)\mathrm{d}x\mathrm{d}y}\\ \end{array}\right. FZ​​(z)=P{g(X,Y)⩽z}=⎩⎨⎧​g(xi​,yi​)⩽z∑​pij​g(xi​,yi​)⩽z∬​f(x,y)dxdy​X,Y互独⎩⎨⎧​g(xi​,yi​)⩽z∑​pi​pj​g(xi​,yi​)⩽z∬​fX​​(x)fY​​(y)dxdy​

6 数字特征

6.1 期望

定义:
E(X)=∑i=1∞xipi=∫−∞+∞xf(x)dx\displaystyle E(X)=\sum_{i=1}^{\infty}x_ip_i=\int_{-\infty}^{+\infty}xf(x)\mathrm{d}xE(X)=i=1∑∞​xi​pi​=∫−∞+∞​xf(x)dx 绝对收敛

性质:

  1. E(C)=C∈RE(C)=C\in\mathbb{R}E(C)=C∈R
  2. E(CX)=CE(X)E(CX)=CE(X)E(CX)=CE(X)
  3. E(X±Y)=E(X)±E(Y)E(X\pm Y)=E(X)\pm E(Y)E(X±Y)=E(X)±E(Y)
  4. X,YX,YX,Y 独立 ⇒E(XY)=E(X)E(Y)⇔ρXY=0\Rightarrow\ E(XY)=E(X)E(Y) \Leftrightarrow \rho_{XY}=0⇒ E(XY)=E(X)E(Y)⇔ρXY​=0,即 X,YX,YX,Y不相关
  5. E(X2)=D(X)+[E(X)]2;E(Xn)E(X^2)=D(X)+[E(X)]^2;E(X^n)E(X2)=D(X)+[E(X)]2;E(Xn) 则使用定义式,注意奇偶性化简

r.v.函数:
E(Y)=E[g(X)]={∑i=1∞g(xi)pi∫−∞+∞g(x)f(x)dxE(Y)=E[g(X)]=\left\{\begin{array}{l} \displaystyle \sum\limits_{i=1}^{\infty}g(x_i)p_i\\ \\ \displaystyle \int_{-\infty}^{+\infty}g(x)f(x)\mathrm{d}x\\ \end{array}\right.E(Y)=E[g(X)]=⎩⎨⎧​i=1∑∞​g(xi​)pi​∫−∞+∞​g(x)f(x)dx​

E(Z)=E[g(X,Y)]={∑j=1∞∑i=1∞g(xi,yi)pij∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdyE(Z)=E[g(X,Y)]=\left\{\begin{array}{l} \displaystyle \sum\limits_{j=1}^{\infty}\sum\limits_{i=1}^{\infty}g(x_i,y_i)p_{ij}\\ \\ \displaystyle \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)\mathrm{d}x\mathrm{d}y\\ \end{array}\right.E(Z)=E[g(X,Y)]=⎩⎨⎧​j=1∑∞​i=1∑∞​g(xi​,yi​)pij​∫−∞+∞​∫−∞+∞​g(x,y)f(x,y)dxdy​

6.2 方差

定义:
D(X)=E{[X−E(X)]2}=E(X2)−[E(X)]2D(X)=E\{[X-E(X)]^2\}=E(X^2)-[E(X)]^2D(X)=E{[X−E(X)]2}=E(X2)−[E(X)]2

标准化r.v.:
E(X−EXDX)=0,D(X−EXDX)=1E\left(\frac{X-EX}{\sqrt{DX}}\right)=0\ ,\ D\left(\frac{X-EX}{\sqrt{DX}}\right)=1 E(DX​X−EX​)=0 , D(DX​X−EX​)=1

性质:

  1. D(C)=0D(C)=0D(C)=0
  2. D(CX)=C2D(X)D(CX)=C^2D(X)D(CX)=C2D(X)
  3. D(X±Y)=D(X)+D(Y)±2Cov(X,Y)=独立⇒不相关D(X)+D(Y)D(X\pm Y)=D(X)+D(Y)\pm 2Cov(X,Y)\xlongequal{独立\Rightarrow 不相关}D(X)+D(Y)D(X±Y)=D(X)+D(Y)±2Cov(X,Y)独立⇒不相关D(X)+D(Y)
  4. D(X)=0⇔P{X=E(X)}=1D(X)=0\Leftrightarrow P\{X=E(X)\}=1D(X)=0⇔P{X=E(X)}=1

6.3 协方差

定义:
Cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY)−E(X)E(Y)\mathrm{Cov}(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-E(X)E(Y)Cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY)−E(X)E(Y)

性质:

  1. Cov(X,Y)=Cov(Y,X)\mathrm{Cov}(X,Y)=\mathrm{Cov}(Y,X)Cov(X,Y)=Cov(Y,X)
  2. Cov(X,X)=D(X)\mathrm{Cov}(X,X)=D(X)Cov(X,X)=D(X)
    D(X±Y)=D(X)+D(Y)±2Cov(X,Y)D(X\pm Y)=D(X)+D(Y)\pm 2\mathrm{Cov}(X,Y)D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
    D(∑i=1nXi)=∑i=1nD(Xi)+∑1⩽i<j⩽n2Cov(Xi,Xj)\displaystyle D\left(\sum\limits_{i=1}^{n}X_i\right)=\sum\limits_{i=1}^{n}D(X_i)+\sum\limits_{1 \leqslant i < j \leqslant n}2\mathrm{Cov}(X_i,X_j)D(i=1∑n​Xi​)=i=1∑n​D(Xi​)+1⩽i<j⩽n∑​2Cov(Xi​,Xj​)
  3. Cov(aX,bY)=abCov(X,Y)\mathrm{Cov}(aX,bY)=ab\ \mathrm{Cov}(X,Y)Cov(aX,bY)=ab Cov(X,Y)
  4. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\mathrm{Cov}(X_1+X_2,Y)=\mathrm{Cov}(X_1,Y)+\mathrm{Cov}(X_2,Y)Cov(X1​+X2​,Y)=Cov(X1​,Y)+Cov(X2​,Y)

6.4 线性相关系数

定义:
ρXY=Cov(X,Y)D(X)D(Y)\rho_{_{XY}}=\frac{\mathrm{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}ρXY​​=D(X)​D(Y)​Cov(X,Y)​

性质:

  1. ∣ρXY∣⩽1|\rho_{_{XY}}|\leqslant 1∣ρXY​​∣⩽1
  2. ∣ρXY∣=1⇔∃a,b∈R,s.t.P{Y=aX+b}=1|\rho_{_{XY}}|= 1 \Leftrightarrow \exists\ a,b\in\mathbb{R},\mathrm{s.t.}\ P\{Y=aX+b\}=1∣ρXY​​∣=1⇔∃ a,b∈R,s.t. P{Y=aX+b}=1,且 ρXY={1,a>0−1,a<0\rho_{_{XY}}=\left\{\begin{array}{l}{\ \ 1\ ,a>0}\\{-1,a<0}\\\end{array}\right.ρXY​​={  1 ,a>0−1,a<0​

独立/不相关的结论:

  1. X,YX,YX,Y 独立 (P(XY)=P(X)P(Y))⇒⇍X,Y(P(XY)=P(X)P(Y))\ \begin{array}{l}{\Rightarrow}\\{\nLeftarrow}\\\end{array} X,Y(P(XY)=P(X)P(Y)) ⇒⇍​X,Y 不相关 ⇔ρXY=0{⇔Cov(X,Y)=0⇔E(XY)−E(X)E(Y)=0⇔D(X±Y)=D(X)±D(Y)\Leftrightarrow \rho_{_{XY}}=0\ \left\{\begin{array}{l}{\Leftrightarrow \mathrm{Cov}(X,Y)=0}\\{\Leftrightarrow E(XY)-E(X)E(Y)=0}\\{\Leftrightarrow D(X\pm Y)=D(X)\pm D(Y)}\\\end{array}\right.⇔ρXY​​=0 ⎩⎨⎧​⇔Cov(X,Y)=0⇔E(XY)−E(X)E(Y)=0⇔D(X±Y)=D(X)±D(Y)​

Tips: 不相关即二者无线性关系,但可能存在其他关系;独立即不存在任何关系.

  1. (X,Y)∼N;X,Y(X,Y)\sim N;\ X,Y(X,Y)∼N; X,Y 独立 ⇔X,Y\ \Leftrightarrow\ X,Y ⇔ X,Y 不相关
  2. X,Y∼B(1,p);X,YX,Y\sim B(1,p);\ X,YX,Y∼B(1,p); X,Y 独立 ⇔X,Y\ \Leftrightarrow\ X,Y ⇔ X,Y 不相关

6.5 矩

kkk 阶原点矩:E(Xk)E(X^k)E(Xk)
kkk 阶中心矩:E{[X−E(X)]k}E\{[X-E(X)]^k\}E{[X−E(X)]k}
k+lk+lk+l 阶混合矩:E(XkYl),E[(X−EX)k(Y−EY)l]E(X^kY^l),\ E[(X-EX)^k(Y-EY)^l]E(XkYl), E[(X−EX)k(Y−EY)l]

期望 E(X)E(X)E(X) 即为一阶原点矩,方差 D(X)=E{[X−E(X)]2}D(X)=E\{[X-E(X)]^2\}D(X)=E{[X−E(X)]2} 为二阶中心矩.

7 统计量

7.1 相关概念

总体: 所要研究问题有关个体的全体构成的集合.
样本: 按一定规定从总体中抽取的一部分个体.

抽到哪些个体是随机的,因而样本为随机变量。
一组样本由简单随机抽样得到,因而相互独立。

总体和样本都为随机变量,且同分布.

例: 研究全国人的年龄,总体为全国所有人的年龄,个体:每个人的年龄,随机变量可以抽取全国任何一个人的年龄,一组样本从中抽取n个人的年龄。
矩估计即由样本估计总体,采用替换原理,使用样本矩替换总体矩。

7.2 统计量

样本均值:
Xˉ=1n∑i=1nXi⇒{E(Xˉ)=μD(Xˉ)=D(X)n=σ2n\bar{X}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i \ \Rightarrow \left\{\begin{array}{l} E(\bar{X})=\mu\\ \\ \displaystyle D(\bar{X})=\frac{D(X)}{n}=\frac{\sigma^2}{n}\\ \end{array}\right. Xˉ=n1​i=1∑n​Xi​ ⇒⎩⎨⎧​E(Xˉ)=μD(Xˉ)=nD(X)​=nσ2​​

样本方差:
S2=1n−1∑i=1n(Xi−Xˉ)2=1n−1(∑i=1nXi2−nXˉ)⇒E(S2)=D(X)=σ2S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\bar{X})^2=\frac{1}{n-1}\left(\sum\limits_{i=1}^{n}X_i^2-n\bar{X}\right) \Rightarrow E(S^2)=D(X)=\sigma^2 S2=n−11​i=1∑n​(Xi​−Xˉ)2=n−11​(i=1∑n​Xi2​−nXˉ)⇒E(S2)=D(X)=σ2

常用的计算数字特征替换:

∑i=1nXi=nXˉ\sum\limits_{i=1}^{n}X_i=n\bar{X}i=1∑n​Xi​=nXˉ
(n−1)S2=∑i=1n(Xi−Xˉ)(n-1)S^2=\sum\limits_{i=1}^{n}(X_i-\bar{X})(n−1)S2=i=1∑n​(Xi​−Xˉ)
E(χ2(n))=n,D(χ2(n))=2nE(\chi^2(n))=n,D(\chi^2(n))=2nE(χ2(n))=n,D(χ2(n))=2n

正态分布总体:

  1. Xˉ\bar{X}Xˉ 与 S2S^2S2 相互独立,即 Xˉ\bar{X}Xˉ 与 ∑i=1n(Xi−Xˉ)2\sum\limits_{i=1}^n(X_i-\bar{X})^2i=1∑n​(Xi​−Xˉ)2 独立

⇒{Xˉ与S2不相关,E(XˉS2)=E(Xˉ)E(S2)f(Xˉ)与g(S2)相互独立⇒f(Xˉ)与g(S2)不相关\Rightarrow \left\{\begin{array}{l} \bar{X} 与 S^2 不相关,E(\bar{X}S^2)=E(\bar{X})E(S^2)\\ \\ f(\bar{X})与g(S^2)相互独立\Rightarrow f(\bar{X})与g(S^2) 不相关\\ \end{array}\right.⇒⎩⎨⎧​Xˉ与S2不相关,E(XˉS2)=E(Xˉ)E(S2)f(Xˉ)与g(S2)相互独立⇒f(Xˉ)与g(S2)不相关​

  1. (n−1)S2σ2=∑i=1n(Xi−Xˉσ)2∼χ2(n−1)⇒D(χ2(n))=2nD((n−1)S2σ2)=2(n−1)⇒D(S2)=2σ4n−1\frac{(n-1)S^2}{\sigma^2}=\sum\limits_{i=1}^{n}\left(\frac{X_i-\bar{X}}{\sigma}\right)^2\sim \chi^2(n-1) \xRightarrow{D(\chi^2(n))=2n} D\left(\frac{(n-1)S^2}{\sigma^2}\right)=2(n-1)\Rightarrow D(S^2)=\frac{2\sigma^4}{n-1}σ2(n−1)S2​=i=1∑n​(σXi​−Xˉ​)2∼χ2(n−1)D(χ2(n))=2n​D(σ2(n−1)S2​)=2(n−1)⇒D(S2)=n−12σ4​

  2. Xˉ−μσ/n(n−1)S2σ2/(n−1)=Xˉ−μS/n∼t(n−1)\displaystyle \frac{\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}} {\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}}=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1)σ2(n−1)S2​/(n−1)​σ/n​Xˉ−μ​​=S/n​Xˉ−μ​∼t(n−1)

  3. Xˉ∼N(μ,σ2n)⇒Xˉ−μσ/n∼N(0,1)⇒μ=0nXˉ2σ2∼χ2(1)⇒D(nXˉ2σ2)=2⇒D(Xˉ2)=2σ4n2\displaystyle \bar{X}\sim N(\mu,\frac{\sigma^2}{n})\Rightarrow \frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \xRightarrow{\mu=0} \frac{n\bar{X}^2}{\sigma^2}\sim \chi^2(1) \Rightarrow D\left(\frac{n\bar{X}^2}{\sigma^2}\right)=2 \Rightarrow D(\bar{X}^2)=\frac{2\sigma^4}{n^2}Xˉ∼N(μ,nσ2​)⇒σ/n​Xˉ−μ​∼N(0,1)μ=0​σ2nXˉ2​∼χ2(1)⇒D(σ2nXˉ2​)=2⇒D(Xˉ2)=n22σ4​

  4. Xi−μσ∼N(0,1)⇒∑i=1n(Xi−μσ)2=1σ2∑i=1n(Xi−μ)2∼χ2(n)⇒μ=0X2σ2∼χ2(1)⇒D(X2σ2)=2⇒D(X2)=2σ2\displaystyle \frac{X_i-\mu}{\sigma}\sim N(0,1)\Rightarrow \sum\limits_{i=1}^{n}\left(\frac{X_i-\mu}{\sigma}\right)^2=\frac{1}{\sigma^2}\sum\limits_{i=1}^{n}(X_i-\mu)^2\sim \chi^2(n)\xRightarrow{\mu=0} \frac{X^2}{\sigma^2}\sim \chi^2(1) \Rightarrow D\left(\frac{X^2}{\sigma^2}\right)=2\Rightarrow D(X^2)=2\sigma^2σXi​−μ​∼N(0,1)⇒i=1∑n​(σXi​−μ​)2=σ21​i=1∑n​(Xi​−μ)2∼χ2(n)μ=0​σ2X2​∼χ2(1)⇒D(σ2X2​)=2⇒D(X2)=2σ2

Tips: 计算某量的平方方差,标准化转化卡方分布,降次.

8 参数估计

8.1 点估计

8.1.1 矩估计

8.1.1.1 样本矩与总体矩

样本矩:
kkk 阶原点矩:Ak=1n∑i=1nXik\displaystyle A_k=\frac{1}{n}\sum\limits_{i=1}^{n}X_i^kAk​=n1​i=1∑n​Xik​
kkk 阶中心矩:Bk=1n∑i=1n(Xi−Xˉ)k\displaystyle B_k=\frac{1}{n}\sum\limits_{i=1}^{n}(X_i-\bar{X})^kBk​=n1​i=1∑n​(Xi​−Xˉ)k

总体矩:
kkk 阶原点矩:E(Xk)E(X^k)E(Xk)
kkk 阶中心矩:E{[X−E(X)]k}E\{[X-E(X)]^k\}E{[X−E(X)]k}

8.1.1.2 替换原理

由样本矩代替总体矩,即 Ak:=E(Xk),Bk:=E{[X−E(X)]k}A_k:=E(X^k),B^k:=E\{[X-E(X)]^k\}Ak​:=E(Xk),Bk:=E{[X−E(X)]k},联立方程求解待故参数,从而由样本估计总体.

8.1.1.3 参数方程联立

kkk 个待估参数 θi\theta_iθi​,联立 kkk 个方程,构建含参且易解方程。(不同方法估计结果可能不唯一)

8.1.1.3.1 单参估计

一阶原点矩方程:
1n∑i=1nXi:=E(X)=g(θ)\frac{1}{n}\sum\limits_{i=1}^{n}X_i \ :=\ E(X)=g(\theta)n1​i=1∑n​Xi​ := E(X)=g(θ)

若一阶矩计算 E(X)E(X)E(X) 后不含待估参数则使用二阶矩方程.

二阶原点矩方程:
1n∑i=1nXi2:=E(X2)=g(θ)\frac{1}{n}\sum\limits_{i=1}^{n}X_i^2 \ :=\ E(X^2)=g(\theta)n1​i=1∑n​Xi2​ := E(X2)=g(θ)

8.1.1.3.2 双参估计

一阶与二阶原点矩联立方程组:
{1n∑i=1nXi:=E(X)=g(θ1,θ2)1n∑i=1nXi2:=E(X2)=h(θ1,θ2)\left\{\begin{array}{l} \frac{1}{n}\sum\limits_{i=1}^{n}X_i \ :=\ E(X)=g(\theta_1,\theta_2)\\ \\ \frac{1}{n}\sum\limits_{i=1}^{n}X_i^2 \ :=\ E(X^2)=h(\theta_1,\theta_2)\\ \end{array}\right.⎩⎨⎧​n1​i=1∑n​Xi​ := E(X)=g(θ1​,θ2​)n1​i=1∑n​Xi2​ := E(X2)=h(θ1​,θ2​)​

一阶原点矩与二阶中心矩联立方程组:
{1n∑i=1nXi:=E(X)=g(θ1,θ2)1n∑i=1n(Xi−Xˉ)2:=E{[X−EX]2}=h(θ1,θ2)\left\{\begin{array}{l} \frac{1}{n}\sum\limits_{i=1}^{n}X_i \ :=\ E(X)=g(\theta_1,\theta_2)\\ \\ \frac{1}{n}\sum\limits_{i=1}^{n}(X_i-\bar{X})^2 \ :=\ E\{[X-EX]^2\}=h(\theta_1,\theta_2)\\ \end{array}\right.⎩⎨⎧​n1​i=1∑n​Xi​ := E(X)=g(θ1​,θ2​)n1​i=1∑n​(Xi​−Xˉ)2 := E{[X−EX]2}=h(θ1​,θ2​)​

8.1.2 极大似然估计

Step1:
构造似然函数 L(θ)=L(x1,⋯,xn;θ1,⋯,θk)=∏i=1nf(xi;θ1,⋯,θk)L(\theta)=L(x_1,\cdots,x_n\ ;\theta_1,\cdots,\theta_k)=\prod\limits_{i=1}^{n}f(x_i\ ;\theta_1,\cdots,\theta_k)L(θ)=L(x1​,⋯,xn​ ;θ1​,⋯,θk​)=i=1∏n​f(xi​ ;θ1​,⋯,θk​)

Step2:
利用导数求极大值点
dL(θ)dθj:=0⇒θj^(j=1,⋯,k)\displaystyle \frac{\mathrm{d}L(\theta)}{\mathrm{d}\theta_j} :=0\ \Rightarrow\ \hat{\theta_j}\ (j=1,\cdots,k)dθj​dL(θ)​:=0 ⇒ θj​^​ (j=1,⋯,k)

若直接求导不便,可将似然函数取对数 ln⁡L(θ)=∑i=1nln⁡f(xi;θ1,⋯,θk)\displaystyle\ln{L(\theta)}=\sum\limits_{i=1}^n\ln{f(x_i;\theta_1,\cdots,\theta_k)}lnL(θ)=i=1∑n​lnf(xi​;θ1​,⋯,θk​) ,而后求导,
dln⁡L(θ)dθj:=0⇒θj^(j=1,2,⋯,k)\displaystyle \frac{\mathrm{d}\ln L(\theta)}{\mathrm{d}\theta_j} :=0\ \Rightarrow\ \hat{\theta_j}\ (j=1,2,\cdots,k)dθj​dlnL(θ)​:=0 ⇒ θj​^​ (j=1,2,⋯,k)

Step3:
若有解,所得即所求;
若无解,则似然函数单调,估值应在边界点处取得,即 {↑:θ^=min⁡{Xi}↓:θ^=max⁡{Xi}\left\{\begin{array}{l} \uparrow\ :\ \hat{\theta}=\min\{X_i\}\\ \downarrow\ :\ \hat{\theta}=\max\{X_i\}\\ \end{array}\right.{↑ : θ^=min{Xi​}↓ : θ^=max{Xi​}​

8.1.3 估计量评选标准

无偏性:

若 E(θ^)=θE(\hat{\theta})=\thetaE(θ^)=θ,则 θ\thetaθ 为未知参数 θ\thetaθ 的无偏估计量.

有效性:

若 E(θ1^)=E(θ2^)=θ,D(θ1^)<D(θ2^)E(\hat{\theta_1})=E(\hat{\theta_2})=\theta,D(\hat{\theta_1})<D(\hat{\theta_2})E(θ1​^​)=E(θ2​^​)=θ,D(θ1​^​)<D(θ2​^​),则 θ1^\hat{\theta_1}θ1​^​ 比 θ2^\hat{\theta_2}θ2​^​ 更有效.

一致性(相合性):

θn^=θ^(X1,⋯,Xn)\hat{\theta_n}=\hat{\theta}(X_1,\cdots,X_n)θn​^​=θ^(X1​,⋯,Xn​) 依概率收敛于 θ\thetaθ,即 lim⁡n→∞P{∣θn^−θ∣<ε}=1\displaystyle\lim_{n\to\infty}P\{|\hat{\theta_n}-\theta|<\varepsilon\}=1n→∞lim​P{∣θn​^​−θ∣<ε}=1,则 θ^\hat{\theta}θ^ 为一致估计量.

Tips: 由辛钦大数定律 或 切比雪夫不等式判别.

8.1.4 大数定律与中心极限定理

Chebyshev 不等式:

{∃E(Xi)=μ∃D(Xi)=σ2⇒∀ε>0{P{∣X−E(X)∣⩾ε}⩽D(X)ε2P{∣X−E(X)∣<ε}⩾1−D(X)ε2\left\{\begin{array}{l} \exists\ E(X_i)=\mu\\ \\ \exists\ D(X_i)=\sigma^2\\ \end{array}\right. \xRightarrow{\ \forall \varepsilon >0\ \ } \left\{\begin{array}{l} P\{|X-E(X)|\geqslant \varepsilon\}\leqslant \frac{D(X)}{\varepsilon^2}\\ \\ P\{|X-E(X)|< \varepsilon\}\geqslant 1-\frac{D(X)}{\varepsilon^2}\\ \end{array}\right.⎩⎨⎧​∃ E(Xi​)=μ∃ D(Xi​)=σ2​ ∀ε>0  ​⎩⎨⎧​P{∣X−E(X)∣⩾ε}⩽ε2D(X)​P{∣X−E(X)∣<ε}⩾1−ε2D(X)​​

Khinchin 大数定律: 样本均值依概率收敛于期望.

{XiI.I.D.∃E(Xi)=μ⇒∀ε>0lim⁡n→∞P{∣1n∑i=1nXi−μ∣<ε}=1\left\{\begin{array}{l} X_i \ \ I.I.D.\\ \exists\ E(X_i)=\mu\\ \end{array}\right. \xRightarrow{\ \forall \varepsilon >0\ \ } \lim_{n\to\infty}P\left\{\lvert\frac{1}{n}\sum_{i=1}^nX_i-\mu\rvert<\varepsilon\right\}=1{Xi​  I.I.D.∃ E(Xi​)=μ​ ∀ε>0  ​n→∞lim​P{∣n1​i=1∑n​Xi​−μ∣<ε}=1

Lindberg-levi 中心极限定理: 样本均值依分布收敛于标准正态.

{XiI.I.D.∃E(Xi)=μ∃D(Xi)=σ2⇒∀x∈Rlim⁡n→∞P{∣1n∑i=1nXi−μσn∣<x}=Φ(x)\left\{\begin{array}{l} X_i\ \ I.I.D.\\ \exists\ E(X_i)=\mu\\ \exists\ D(X_i)=\sigma^2 \end{array}\right. \xRightarrow{\ \forall x \in\mathbb{R}\ \ } \lim_{n\to\infty}P\left\{\lvert\frac{\frac{1}{n}\sum_{i=1}^nX_i-\mu}{\frac{\sigma}{\sqrt{n}}}\rvert<x\right\}=\Phi(x)⎩⎨⎧​Xi​  I.I.D.∃ E(Xi​)=μ∃ D(Xi​)=σ2​ ∀x∈R  ​n→∞lim​P{∣n​σ​n1​∑i=1n​Xi​−μ​∣<x}=Φ(x)

8.2 区间估计

8.2.1 置信区间

θ\thetaθ 是总体的一个参数,参数空间为 Θ\ThetaΘ ,xk(k=1,⋯,n)x_k(k=1,\cdots,n)xk​(k=1,⋯,n) 是来自该总体的样本,对于给定的 α(0<α<1)\alpha(0<\alpha<1)α(0<α<1) ,假设有两个统计量 θ^L=θ^L(x1,⋯,xn),θ^U=θ^U(x1,⋯,xn)\hat{\theta}_L=\hat{\theta}_L(x_1,\cdots,x_n),\hat{\theta}_U=\hat{\theta}_U(x_1,\cdots,x_n)θ^L​=θ^L​(x1​,⋯,xn​),θ^U​=θ^U​(x1​,⋯,xn​) ,对于任意的 θ∈Θ\theta\in \Thetaθ∈Θ,有
Pθ(θ^L⩽θ⩽θ^U)=1−αP_{\theta}\left(\hat{\theta}_L\leqslant \theta \leqslant\hat{\theta}_U\right)=1-\alpha Pθ​(θ^L​⩽θ⩽θ^U​)=1−α
则称 [θ^L,θ^U][\hat{\theta}_L,\hat{\theta}_U][θ^L​,θ^U​] 为 θ\thetaθ 的置信度为 1−α1-\alpha1−α 的同等置信区间,α\alphaα 称显著性水平.

8.2.2 枢轴变量法

X∼N(μ,σ2)X\sim N(\mu,\sigma^2)X∼N(μ,σ2),求解参数 μ\muμ 一个置信度为 1−α1-\alpha1−α 的区间估计.
(1) σ2\sigma^2σ2 已知时 μ\muμ 的置信区间;
(2) σ2\sigma^2σ2 未知时 μ\muμ 的置信区间.

sol: (1)
Y=Xˉ−μσ/n∼N(0,1)\displaystyle Y=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)Y=σ/n​Xˉ−μ​∼N(0,1)
1−α=P{−uα2⩽Y=Xˉ−μσ/n⩽uα2}=P{Xˉ−σnuα2⩽μ⩽Xˉ+σnuα2}\begin{aligned} 1-\alpha &=P\left\{-u_{\frac{\alpha}{2}}\leqslant Y=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\leqslant u_{\frac{\alpha}{2}}\right\} \\&=P\left\{\bar{X}-\frac{\sigma}{\sqrt{n}}u_{\frac{\alpha}{2}}\leqslant \mu \leqslant \bar{X}+\frac{\sigma}{\sqrt{n}}u_{\frac{\alpha}{2}}\right\} \end{aligned}1−α​=P{−u2α​​⩽Y=σ/n​Xˉ−μ​⩽u2α​​}=P{Xˉ−n​σ​u2α​​⩽μ⩽Xˉ+n​σ​u2α​​}​
(2)
Y=Xˉ−μS/n∼t(n−1)\displaystyle Y=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1)Y=S/n​Xˉ−μ​∼t(n−1)
1−α=P{−tα2(n−1)⩽Y=Xˉ−μS/n⩽tα2(n−1)}=P{Xˉ−Sntα2(n−1)⩽μ⩽Xˉ+Sntα2(n−1)}\begin{aligned} 1-\alpha &=P\left\{-t_{\frac{\alpha}{2}}(n-1) \leqslant Y=\frac{\bar{X}-\mu}{S/\sqrt{n}}\leqslant t_{\frac{\alpha}{2}}(n-1)\right\} \\&=P\left\{\bar{X}-\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\leqslant \mu \leqslant \bar{X}+\frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right\} \end{aligned}1−α​=P{−t2α​​(n−1)⩽Y=S/n​Xˉ−μ​⩽t2α​​(n−1)}=P{Xˉ−n​S​t2α​​(n−1)⩽μ⩽Xˉ+n​S​t2α​​(n−1)}​

9 假设检验


附录

概率论与数理统计(上篇)

概率论与数理统计-下篇相关推荐

  1. 概率论与数理统计--第三章

    文章目录 概率论与数理统计--第三章 概率论与数理统计–第三章

  2. 2021-08-08概率论与数理统计-第二章

    文章目录 概率论与数理统计-第二章 概率论与数理统计-第二章

  3. 高等数学·同济七版+线性代数第六版+概率论与数理统计第四版(教材+辅导)

    教材加辅导 内容简介 <高等数学>第7版是普通高等教育"十二五"国家级规划教材,在第6版的基础上作了进一步的修订.版教材在保留原教材结构严谨,逻辑清晰.叙述详细.通俗易 ...

  4. 数学建模 概率论与数理统计

    概率论与数理统计 概率模型 统计模型 概率空间是概率论研究的起点 实际问题抽象为数学模型 常微方程 偏微方程 三元组(Ω,F,P)概率空间 Ω--样本空间 F--事件域 P--概率测度 研究随机现象由 ...

  5. 概率论与数理统计常用英文词汇对照

    概率论与数理统计常用英文词汇对照 Probability Theory 概率论 Trial 试验 intersection交 union 并 frequency 频率 difference 差 add ...

  6. 某同学使用计算机求30,概率论与数理统计习题集及答案

    <概率论与数理统计>作业集及答案 第1章 概率论的基本概念 §1 .1 随机试验及随机事件 1. (1) 一枚硬币连丢3次,观察正面H ﹑反面T 出现的情形. 样本空间是:S= : (2) ...

  7. 张宇概率论与数理统计pdf_【书籍篇】张宇概率论与数理统计9讲

    [书籍篇]每篇文章分享一本高质量的考研书. 这些考研书是高清无水印的,方便大家学习使用.我们这边已和书籍的大厂商达成长期合作,所以将会更好的服务每一位考研学子. 你在外面QQ群看到的那些宣传学习资源的 ...

  8. 概率论与数理统计の笔记

    概率论应用范围主要是人工智能,和现在大数据背景下的数据处理 概率论考前总结 数学总目录 参考教材: <概率论与数理统计浙大版> <考研数学复习全书> 第一章 随机事件与概率 第 ...

  9. 概率论与数理统计中的算子半群 第一讲 Banach-Steinhaus定理2 Banach-Steinhaus定理的应用

    概率论与数理统计中的算子半群 第一讲 Banach-Steinhaus定理2 Banach-Steinhaus定理的应用 上一讲我们介绍了Banach-Steinhaus定理: Banach-Stei ...

最新文章

  1. uniapp实现图片预览功能
  2. Android之多线程工作-AsyncTask与handler
  3. 64位java_99.9%的Java程序员都说不清的问题:JVM中的对象内存布局?
  4. nginx配置多个二级子域名
  5. VMware虚拟机关闭后托盘运行设置
  6. 关于安装 rst2pdf 时遇到的 setuptools过老的问题
  7. 【DFS + backtrack】LeetCode 37. Sudoku Solver
  8. git init github
  9. 【Java】使用Java实现爬虫
  10. MATLAB 显示输出数据的三种方式
  11. 如何将手机屏幕投影到电脑电视
  12. oracle redo查询,ORACLE UNDO REDO查看
  13. Windows10打开“运行”窗口
  14. Ubuntu 18.04 LTS 安装JDK1.8-Linux-64
  15. 【马斯克:从宇宙到人脑的征程】若AI攻占地球,猎鹰可带领人类移民火星
  16. com.alibaba.fastjson.JSONException: syntax error, pos 1
  17. unity 太阳自发光_unity shader基础之——unity中实现环境光、自发光
  18. 正本清源!!!!!!:HWDB1.1数据集.gnt转换成.png
  19. 如何有效管理项目任务
  20. 人肉搜索:网络隐私权的侵犯与保护

热门文章

  1. 企业网站服务器的配置研究背景,ftp服务器研究背景
  2. H.264编码基础知识详解
  3. 半导体衰落超出想象,会熊市反弹? – 25 年来 71 家公司的库存分析
  4. VS Code:因为在此系统上禁止运行脚本,解决方法
  5. 微信支付:商家转账到零钱的开发
  6. 手把手教你调试构建一个Vue/小程序商城项目源码
  7. [转载]十六款值得关注的NoSQL与NewSQL数据库
  8. 半导体物理(硅的能带解读)
  9. Javascript 历史遗留 - 产生的语法问题整理
  10. 《记忆力心理学》5个方法 让你过目不忘