数理统计内容整理（一）基本概念

总体（或母体）

所研究的对象的全体。

个体

这里是引用

总体中的元素。

有限总体

总体中的个体数目为有限。

无限总体

总体中的个数数目为无线。

数理统计

关心的是某一项或若干项数量指标X（向量）和该数量指标X在总体中的分布情况。–“所谓的总体的分布就是数量指标X的分布”

样本及其分布

样本

从总体中取得一部分个体，这一部分个体成为样本（或子样）

样品

样本中的每个个体称为样本

样本容量

样本中的个体数目称为样本容量

抽样

取得样本的过程

抽样法

抽样中采用的方法

随机抽样法

从总体中随意的抽取若干个个体–一般采用此方法

样本空间

总体X随机抽样的到的样本按顺序排序用X1…Xn表示,或者用n维随即向量X=^(X1,⋯ ,Xn)TX\quad \widehat { = } \quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }X=(X1,⋯,Xn)T表示.
样本(X1,⋯ ,Xn)T\quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }(X1,⋯,Xn)T可能取值的全体成为样本空间

i.i.d.

独立同分布

简单随机样本

X1{ X }_{ 1 }X1的分布与总体X的分布相同

分布-对于简单随机样本X1…Xn

若总体的分布函数为F(x)则样本的联合分布函数为:

Fs(x1,⋯ ,xn)=∏i=1nF(xi){ F }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ F({ x }_{ i }) }Fs(x1,⋯,xn)=∏i=1nF(xi)

若总体的概率密度f(x)则样本的联合概率密度为:

fs(x1,⋯ ,xn)=∏i=1nf(xi){ f }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ f({ x }_{ i }) }fs(x1,⋯,xn)=∏i=1nf(xi)

若总体具有分布律(概率函数)p(x),其中p(ai) = P(X = ai),则样本的联合概率函数为:

ps(x1,⋯ ,xn)=∏i=1np(xi){ p }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n })=\prod _{ i=1 }^{ n }{ p({ x }_{ i }) }ps(x1,⋯,xn)=∏i=1np(xi)

统计量

样本均值

Xˉ=1n∑i=1nXi\bar { X } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i } }Xˉ=n1∑i=1nXi

样本方差

S2=1n∑i=1n(Xi−X‾)2=1n∑i=1nXi2−X‾2{ S }^{ 2 }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { { X }_{ i } }^{ 2 } } -{ \overline { X } }^{ 2 }S2=n1∑i=1n(Xi−X)2=n1∑i=1nXi2−X2

修正样本方差

S∗2=1n−1∑i=1n(Xi−X‾)2{ S }^{ *2 }=\frac { 1 }{ n-1 } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } }S∗2=n−11∑i=1n(Xi−X)2

样本k阶原点矩

Ak=1n∑i=1nXik{ A }_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i }^{ k } }Ak=n1∑i=1nXik

样本k阶中心距

Bk=1n∑i=1n(Xi−X‾)kB_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ k } }Bk=n1∑i=1n(Xi−X)k

X(k)的概率密度f(k)(x)(1<=k<=n)

f(k)(x)=n!(k−1)!(n−k)![F(x)]k−1[1−F(x)]n−kf(x){ f }_{ (k) }(x)=\frac { n! }{ (k-1)!(n-k)! } { [F(x)] }^{ k-1 }{ [1-F(x)] }^{ n-k }f(x)f(k)(x)=(k−1)!(n−k)!n![F(x)]k−1[1−F(x)]n−kf(x)

X(k)与X(j)的联合概率密度f(k)(j)(x,y)(1<=k<=j<=n)

f(k)(j)(x,y)=n!(k−1)!(j−k−1)!(n−j)![F(x)]k−1[F(y)−F(x)]j−k−1[1−F(y)]n−jf(x)f(y){ f }_{ (k)(j) }(x,y)=\frac { n! }{ (k-1)!(j-k-1)!(n-j)! } { [F(x)] }^{ k-1 }{ [F(y)-F(x)] }^{ j-k-1 }{ [1-F(y)] }^{ n-j }f(x)f(y)f(k)(j)(x,y)=(k−1)!(j−k−1)!(n−j)!n![F(x)]k−1[F(y)−F(x)]j−k−1[1−F(y)]n−jf(x)f(y)

在顺序统计量中

样本中位数

Me={12(Xn/2+X(n/2+1)),n为偶数X((n+1)/2),n为奇数Me={ \{ }_{ \frac { 1 }{ 2 } ({ X }_{ n/2 }+{ X }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { X }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }Me={21(Xn/2+X(n/2+1)),n为偶数X((n+1)/2),n为奇数
观察值为
me={12(xn/2+x(n/2+1)),n为偶数x((n+1)/2),n为奇数me={ \{ }_{ \frac { 1 }{ 2 } ({ x }_{ n/2 }+{ x }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { x }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }me={21(xn/2+x(n/2+1)),n为偶数x((n+1)/2),n为奇数

样本极差

R=X(n)−X(1)R={ X }_{ (n) } - { X }_{ (1) }R=X(n)−X(1)
其观察值为
r=x(n)−x(1)r={ x }_{ (n) } - { x }_{ (1) }r=x(n)−x(1)

经验分布函数

抽样分布

所谓抽样分布是指统计量的概率分布,确定统计量的分布是数理统计学的基本问题之一.一般情况下,统计量分布的推导问题可分为两种情况进行讨论:(1)当已知总体X的分布时,若对任意容量为n的样本X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的分布,则称该分布为g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的精确分布.确定统计量的精确分布,对于数理统计中的所谓小样问题(指样本容量n较小时的统计问题)的研究是很重要的;(2)当n->∞时,能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的极限分布.统计量的极限分布对于数理统计中得到的所谓大样问题(指样本容量n较大时的统计问题)的研究是非常有用的.

Γ分布

若随机变量X具有概率密度
f(x,α,λ)={0,x≤0λαΓ(α)xα−1e−λx,x>0f(x,\alpha ,\lambda )={ \{ }_{ 0,x\le 0 }^{ \frac { { \lambda }^{ \alpha } }{ \Gamma (\alpha ) } { x }^{ \alpha -1 }{ e }^{ -\lambda x },x>0 }f(x,α,λ)={0,x≤0Γ(α)λαxα−1e−λx,x>0
则成X服从参数为α、λ的Γ分布,记为X∼Γ(α,λ){ X }\sim \Gamma (\alpha ,\lambda )X∼Γ(α,λ),其中α>0,λ>0为参数.

Γ函数

Γ(α)=∫0+∞xα−1e−xdx\Gamma (\alpha )=\int _{ 0 }^{ +\infty }{ { x }^{ \alpha -1 }{ e }^{ -x }dx }Γ(α)=∫0+∞xα−1e−xdx

Γ引申

Gamma(α+1)=αΓ(α)(因而Γ(n+1)=n!)Gamma (\alpha +1)=\alpha \Gamma (\alpha )(因而\Gamma (n+1)=n!)Gamma(α+1)=αΓ(α)(因而Γ(n+1)=n!)
Γ(1)=1\Gamma (1)=1Γ(1)=1
Γ(12)=π\Gamma (\frac { 1 }{ 2 } )=\sqrt { \pi }Γ(21)=π
Γ(p)Γ(q)Γ(p+q)=B(p,q)\frac { \Gamma (p)\Gamma (q) }{ \Gamma (p+q) } =B(p,q)Γ(p+q)Γ(p)Γ(q)=B(p,q)

性质1

若X∼Γ(α,λ)X\sim \Gamma (\alpha ,\lambda )X∼Γ(α,λ),则E(X)=αλ,D(X)=αλ2.E(X)=\frac { \alpha }{ \lambda } ,D(X)=\frac { \alpha }{ { \lambda }^{ 2 } } .E(X)=λα,D(X)=λ2α.

性质2(可加性)

若Xi∼Γ(αi,λ),i=1,⋯ ,n,且X1,⋯ ,Xn相互独立,则:若{ X }_{ i }\sim \Gamma ({ \alpha }_{ i },\lambda ),i=1,\cdots ,n,且{ X }_{ 1 },\cdots ,{ X }_{ n }相互独立,则:若Xi∼Γ(αi,λ),i=1,⋯,n,且X1,⋯,Xn相互独立,则:
X1+⋯+Xn∼Γ(α1+⋯+αn,λ).{ X }_{ 1 }+\cdots +{ X }_{ n }\sim \Gamma ({ \alpha }_{ 1 }+\cdots +{ \alpha }_{ n },\lambda ).X1+⋯+Xn∼Γ(α1+⋯+αn,λ).

β分布

若随机变量X具有概率密度
f(x;α,b)={0,其他xa−1(1−x)b−1B(a,b),0<x<1f(x;\alpha ,b)={ \{ }_{ 0,其他 }^{ \frac { { x }^{ a-1 }{ (1-x) }^{ b-1 } }{ B(a,b) } ,0<x<1 }f(x;α,b)={0,其他B(a,b)xa−1(1−x)b−1,0<x<1
则称X服从参数为a、b的β分布,记为X∼β(a,b){ X }\sim β (a ,b)X∼β(a,b),其中a>0,b>0为参数.

β函数

B(p,q)=∫01xp−1(1−x)q−1dxB(p,q)=\int _{ 0 }^{ 1 }{ { x }^{ p-1 }{ (1-x) }^{ q-1 }dx }B(p,q)=∫01xp−1(1−x)q−1dx

性质1

若X∼β(a,b)X\sim \beta (a,b)X∼β(a,b),则
E(X)=aa+b,D(X)=ab(a+b)2(a+b+1)E(X)=\frac { a }{ a+b } ,D(X)=\frac { ab }{ { (a+b) }^{ 2 }(a+b+1) }E(X)=a+ba,D(X)=(a+b)2(a+b+1)ab

性质2

若X∼Γ(a,1),Y∼Γ(b,1)X\sim \Gamma (a,1),Y\sim \Gamma (b,1)X∼Γ(a,1),Y∼Γ(b,1)且X,Y相互独立,则
Z=XX+Y∼β(a,b)Z=\frac { X }{ X+Y } \sim \beta (a,b)Z=X+YX∼β(a,b)

χ2分布{ \chi }^{ 2 }分布χ2分布

若随机变量X具有概率密度
χ2(x;n)={0,x≤0xn2−1e−x22n2Γ(n2),x>0{ \chi }^{ 2 }(x;n)={ \{ }_{ 0,x\le 0 }^{ \frac { { x }^{ \frac { n }{ 2 } -1 }{ e }^{ -\frac { x }{ 2 } } }{ { 2 }^{ \frac { n }{ 2 } }\Gamma (\frac { n }{ 2 } ) } ,x>0 }χ2(x;n)={0,x≤022nΓ(2n)x2n−1e−2x,x>0
则称X服从自由度为n的 χ2分布{ \chi }^{ 2 }分布χ2分布,记为 X∼χ2(n).X\sim { \chi }^{ 2 }(n).X∼χ2(n).随机变量X称为χ2{ \chi }^{ 2 }χ2变量.

性质1

若X∼χ2(n)X\sim { \chi }^{ 2 }(n)X∼χ2(n),则E(X)=n,D(X)=2nE(X)=n,D(X)=2nE(X)=n,D(X)=2n.

性质2(可加性)

若Xi∼χ2(ni),i=1,⋯ ,k且Xi,⋯ ,Xk相互独立,则若{ X }_{ i }\sim { \chi }^{ 2 }({ n }_{ i }),i=1,\cdots ,k且{ X }_{ i },\cdots ,{ X }_{ k }相互独立,则若Xi∼χ2(ni),i=1,⋯,k且Xi,⋯,Xk相互独立,则
X1+⋯+Xk∼χ2(n1+⋯+nk).{ X }_{ 1 }+\cdots +{ X }_{ k }\sim { \chi }^{ 2 }({ n }_{ 1 }+\cdots +{ n }_{ k }).X1+⋯+Xk∼χ2(n1+⋯+nk).

定理

设随机变量X1,⋯ ,Xn{ X }_{ 1 },\cdots ,{ X }_{ n }X1,⋯,Xn相互独立,且都服从标准正态分布N(0,1),则随机变量
χ2=∑i=1nXi2{ \chi }^{ 2 }=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } }χ2=∑i=1nXi2服从自由度为n的χ2分布{ \chi }^{ 2 }分布χ2分布,即χ2∼χ2(n){ \chi }^{ 2 }\sim { \chi }^{ 2 }(n)χ2∼χ2(n)

t分布

若随机变量T具有概率密度
t(x;n)=Γ(n+12)nπΓ(n2)(1+x2n)−n+12,−∞<x<+∞t(x;n)=\frac { \Gamma (\frac { n+1 }{ 2 } ) }{ \sqrt { n\pi } \Gamma (\frac { n }{ 2 } ) } { (1+\frac { { x }^{ 2 } }{ n } ) }^{ -\frac { n+1 }{ 2 } },-\infty <x<+\inftyt(x;n)=nπΓ(2n)Γ(2n+1)(1+nx2)−2n+1,−∞<x<+∞
则称T服从自由度为n的t分布,记为T~t(n).t分布又称为学生分布.

定理

若X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则若X\sim N(0,1),Y\sim { \chi }^{ 2 }(n),且X与Y相互独立,则若X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则
T=XYn∼t(n)T=\frac { X }{ \sqrt { \frac { Y }{ n } } } \sim t(n)T=nYX∼t(n)

F分布

若随机变量F具有概率密度
f(x;n1,n2)={0,x≤0Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)(n1n2x)n12−1(1+n1n2x)−n1+n22,x>0f(x;{ n }_{ 1 },{ n }_{ 2 })={ \{ }_{ 0,x\le 0 }^{ \frac { \Gamma (\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } ) }{ \Gamma (\frac { { n }_{ 1 } }{ 2 } )\Gamma (\frac { { n }_{ 2 } }{ 2 } ) } (\frac { { n }_{ 1 } }{ { n }_{ 2 } } ){ (\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ \frac { { n }_{ 1 } }{ 2 } -1 }{ (1+\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ -\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } },x>0 }f(x;n1,n2)={0,x≤0Γ(2n1)Γ(2n2)Γ(2n1+n2)(n2n1)(n2n1x)2n1−1(1+n2n1x)−2n1+n2,x>0
则称F服从自由度为(n1,n2)({ n }_{ 1 },{ n }_{ 2 })(n1,n2)的F分布,记为F∼F(n1,n2).F\sim F({ n }_{ 1 },{ n }_{ 2 }).F∼F(n1,n2).

定理

若X∼χ2(n1),Y∼χ2(n2),且X与Y相互独立,则若X\sim { \chi }^{ 2 }({ n }_{ 1 }),Y\sim { \chi }^{ 2 }({ n }_{ 2 }),且X与Y相互独立,则若X∼χ2(n1),Y∼χ2(n2),且X与Y相互独立,则
F=Xn1Yn2∼F(n1,n2)F=\frac { \frac { X }{ { n }_{ 1 } } }{ \frac { Y }{ { n }_{ 2 } } } \sim F({ n }_{ 1 },{ n }_{ 2 })F=n2Yn1X∼F(n1,n2)

推论

在定理的条件下,若F∼F(n1,n2),则1F∼F(n2,n1).在定理的条件下,若F\sim F({ n }_{ 1 },{ n }_{ 2 }),则\frac { 1 }{ F } \sim F({ n }_{ 2 },{ n }_{ 1 }).在定理的条件下,若F∼F(n1,n2),则F1∼F(n2,n1).

分位数

设随机变量X的分布函数为F(x)=P{X≤x},对于0<p<1,若有xp满足设随机变量X的分布函数为F(x)=P\{ X\le x\} ,对于0<p<1,若有{ x }_{ p }满足设随机变量X的分布函数为F(x)=P{X≤x},对于0<p<1,若有xp满足
P{X≤xp}=F(xp)=pP\{ X\le { x }_{ p }\} =F({ x }_{ p })=pP{X≤xp}=F(xp)=p
则称xp为分布F(x)(或随机变量X)的下侧p分位数;对于0<α<1,若有yα满足则称{ x }_{ p }为分布F(x)(或随机变量X)的下侧p分位数;对于0<\alpha <1,若有{ y }_{ \alpha }满足则称xp为分布F(x)(或随机变量X)的下侧p分位数;对于0<α<1,若有yα满足
P{X>yα}=1−F(yα)=αP\{ X>{ y }_{ \alpha }\} =1-F({ y }_{ \alpha })=\alphaP{X>yα}=1−F(yα)=α
则称yα为分布F(x)(或随机变量X)的上侧α分位数.则称{ y }_{ \alpha }为分布F(x)(或随机变量X)的上侧\alpha 分位数.则称yα为分布F(x)(或随机变量X)的上侧α分位数.
由定义可知,yα=x1−α;xp=y1−p由定义可知,{ y }_{ \alpha }={ x }_{ 1-\alpha };{ x }_{ p }={ y }_{ 1-p }由定义可知,yα=x1−α;xp=y1−p

正态总体的抽样分布

定理1

设X1,⋯ ,Xn是来自正态总体N(μ,σ2)的样本,X‾为样本均值,S∗2为修正样本方差,则设{ X }_{ 1 },\cdots ,{ X }_{ n }是来自正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则设X1,⋯,Xn是来自正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
(1)X‾∼N(μ,σ2n);\overline { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } );X∼N(μ,nσ2);
(2)(n−1)S∗2σ2=nS2σ2=1σ2∑i=1n(Xi−X‾)2∼χ2(n−1);\frac { (n-1){ S }^{ *2 } }{ { \sigma }^{ 2 } } =\frac { n{ S }^{ 2 } }{ { \sigma }^{ 2 } } =\frac { 1 }{ { \sigma }^{ 2 } } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } \sim { \chi }^{ 2 }(n-1);σ2(n−1)S∗2=σ2nS2=σ21∑i=1n(Xi−X)2∼χ2(n−1);
(3)X‾与S∗2相互独立\overline { X } 与{ S }^{ *2 }相互独立X与S∗2相互独立

定理2

设X1,⋯ ,Xn为正态总体N(μ,σ2)的样本,X‾为样本均值,S∗2为修正样本方差,则设{ X }_{ 1 },\cdots ,{ X }_{ { n } }为正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则设X1,⋯,Xn为正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
T=n(X‾−μ)S∗∼t(n−1)T=\frac { \sqrt { n } (\overline { X } -\mu ) }{ { S }^{ * } } \sim t(n-1)T=S∗n(X−μ)∼t(n−1)

定理3

设X1,⋯ ,Xn1和Y1,⋯ ,Yn2分别为正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且两样本相互独立,记设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ \sigma }^{ 2 })和N({ \mu }_{ 2 },{ \sigma }^{ 2 })的样本,且两样本相互独立,记设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且两样本相互独立,记
X‾=1n1∑i=1n1Xi,Y‾=1n2∑i=1n2Yi,S1n1∗2=1n1−1∑i=1n1(Xi−X‾)2,S2n2∗2=1n2−1∑i=1n2(Yi−Y‾)2,则有\overline { X } =\frac { 1 }{ { n }_{ 1 } } \sum _{ i=1 }^{ { n }_{ 1 } }{ { X }_{ i } } ,\\ \overline { Y } =\frac { 1 }{ { n }_{ 2 } } \sum _{ i=1 }^{ { n }_{ 2 } }{ { Y }_{ i } } ,\\ { S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }=\frac { 1 }{ { n }_{ 1 }-1 } \sum _{ i=1 }^{ { n }_{ 1 } }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } ,\\ { S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }=\frac { 1 }{ { n }_{ 2 }-1 } \sum _{ i=1 }^{ { n }_{ 2 } }{ { ({ Y }_{ i }-\overline { Y } ) }^{ 2 } } ,则有X=n11∑i=1n1Xi,Y=n21∑i=1n2Yi,S1n1∗2=n1−11∑i=1n1(Xi−X)2,S2n2∗2=n2−11∑i=1n2(Yi−Y)2,则有
T=(X‾−Y‾)−(μ1−μ2)Sω1n1+1n2∼t(n1+n2−2)T=\frac { (\overline { X } -\overline { Y } )-({ \mu }_{ 1 }-{ \mu }_{ 2 }) }{ { S }_{ \omega }\sqrt { \frac { 1 }{ { n }_{ 1 } } +\frac { 1 }{ { n }_{ 2 } } } } \sim t({ n }_{ 1 }+{ n }_{ 2 }-2)T=Sωn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中
Sω=(n1−1)S1n1∗2+(n2−1)S2n2∗2n1+n2−2{ S }_{ \omega }=\sqrt { \frac { ({ n }_{ 1 }-1){ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }+({ n }_{ 2 }-1){ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } }{ { n }_{ 1 }+{ n }_{ 2 }-2 } }Sω=n1+n2−2(n1−1)S1n1∗2+(n2−1)S2n2∗2

定理4

设X1,⋯ ,Xn1和Y1,⋯ ,Yn2分别为正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立,S1n1∗2和S2n2∗2分别为两个样本各自的修正方差,则设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ { \sigma }_{ 1 } }^{ 2 })和N({ \mu }_{ 2 },{ { \sigma }_{ 2 } }^{ 2 })的样本,且两样本相互独立,{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }和{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }分别为两个样本各自的修正方差,则设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立,S1n1∗2和S2n2∗2分别为两个样本各自的修正方差,则
F=σ22S1n1∗2σ12S2n2∗2∼F(n1−1,n2−1)F=\frac { { \sigma }_{ 2 }^{ 2 }{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 } }{ { \sigma }_{ 1 }^{ 2 }{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } } \sim F({ n }_{ 1 }-1,{ n }_{ 2 }-1)F=σ12S2n2∗2σ22S1n1∗2∼F(n1−1,n2−1)

定理5(柯赫伦)-该定理在方差分析和回归分析中具有重要作用.

设X1,⋯ ,Xn是n个相互独立的标准正态变量,记Q=∑i=1nXi2.若Q可以分解为Q=Q1+⋯+Qk其中Qi(i=1,⋯ ,k)是X1,⋯ ,Xn的秩为ni的非负定二次型,设{ X }_{ 1 },\cdots ,{ X }_{ n }是n个相互独立的标准正态变量,记Q=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } } .若Q可以分解为\\ Q={ Q }_{ 1 }+\cdots +{ Q }_{ k }\\ 其中{ Q }_{ i }(i=1,\cdots ,k)是{ X }_{ 1 },\cdots ,{ X }_{ n }的秩为{ n }_{ i }的非负定二次型,设X1,⋯,Xn是n个相互独立的标准正态变量,记Q=∑i=1nXi2.若Q可以分解为Q=Q1+⋯+Qk其中Qi(i=1,⋯,k)是X1,⋯,Xn的秩为ni的非负定二次型,
则Q1,⋯ ,Qk相互独立,且Qi∼χ2(ni)(i=1,⋯ ,k)的充分必要条件是∑i=1kni=n则{ Q }_{ 1 },\cdots ,{ Q }_{ k }相互独立,且{ Q }_{ i }\sim { \chi }^{ 2 }({ n }_{ i })(i=1,\cdots ,k)的充分必要条件是\\ \sum _{ i=1 }^{ k }{ { n }_{ i } } =n则Q1,⋯,Qk相互独立,且Qi∼χ2(ni)(i=1,⋯,k)的充分必要条件是∑i=1kni=n

正态标准化

X∼N(μ,σ2)X\sim N(\mu ,{ \sigma }^{ 2 })X∼N(μ,σ2)
X−μσ∼N(0,1)\frac { X-\mu }{ \sigma } \sim N(0,1)σX−μ∼N(0,1)
Xˉ∼N(μ,σ2n)\bar { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } )Xˉ∼N(μ,nσ2)
n(Xˉ−μ)σ∼N(0,1)\frac { \sqrt { n } (\bar { X } -\mu ) }{ \sigma } \sim N(0,1)σn(Xˉ−μ)∼N(0,1)

置信区间(X‾\overline {X}X-△,X‾\overline {X}X+△)

当σ\sigmaσ已知

△=μα2σn{ \mu }_{ \frac { \alpha }{ 2 } }\frac { \sigma }{ \sqrt { n } }μ2αnσ

当σ\sigmaσ未知

△=tα2(n−1)Sn{ t }_{ \frac { \alpha }{ 2 } }(n-1)\frac { S }{ \sqrt { n } }t2α(n−1)nS

各种分布的方程

二项分布X~B(n,p),则随机变量X的分布列为

P(X=k)=Cnk{C}_{n}^{k}Cnkp^k (1-p)^n-k k=0,1,…,n
μ=np\mu=npμ=np
σ2=npq{\sigma}^{2}=npqσ2=npq

泊松分布X~P(λ)

P(X=k)=λke−λk!\frac { { \lambda }^{ k }{ e }^{ -\lambda } }{ k! }k!λke−λ,λ>0,k=0,1…
μ=λ\mu=\lambdaμ=λ
σ2=λ{\sigma}^{2}=\lambdaσ2=λ

均匀分布X~U(a,b)

f(x)={1b−a0,其他,a≤x≤bf\left( x \right) =\begin{cases} \frac { 1 }{ b-a } \\ 0,其他 \end{cases},a\le x\le bf(x)={b−a10,其他,a≤x≤b
μ=a+b2\mu=\frac { a+b }{ 2 }μ=2a+b
σ2=(b−a)212{\sigma}^{2}=\frac { {(b-a)}^{2} }{ 12 }σ2=12(b−a)2

指数分布X~Exp(λ)

f(x)={λe−λx,x>00,x≤0f\left( x \right) =\begin{cases} \lambda { e }^{ -\lambda x },x>0 \\ 0,x\le 0 \end{cases}f(x)={λe−λx,x>00,x≤0
μ=1λ\mu=\frac { 1 }{ \lambda }μ=λ1
σ2=1λ2{\sigma}^{2}=\frac { 1 }{ {\lambda}^{2} }σ2=λ21

正态分布X~(μ,σ2\mu,{\sigma}^{2}μ,σ2)

f(x)=1σ2πe−(x−μ)22σ2f\left( x \right) =\frac { 1 }{ \sigma \sqrt { 2\pi } } { e }^{ -\frac { { (x-\mu ) }^{ 2 } }{ 2{ \sigma }^{ 2 } } }f(x)=σ2π1e−2σ2(x−μ)2

用概率密度求均值

μ=概率密度的积分\mu=概率密度的积分μ=概率密度的积分

用极差R求标准差的估计

σ^=Rdn\hat \sigma=\frac {R}{{d}_{n}}σ^=dnR n为样本个数dn{d}_{n}dn可查表得

数理统计内容整理（一）基本概念相关推荐

最新【独家沙龙内容整理】机器女友？—百度微软讯飞等顶级专家谈人机对话黑科技及未来 ——by中科院孢子创客空间
最新[独家沙龙内容整理]机器女友?-百度微软讯飞等顶级专家谈人机对话黑科技及未来 --by中科院孢子创客空间 1.写在前面非常非常感谢[公众号:机器学习研究会 ]举办的这次沙龙.赞赞赞.以下内容皆来 ...
CSS核心内容整理 - (中)
2019独角兽企业重金招聘Python工程师标准>>> 本文是CSS核心内容整理的第二篇,承接上一篇的内容继续对CSS的一些重要内容进行整理,推荐先看完这个系列的上一篇. 四. 页 ...
【项目管理】RUP内容整理
针对RUP相关内容整理如下:(持续更新补充) 目录定义核心概念三大特点核心工作流十大要素相关观点定义 RUP(Rational Unified Process),统一软件开发过程,统一软 ...
【项目管理】CMMI内容整理
相关CMMI 内容整理如下:(持续更新补充) 目录定义五大级别引入原因认证给企业带来的价值实施流程相关观点定义 CMMI的全称为Capability Maturity Model In ...
c++求n的几次方_数理统计|笔记整理（E）——Ch7-C习题课
上一节笔记传送门:数理统计|笔记整理(D)--Ch1-6习题课 -------------------------------------- 大家好!这一节我们依然会补充一些习题,内容则是正文的后半部 ...
Google C++ 风格指南内容整理
之前一直没有全面的看过Google C++风格指南,现在很多公司进行C++开发都要求按照Google C++风格.在这个网站 http://zh-google-styleguide.readthedo ...
【STUDY|CV-PR】考试内容整理
目录一.[必]华为实验 30分二.相机模型三.光流☆ 四.经典的聚类算法 1.K-means 2.高斯模型 3.meanshit 4.霍夫变换考试:闭卷 17周周四随堂考(6.16) 记录:实 ...
Infineon TC297 reset 内容整理
Infineon TC297 reset 内容整理 SCU.RCU.SMU System Control Unit (SCU)Reset Control Unit (RCU)Safety Manage ...
人工智能/云原生/数据科学/计算等方向内容整理志愿者招募了！
持续招募内容整理志愿者!云原生.数据科学.AI.低代码.计算等方向,有意愿的小伙伴,欢迎识别二维码提前报名哦.我们将持续为爱学习.有时间的小伙伴,提供多重福利! 要求: 1. 你需要具备一定学术背景, ...