数理统计内容整理(一)基本概念
总体(或母体)
所研究的对象的全体。
个体
这里是引用
总体中的元素。
有限总体
总体中的个体数目为有限。
无限总体
总体中的个数数目为无线。
数理统计
关心的是某一项或若干项数量指标X(向量)和该数量指标X在总体中的分布情况。–“所谓的总体的分布就是数量指标X的分布”
样本及其分布
样本
从总体中取得一部分个体,这一部分个体成为样本(或子样)
样品
样本中的每个个体称为样本
样本容量
样本中的个体数目称为样本容量
抽样
取得样本的过程
抽样法
抽样中采用的方法
随机抽样法
从总体中随意的抽取若干个个体–一般采用此方法
样本空间
总体X随机抽样的到的样本按顺序排序用X1…Xn表示,或者用n维随即向量X=^(X1,⋯ ,Xn)TX\quad \widehat { = } \quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }X=(X1,⋯,Xn)T表示.
样本(X1,⋯ ,Xn)T\quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }(X1,⋯,Xn)T可能取值的全体成为样本空间
i.i.d.
独立同分布
简单随机样本
X1{ X }_{ 1 }X1的分布与总体X的分布相同
分布-对于简单随机样本X1…Xn
若总体的分布函数为F(x)则样本的联合分布函数为:
Fs(x1,⋯ ,xn)=∏i=1nF(xi){ F }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ F({ x }_{ i }) }Fs(x1,⋯,xn)=∏i=1nF(xi)
若总体的概率密度f(x)则样本的联合概率密度为:
fs(x1,⋯ ,xn)=∏i=1nf(xi){ f }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ f({ x }_{ i }) }fs(x1,⋯,xn)=∏i=1nf(xi)
若总体具有分布律(概率函数)p(x),其中p(ai) = P(X = ai),则样本的联合概率函数为:
ps(x1,⋯ ,xn)=∏i=1np(xi){ p }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n })=\prod _{ i=1 }^{ n }{ p({ x }_{ i }) }ps(x1,⋯,xn)=∏i=1np(xi)
统计量
样本均值
Xˉ=1n∑i=1nXi\bar { X } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i } }Xˉ=n1∑i=1nXi
样本方差
S2=1n∑i=1n(Xi−X‾)2=1n∑i=1nXi2−X‾2{ S }^{ 2 }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { { X }_{ i } }^{ 2 } } -{ \overline { X } }^{ 2 }S2=n1∑i=1n(Xi−X)2=n1∑i=1nXi2−X2
修正样本方差
S∗2=1n−1∑i=1n(Xi−X‾)2{ S }^{ *2 }=\frac { 1 }{ n-1 } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } }S∗2=n−11∑i=1n(Xi−X)2
样本k阶原点矩
Ak=1n∑i=1nXik{ A }_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i }^{ k } }Ak=n1∑i=1nXik
样本k阶中心距
Bk=1n∑i=1n(Xi−X‾)kB_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ k } }Bk=n1∑i=1n(Xi−X)k
X(k)的概率密度f(k)(x)(1<=k<=n)
f(k)(x)=n!(k−1)!(n−k)![F(x)]k−1[1−F(x)]n−kf(x){ f }_{ (k) }(x)=\frac { n! }{ (k-1)!(n-k)! } { [F(x)] }^{ k-1 }{ [1-F(x)] }^{ n-k }f(x)f(k)(x)=(k−1)!(n−k)!n![F(x)]k−1[1−F(x)]n−kf(x)
X(k)与X(j)的联合概率密度f(k)(j)(x,y)(1<=k<=j<=n)
f(k)(j)(x,y)=n!(k−1)!(j−k−1)!(n−j)![F(x)]k−1[F(y)−F(x)]j−k−1[1−F(y)]n−jf(x)f(y){ f }_{ (k)(j) }(x,y)=\frac { n! }{ (k-1)!(j-k-1)!(n-j)! } { [F(x)] }^{ k-1 }{ [F(y)-F(x)] }^{ j-k-1 }{ [1-F(y)] }^{ n-j }f(x)f(y)f(k)(j)(x,y)=(k−1)!(j−k−1)!(n−j)!n![F(x)]k−1[F(y)−F(x)]j−k−1[1−F(y)]n−jf(x)f(y)
在顺序统计量中
样本中位数
Me={12(Xn/2+X(n/2+1)),n为偶数X((n+1)/2),n为奇数Me={ \{ }_{ \frac { 1 }{ 2 } ({ X }_{ n/2 }+{ X }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { X }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }Me={21(Xn/2+X(n/2+1)),n为偶数X((n+1)/2),n为奇数
观察值为
me={12(xn/2+x(n/2+1)),n为偶数x((n+1)/2),n为奇数me={ \{ }_{ \frac { 1 }{ 2 } ({ x }_{ n/2 }+{ x }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { x }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }me={21(xn/2+x(n/2+1)),n为偶数x((n+1)/2),n为奇数
样本极差
R=X(n)−X(1)R={ X }_{ (n) } - { X }_{ (1) }R=X(n)−X(1)
其观察值为
r=x(n)−x(1)r={ x }_{ (n) } - { x }_{ (1) }r=x(n)−x(1)
经验分布函数
抽样分布
所谓抽样分布是指统计量的概率分布,确定统计量的分布是数理统计学的基本问题之一.一般情况下,统计量分布的推导问题可分为两种情况进行讨论:(1)当已知总体X的分布时,若对任意容量为n的样本X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的分布,则称该分布为g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的精确分布.确定统计量的精确分布,对于数理统计中的所谓小样问题(指样本容量n较小时的统计问题)的研究是很重要的;(2)当n->∞时,能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n}X1,...Xn)的极限分布.统计量的极限分布对于数理统计中得到的所谓大样问题(指样本容量n较大时的统计问题)的研究是非常有用的.
Γ分布
若随机变量X具有概率密度
f(x,α,λ)={0,x≤0λαΓ(α)xα−1e−λx,x>0f(x,\alpha ,\lambda )={ \{ }_{ 0,x\le 0 }^{ \frac { { \lambda }^{ \alpha } }{ \Gamma (\alpha ) } { x }^{ \alpha -1 }{ e }^{ -\lambda x },x>0 }f(x,α,λ)={0,x≤0Γ(α)λαxα−1e−λx,x>0
则成X服从参数为α、λ的Γ分布,记为X∼Γ(α,λ){ X }\sim \Gamma (\alpha ,\lambda )X∼Γ(α,λ),其中α>0,λ>0为参数.
Γ函数
Γ(α)=∫0+∞xα−1e−xdx\Gamma (\alpha )=\int _{ 0 }^{ +\infty }{ { x }^{ \alpha -1 }{ e }^{ -x }dx }Γ(α)=∫0+∞xα−1e−xdx
Γ引申
Gamma(α+1)=αΓ(α)(因而Γ(n+1)=n!)Gamma (\alpha +1)=\alpha \Gamma (\alpha )(因而\Gamma (n+1)=n!)Gamma(α+1)=αΓ(α)(因而Γ(n+1)=n!)
Γ(1)=1\Gamma (1)=1Γ(1)=1
Γ(12)=π\Gamma (\frac { 1 }{ 2 } )=\sqrt { \pi }Γ(21)=π
Γ(p)Γ(q)Γ(p+q)=B(p,q)\frac { \Gamma (p)\Gamma (q) }{ \Gamma (p+q) } =B(p,q)Γ(p+q)Γ(p)Γ(q)=B(p,q)
性质1
若X∼Γ(α,λ)X\sim \Gamma (\alpha ,\lambda )X∼Γ(α,λ),则E(X)=αλ,D(X)=αλ2.E(X)=\frac { \alpha }{ \lambda } ,D(X)=\frac { \alpha }{ { \lambda }^{ 2 } } .E(X)=λα,D(X)=λ2α.
性质2(可加性)
若Xi∼Γ(αi,λ),i=1,⋯ ,n,且X1,⋯ ,Xn相互独立,则:若{ X }_{ i }\sim \Gamma ({ \alpha }_{ i },\lambda ),i=1,\cdots ,n,且{ X }_{ 1 },\cdots ,{ X }_{ n }相互独立,则:若Xi∼Γ(αi,λ),i=1,⋯,n,且X1,⋯,Xn相互独立,则:
X1+⋯+Xn∼Γ(α1+⋯+αn,λ).{ X }_{ 1 }+\cdots +{ X }_{ n }\sim \Gamma ({ \alpha }_{ 1 }+\cdots +{ \alpha }_{ n },\lambda ).X1+⋯+Xn∼Γ(α1+⋯+αn,λ).
β分布
若随机变量X具有概率密度
f(x;α,b)={0,其他xa−1(1−x)b−1B(a,b),0<x<1f(x;\alpha ,b)={ \{ }_{ 0,其他 }^{ \frac { { x }^{ a-1 }{ (1-x) }^{ b-1 } }{ B(a,b) } ,0<x<1 }f(x;α,b)={0,其他B(a,b)xa−1(1−x)b−1,0<x<1
则称X服从参数为a、b的β分布,记为X∼β(a,b){ X }\sim β (a ,b)X∼β(a,b),其中a>0,b>0为参数.
β函数
B(p,q)=∫01xp−1(1−x)q−1dxB(p,q)=\int _{ 0 }^{ 1 }{ { x }^{ p-1 }{ (1-x) }^{ q-1 }dx }B(p,q)=∫01xp−1(1−x)q−1dx
性质1
若X∼β(a,b)X\sim \beta (a,b)X∼β(a,b),则
E(X)=aa+b,D(X)=ab(a+b)2(a+b+1)E(X)=\frac { a }{ a+b } ,D(X)=\frac { ab }{ { (a+b) }^{ 2 }(a+b+1) }E(X)=a+ba,D(X)=(a+b)2(a+b+1)ab
性质2
若X∼Γ(a,1),Y∼Γ(b,1)X\sim \Gamma (a,1),Y\sim \Gamma (b,1)X∼Γ(a,1),Y∼Γ(b,1)且X,Y相互独立,则
Z=XX+Y∼β(a,b)Z=\frac { X }{ X+Y } \sim \beta (a,b)Z=X+YX∼β(a,b)
χ2分布{ \chi }^{ 2 }分布χ2分布
若随机变量X具有概率密度
χ2(x;n)={0,x≤0xn2−1e−x22n2Γ(n2),x>0{ \chi }^{ 2 }(x;n)={ \{ }_{ 0,x\le 0 }^{ \frac { { x }^{ \frac { n }{ 2 } -1 }{ e }^{ -\frac { x }{ 2 } } }{ { 2 }^{ \frac { n }{ 2 } }\Gamma (\frac { n }{ 2 } ) } ,x>0 }χ2(x;n)={0,x≤022nΓ(2n)x2n−1e−2x,x>0
则称X服从自由度为n的 χ2分布{ \chi }^{ 2 }分布χ2分布,记为 X∼χ2(n).X\sim { \chi }^{ 2 }(n).X∼χ2(n).随机变量X称为χ2{ \chi }^{ 2 }χ2变量.
性质1
若X∼χ2(n)X\sim { \chi }^{ 2 }(n)X∼χ2(n),则E(X)=n,D(X)=2nE(X)=n,D(X)=2nE(X)=n,D(X)=2n.
性质2(可加性)
若Xi∼χ2(ni),i=1,⋯ ,k且Xi,⋯ ,Xk相互独立,则若{ X }_{ i }\sim { \chi }^{ 2 }({ n }_{ i }),i=1,\cdots ,k且{ X }_{ i },\cdots ,{ X }_{ k }相互独立,则若Xi∼χ2(ni),i=1,⋯,k且Xi,⋯,Xk相互独立,则
X1+⋯+Xk∼χ2(n1+⋯+nk).{ X }_{ 1 }+\cdots +{ X }_{ k }\sim { \chi }^{ 2 }({ n }_{ 1 }+\cdots +{ n }_{ k }).X1+⋯+Xk∼χ2(n1+⋯+nk).
定理
设随机变量X1,⋯ ,Xn{ X }_{ 1 },\cdots ,{ X }_{ n }X1,⋯,Xn相互独立,且都服从标准正态分布N(0,1),则随机变量
χ2=∑i=1nXi2{ \chi }^{ 2 }=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } }χ2=∑i=1nXi2服从自由度为n的χ2分布{ \chi }^{ 2 }分布χ2分布,即χ2∼χ2(n){ \chi }^{ 2 }\sim { \chi }^{ 2 }(n)χ2∼χ2(n)
t分布
若随机变量T具有概率密度
t(x;n)=Γ(n+12)nπΓ(n2)(1+x2n)−n+12,−∞<x<+∞t(x;n)=\frac { \Gamma (\frac { n+1 }{ 2 } ) }{ \sqrt { n\pi } \Gamma (\frac { n }{ 2 } ) } { (1+\frac { { x }^{ 2 } }{ n } ) }^{ -\frac { n+1 }{ 2 } },-\infty <x<+\inftyt(x;n)=nπΓ(2n)Γ(2n+1)(1+nx2)−2n+1,−∞<x<+∞
则称T服从自由度为n的t分布,记为T~t(n).t分布又称为学生分布.
定理
若X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则若X\sim N(0,1),Y\sim { \chi }^{ 2 }(n),且X与Y相互独立,则若X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则
T=XYn∼t(n)T=\frac { X }{ \sqrt { \frac { Y }{ n } } } \sim t(n)T=nYX∼t(n)
F分布
若随机变量F具有概率密度
f(x;n1,n2)={0,x≤0Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)(n1n2x)n12−1(1+n1n2x)−n1+n22,x>0f(x;{ n }_{ 1 },{ n }_{ 2 })={ \{ }_{ 0,x\le 0 }^{ \frac { \Gamma (\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } ) }{ \Gamma (\frac { { n }_{ 1 } }{ 2 } )\Gamma (\frac { { n }_{ 2 } }{ 2 } ) } (\frac { { n }_{ 1 } }{ { n }_{ 2 } } ){ (\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ \frac { { n }_{ 1 } }{ 2 } -1 }{ (1+\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ -\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } },x>0 }f(x;n1,n2)={0,x≤0Γ(2n1)Γ(2n2)Γ(2n1+n2)(n2n1)(n2n1x)2n1−1(1+n2n1x)−2n1+n2,x>0
则称F服从自由度为(n1,n2)({ n }_{ 1 },{ n }_{ 2 })(n1,n2)的F分布,记为F∼F(n1,n2).F\sim F({ n }_{ 1 },{ n }_{ 2 }).F∼F(n1,n2).
定理
若X∼χ2(n1),Y∼χ2(n2),且X与Y相互独立,则若X\sim { \chi }^{ 2 }({ n }_{ 1 }),Y\sim { \chi }^{ 2 }({ n }_{ 2 }),且X与Y相互独立,则若X∼χ2(n1),Y∼χ2(n2),且X与Y相互独立,则
F=Xn1Yn2∼F(n1,n2)F=\frac { \frac { X }{ { n }_{ 1 } } }{ \frac { Y }{ { n }_{ 2 } } } \sim F({ n }_{ 1 },{ n }_{ 2 })F=n2Yn1X∼F(n1,n2)
推论
在定理的条件下,若F∼F(n1,n2),则1F∼F(n2,n1).在定理的条件下,若F\sim F({ n }_{ 1 },{ n }_{ 2 }),则\frac { 1 }{ F } \sim F({ n }_{ 2 },{ n }_{ 1 }).在定理的条件下,若F∼F(n1,n2),则F1∼F(n2,n1).
分位数
设随机变量X的分布函数为F(x)=P{X≤x},对于0<p<1,若有xp满足设随机变量X的分布函数为F(x)=P\{ X\le x\} ,对于0<p<1,若有{ x }_{ p }满足设随机变量X的分布函数为F(x)=P{X≤x},对于0<p<1,若有xp满足
P{X≤xp}=F(xp)=pP\{ X\le { x }_{ p }\} =F({ x }_{ p })=pP{X≤xp}=F(xp)=p
则称xp为分布F(x)(或随机变量X)的下侧p分位数;对于0<α<1,若有yα满足则称{ x }_{ p }为分布F(x)(或随机变量X)的下侧p分位数;对于0<\alpha <1,若有{ y }_{ \alpha }满足则称xp为分布F(x)(或随机变量X)的下侧p分位数;对于0<α<1,若有yα满足
P{X>yα}=1−F(yα)=αP\{ X>{ y }_{ \alpha }\} =1-F({ y }_{ \alpha })=\alphaP{X>yα}=1−F(yα)=α
则称yα为分布F(x)(或随机变量X)的上侧α分位数.则称{ y }_{ \alpha }为分布F(x)(或随机变量X)的上侧\alpha 分位数.则称yα为分布F(x)(或随机变量X)的上侧α分位数.
由定义可知,yα=x1−α;xp=y1−p由定义可知,{ y }_{ \alpha }={ x }_{ 1-\alpha };{ x }_{ p }={ y }_{ 1-p }由定义可知,yα=x1−α;xp=y1−p
正态总体的抽样分布
定理1
设X1,⋯ ,Xn是来自正态总体N(μ,σ2)的样本,X‾为样本均值,S∗2为修正样本方差,则设{ X }_{ 1 },\cdots ,{ X }_{ n }是来自正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则设X1,⋯,Xn是来自正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
(1)X‾∼N(μ,σ2n);\overline { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } );X∼N(μ,nσ2);
(2)(n−1)S∗2σ2=nS2σ2=1σ2∑i=1n(Xi−X‾)2∼χ2(n−1);\frac { (n-1){ S }^{ *2 } }{ { \sigma }^{ 2 } } =\frac { n{ S }^{ 2 } }{ { \sigma }^{ 2 } } =\frac { 1 }{ { \sigma }^{ 2 } } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } \sim { \chi }^{ 2 }(n-1);σ2(n−1)S∗2=σ2nS2=σ21∑i=1n(Xi−X)2∼χ2(n−1);
(3)X‾与S∗2相互独立\overline { X } 与{ S }^{ *2 }相互独立X与S∗2相互独立
定理2
设X1,⋯ ,Xn为正态总体N(μ,σ2)的样本,X‾为样本均值,S∗2为修正样本方差,则设{ X }_{ 1 },\cdots ,{ X }_{ { n } }为正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则设X1,⋯,Xn为正态总体N(μ,σ2)的样本,X为样本均值,S∗2为修正样本方差,则
T=n(X‾−μ)S∗∼t(n−1)T=\frac { \sqrt { n } (\overline { X } -\mu ) }{ { S }^{ * } } \sim t(n-1)T=S∗n(X−μ)∼t(n−1)
定理3
设X1,⋯ ,Xn1和Y1,⋯ ,Yn2分别为正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且两样本相互独立,记设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ \sigma }^{ 2 })和N({ \mu }_{ 2 },{ \sigma }^{ 2 })的样本,且两样本相互独立,记设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且两样本相互独立,记
X‾=1n1∑i=1n1Xi,Y‾=1n2∑i=1n2Yi,S1n1∗2=1n1−1∑i=1n1(Xi−X‾)2,S2n2∗2=1n2−1∑i=1n2(Yi−Y‾)2,则有\overline { X } =\frac { 1 }{ { n }_{ 1 } } \sum _{ i=1 }^{ { n }_{ 1 } }{ { X }_{ i } } ,\\ \overline { Y } =\frac { 1 }{ { n }_{ 2 } } \sum _{ i=1 }^{ { n }_{ 2 } }{ { Y }_{ i } } ,\\ { S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }=\frac { 1 }{ { n }_{ 1 }-1 } \sum _{ i=1 }^{ { n }_{ 1 } }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } ,\\ { S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }=\frac { 1 }{ { n }_{ 2 }-1 } \sum _{ i=1 }^{ { n }_{ 2 } }{ { ({ Y }_{ i }-\overline { Y } ) }^{ 2 } } ,则有X=n11∑i=1n1Xi,Y=n21∑i=1n2Yi,S1n1∗2=n1−11∑i=1n1(Xi−X)2,S2n2∗2=n2−11∑i=1n2(Yi−Y)2,则有
T=(X‾−Y‾)−(μ1−μ2)Sω1n1+1n2∼t(n1+n2−2)T=\frac { (\overline { X } -\overline { Y } )-({ \mu }_{ 1 }-{ \mu }_{ 2 }) }{ { S }_{ \omega }\sqrt { \frac { 1 }{ { n }_{ 1 } } +\frac { 1 }{ { n }_{ 2 } } } } \sim t({ n }_{ 1 }+{ n }_{ 2 }-2)T=Sωn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中
Sω=(n1−1)S1n1∗2+(n2−1)S2n2∗2n1+n2−2{ S }_{ \omega }=\sqrt { \frac { ({ n }_{ 1 }-1){ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }+({ n }_{ 2 }-1){ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } }{ { n }_{ 1 }+{ n }_{ 2 }-2 } }Sω=n1+n2−2(n1−1)S1n1∗2+(n2−1)S2n2∗2
定理4
设X1,⋯ ,Xn1和Y1,⋯ ,Yn2分别为正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立,S1n1∗2和S2n2∗2分别为两个样本各自的修正方差,则设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ { \sigma }_{ 1 } }^{ 2 })和N({ \mu }_{ 2 },{ { \sigma }_{ 2 } }^{ 2 })的样本,且两样本相互独立,{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }和{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }分别为两个样本各自的修正方差,则设X1,⋯,Xn1和Y1,⋯,Yn2分别为正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立,S1n1∗2和S2n2∗2分别为两个样本各自的修正方差,则
F=σ22S1n1∗2σ12S2n2∗2∼F(n1−1,n2−1)F=\frac { { \sigma }_{ 2 }^{ 2 }{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 } }{ { \sigma }_{ 1 }^{ 2 }{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } } \sim F({ n }_{ 1 }-1,{ n }_{ 2 }-1)F=σ12S2n2∗2σ22S1n1∗2∼F(n1−1,n2−1)
定理5(柯赫伦)-该定理在方差分析和回归分析中具有重要作用.
设X1,⋯ ,Xn是n个相互独立的标准正态变量,记Q=∑i=1nXi2.若Q可以分解为Q=Q1+⋯+Qk其中Qi(i=1,⋯ ,k)是X1,⋯ ,Xn的秩为ni的非负定二次型,设{ X }_{ 1 },\cdots ,{ X }_{ n }是n个相互独立的标准正态变量,记Q=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } } .若Q可以分解为\\ Q={ Q }_{ 1 }+\cdots +{ Q }_{ k }\\ 其中{ Q }_{ i }(i=1,\cdots ,k)是{ X }_{ 1 },\cdots ,{ X }_{ n }的秩为{ n }_{ i }的非负定二次型,设X1,⋯,Xn是n个相互独立的标准正态变量,记Q=∑i=1nXi2.若Q可以分解为Q=Q1+⋯+Qk其中Qi(i=1,⋯,k)是X1,⋯,Xn的秩为ni的非负定二次型,
则Q1,⋯ ,Qk相互独立,且Qi∼χ2(ni)(i=1,⋯ ,k)的充分必要条件是∑i=1kni=n则{ Q }_{ 1 },\cdots ,{ Q }_{ k }相互独立,且{ Q }_{ i }\sim { \chi }^{ 2 }({ n }_{ i })(i=1,\cdots ,k)的充分必要条件是\\ \sum _{ i=1 }^{ k }{ { n }_{ i } } =n则Q1,⋯,Qk相互独立,且Qi∼χ2(ni)(i=1,⋯,k)的充分必要条件是∑i=1kni=n
正态标准化
X∼N(μ,σ2)X\sim N(\mu ,{ \sigma }^{ 2 })X∼N(μ,σ2)
X−μσ∼N(0,1)\frac { X-\mu }{ \sigma } \sim N(0,1)σX−μ∼N(0,1)
Xˉ∼N(μ,σ2n)\bar { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } )Xˉ∼N(μ,nσ2)
n(Xˉ−μ)σ∼N(0,1)\frac { \sqrt { n } (\bar { X } -\mu ) }{ \sigma } \sim N(0,1)σn(Xˉ−μ)∼N(0,1)
置信区间(X‾\overline {X}X-△,X‾\overline {X}X+△)
当σ\sigmaσ已知
△=μα2σn{ \mu }_{ \frac { \alpha }{ 2 } }\frac { \sigma }{ \sqrt { n } }μ2αnσ
当σ\sigmaσ未知
△=tα2(n−1)Sn{ t }_{ \frac { \alpha }{ 2 } }(n-1)\frac { S }{ \sqrt { n } }t2α(n−1)nS
各种分布的方程
二项分布X~B(n,p),则随机变量X的分布列为
P(X=k)=Cnk{C}_{n}^{k}Cnkpk (1-p)n-k k=0,1,…,n
μ=np\mu=npμ=np
σ2=npq{\sigma}^{2}=npqσ2=npq
泊松分布X~P(λ)
P(X=k)=λke−λk!\frac { { \lambda }^{ k }{ e }^{ -\lambda } }{ k! }k!λke−λ,λ>0,k=0,1…
μ=λ\mu=\lambdaμ=λ
σ2=λ{\sigma}^{2}=\lambdaσ2=λ
均匀分布X~U(a,b)
f(x)={1b−a0,其他,a≤x≤bf\left( x \right) =\begin{cases} \frac { 1 }{ b-a } \\ 0,其他 \end{cases},a\le x\le bf(x)={b−a10,其他,a≤x≤b
μ=a+b2\mu=\frac { a+b }{ 2 }μ=2a+b
σ2=(b−a)212{\sigma}^{2}=\frac { {(b-a)}^{2} }{ 12 }σ2=12(b−a)2
指数分布X~Exp(λ)
f(x)={λe−λx,x>00,x≤0f\left( x \right) =\begin{cases} \lambda { e }^{ -\lambda x },x>0 \\ 0,x\le 0 \end{cases}f(x)={λe−λx,x>00,x≤0
μ=1λ\mu=\frac { 1 }{ \lambda }μ=λ1
σ2=1λ2{\sigma}^{2}=\frac { 1 }{ {\lambda}^{2} }σ2=λ21
正态分布X~(μ,σ2\mu,{\sigma}^{2}μ,σ2)
f(x)=1σ2πe−(x−μ)22σ2f\left( x \right) =\frac { 1 }{ \sigma \sqrt { 2\pi } } { e }^{ -\frac { { (x-\mu ) }^{ 2 } }{ 2{ \sigma }^{ 2 } } }f(x)=σ2π1e−2σ2(x−μ)2
用概率密度求均值
μ=概率密度的积分\mu=概率密度的积分μ=概率密度的积分
用极差R求标准差的估计
σ^=Rdn\hat \sigma=\frac {R}{{d}_{n}}σ^=dnR n为样本个数dn{d}_{n}dn可查表得
数理统计内容整理(一)基本概念相关推荐
- 最新【独家沙龙内容整理】机器女友?—百度微软讯飞等顶级专家谈人机对话黑科技及未来 ——by中科院孢子创客空间
最新[独家沙龙内容整理]机器女友?-百度微软讯飞等顶级专家谈人机对话黑科技及未来 --by中科院孢子创客空间 1.写在前面 非常非常感谢[公众号:机器学习研究会 ]举办的这次沙龙.赞赞赞.以下内容皆来 ...
- CSS核心内容整理 - (中)
2019独角兽企业重金招聘Python工程师标准>>> 本文是CSS核心内容整理的第二篇,承接上一篇的内容继续对CSS的一些重要内容进行整理,推荐先看完这个系列的上一篇. 四. 页 ...
- 【项目管理】RUP内容整理
针对RUP相关内容整理如下:(持续更新补充) 目录 定义 核心概念 三大特点 核心工作流 十大要素 相关观点 定义 RUP(Rational Unified Process),统一软件开发过程,统一软 ...
- 【项目管理】CMMI内容整理
相关CMMI 内容整理如下:(持续更新补充) 目录 定义 五大级别 引入原因 认证给企业带来的价值 实施流程 相关观点 定义 CMMI的全称为Capability Maturity Model In ...
- c++求n的几次方_数理统计|笔记整理(E)——Ch7-C习题课
上一节笔记传送门:数理统计|笔记整理(D)--Ch1-6习题课 -------------------------------------- 大家好!这一节我们依然会补充一些习题,内容则是正文的后半部 ...
- Google C++ 风格指南内容整理
之前一直没有全面的看过Google C++风格指南,现在很多公司进行C++开发都要求按照Google C++风格.在这个网站 http://zh-google-styleguide.readthedo ...
- 【STUDY|CV-PR】考试内容整理
目录 一.[必]华为实验 30分 二.相机模型 三.光流☆ 四.经典的聚类算法 1.K-means 2.高斯模型 3.meanshit 4.霍夫变换 考试:闭卷 17周周四随堂考(6.16) 记录:实 ...
- Infineon TC297 reset 内容整理
Infineon TC297 reset 内容整理 SCU.RCU.SMU System Control Unit (SCU)Reset Control Unit (RCU)Safety Manage ...
- 人工智能/云原生/数据科学/计算等方向内容整理志愿者招募了!
持续招募内容整理志愿者!云原生.数据科学.AI.低代码.计算等方向,有意愿的小伙伴,欢迎识别二维码提前报名哦.我们将持续为爱学习.有时间的小伙伴,提供多重福利! 要求: 1. 你需要具备一定学术背景, ...
最新文章
- 项目背景怎么描述_课程游戏背景下幼儿户外活动的组织和实施 ——记岱山县课程项目实施组活动...
- 《系统分析与设计方法》 第8章 数据建模
- XP 的共享方案(面对新人)
- python多线程与GIL
- dcmtk程序包综述(1)
- 修改表字段类型长度_PG修改字段
- 序列的卷积运算与相关运算——MATLAB
- 2021最新计算机二级C语言试题
- 【latex论文】IEEE论文模板的使用教程
- 5学工坊整理|关于大数据发展趋势
- matlab中与或非、等逻辑符号
- LittleVGL移植到STM32
- Python 中的 any(Python/any)
- 安装ADOBE READER时无法将数值写入键_php_sir_新浪博客
- 30天自制操作系统第一天
- 在Unity顶部显示手机状态栏(iOS/Android)
- Blockly与Scratch3.0的比较分析
- Uniswap v3 详解(五):Oracle 预言机
- 虚拟机中的计算机名称,如何获取VMware虚拟机主机的名称和IP?
- 钓鱼邮件翻倍:2021年Q4企业邮箱安全报告出炉