数理统计基础 常用的统计分布
目录
https://blog.csdn.net/weixin_45792450/article/details/109314584
常用统计分布
前面已指出,当取得总体X{X}X的样本(X1,X2,...,Xn)({X_1},{X_2},...,{X_n})(X1,X2,...,Xn)后,通常是借助样本的统计量对未知的总体分布进行推断的。
为了实现推断的目的必须进一步确定相应的统计量所服从的分布,这样就有必要补充一些在概率论部分中未曾提及但在统计学中经常用到的分布主要为三种分布:χ2{\chi ^2}χ2分布、F{F}F分布与t{t}t分布。
鉴于这些分布在统计学中的重要性,通常统称其为常用统计分布。
分位数
分位数是统计推断中经常用到的一类数字特征,在熟悉其概念与性质后可对一些统计分布表进行查表使用。
定义:设随机变量X{X}X的分布函数为F(x){F(x)}F(x),对给定的实数α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),如果实数Fα{F_\alpha }Fα满足:P(X>Fα)=αP(X > {F_\alpha }) = \alphaP(X>Fα)=α,则称Fα{F_\alpha }Fα为随机变量X{X}X的分布的水平α\alphaα的上侧分位数,或直接称为分布函数F(x){F(x)}F(x)的水平α\alphaα的上侧分位数
举例说明:如下图为分布函数F(x){F(x)}F(x)的水平α\alphaα的上侧分位数示意图
显然,有性质:1−F(Fα)=α,F(Fα)=1−α1 - F({F_\alpha }) = \alpha ,F({F_\alpha }) = 1 - \alpha1−F(Fα)=α,F(Fα)=1−α
对于像标准正态分布那样的对称分布(即其密度函数为偶函数,关于y轴对称),统计学中还用到其另一种分位数——双侧分位数。
定义:设X{X}X是对称分布的连续型随机变量,其分布函数为F(x){F(x)}F(x),对给定的实数α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),如果实数Tα{T_\alpha }Tα满足:P(∣X∣>Tα)=αP(\left| X \right| > {T_\alpha }) = \alphaP(∣X∣>Tα)=α,则称Tα{T_\alpha }Tα为随机变量X{X}X的分布的水平α\alphaα的双侧分位数,或直接称为分布函数F(x){F(x)}F(x)的水平α\alphaα的分位数
例题:
χ2{\chi ^2}χ2分布
定义:设随机变量X1,X2,...,Xn{X_1},{X_2},...,{X_n}X1,X2,...,Xn相互独立且均服从标准正态分布N(0,1)N(0,1)N(0,1),则称随机变量χ2=X12+X22+...+Xn2{\chi ^2} = X_1^2 + X_2^2 + ... + X_n^2χ2=X12+X22+...+Xn2服从自由度为n的χ2{\chi ^2}χ2分布,记作χ2∼χ2(n){\chi ^2} \sim {\chi ^2}(n)χ2∼χ2(n)
注:该分布中文读作卡方分布
χ2{\chi ^2}χ2分布性质
设χ2∼χ2(n){\chi ^2} \sim {\chi ^2}(n)χ2∼χ2(n),对给定的α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),其上α\alphaα分位如下:P(χ2>χα2(n))=∫χα2(n)+∞f(x)dxP\left( {{\chi ^2} > \chi _\alpha ^2(n)} \right) = \int_{\chi _\alpha ^2(n)}^{ + \infty } {f(x)dx}P(χ2>χα2(n))=∫χα2(n)+∞f(x)dx
设χ12∼χ2(n1)\chi _1^2 \sim {\chi ^2}({n_1})χ12∼χ2(n1),χ22∼χ2(n2)\chi _2^2 \sim {\chi ^2}({n_2})χ22∼χ2(n2),且χ12\chi _1^2χ12与χ22\chi _2^2χ22相互独立,则χ12+χ22∼χ2(n1+n2)\chi _1^2 + \chi _2^2 \sim {\chi ^2}({n_1} + {n_2})χ12+χ22∼χ2(n1+n2)
设χ2∼χ2(n){\chi ^2} \sim {\chi ^2}(n)χ2∼χ2(n),则E(χ2)=n,D(χ2)=2n{E({\chi ^2}) = n,D({\chi ^2}) = 2n}E(χ2)=n,D(χ2)=2n
对1和2性质,由概率论知识就直接得出了,十分显然。现在来证明3:
证明:
E(χ2)=E(X12+X22+...+Xn2){E({\chi ^2}) = E(X_1^2 + X_2^2 + ... + X_n^2)}E(χ2)=E(X12+X22+...+Xn2)
=E(X12)+E(X22)+...+E(Xn2){ = E(X_1^2) + E(X_2^2) + ... + E(X_n^2)}=E(X12)+E(X22)+...+E(Xn2)
=nE(X2){ = nE(X_{}^2)}=nE(X2)
=n(D(X)+E2(X))=n{ = n\left( {D(X) + {E^2}(X)} \right) = n}=n(D(X)+E2(X))=n
D(χ2)=D(X12+X22+...+Xn2)D({\chi ^2}) = D(X_1^2 + X_2^2 + ... + X_n^2)D(χ2)=D(X12+X22+...+Xn2)
=D(X12)+D(X22)+...+D(Xn2)= D(X_1^2) + D(X_2^2) + ... + D(X_n^2)=D(X12)+D(X22)+...+D(Xn2)
=nD(X2)=n(E(X4)−E2(X2))= nD(X_{}^2) = n\left( {E({X^4}) - {E^2}({X^2})} \right)=nD(X2)=n(E(X4)−E2(X2))
=n(3−1)=2n= n(3 - 1) = 2n=n(3−1)=2n
FFF分布
定义:设随机变量XXX和YYY相互独立,且X∼χ2(n1),Y∼χ2(n2)X \sim {\chi ^2}({n_1}),Y \sim {\chi ^2}({n_2})X∼χ2(n1),Y∼χ2(n2),则称随机变量F=X/n1Y/n2F = {{X/{n_1}} \over {Y/{n_2}}}F=Y/n2X/n1服从自由度为(n1,n2)({n_1},{n_2})(n1,n2)的FFF分布,记作F∼F(n1,n2)F \sim F({n_1},{n_2})F∼F(n1,n2)
FFF分布性质
设F∼F(n1,n2)F \sim F({n_1},{n_2})F∼F(n1,n2),对给定的α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),其上α\alphaα分位如下:P(F>Fα(n1,n2))=∫Fα(n1,n2)+∞f(x)dxP\left( {F > {F_\alpha }({n_1},{n_2})} \right) = \int_{{F_\alpha }({n_1},{n_2})}^{ + \infty } {f(x)dx}P(F>Fα(n1,n2))=∫Fα(n1,n2)+∞f(x)dx
设F∼F(n1,n2)F \sim F({n_1},{n_2})F∼F(n1,n2),则1F∼F(n2,n1){1 \over F} \sim F({n_2},{n_1})F1∼F(n2,n1),且有Fα(n1,n2)=1F1−α(n2,n1){F_\alpha }({n_1},{n_2}) = {1 \over {{F_{1 - \alpha }}({n_2},{n_1})}}Fα(n1,n2)=F1−α(n2,n1)1
证明:
由于1F∼F(n2,n1){1 \over F} \sim F({n_2},{n_1})F1∼F(n2,n1),按上侧分位数的定义,变换后应把α\alphaα置为1−α1-\alpha1−α,而不是下面错误的做法:
Fα(n1,n2)=1Fα(n2,n1){F_\alpha }({n_1},{n_2}) = {1 \over {{F_\alpha }({n_2},{n_1})}}Fα(n1,n2)=Fα(n2,n1)1
对此的解释与理解可参考下例:
设随机变量X∼U(110,10)X \sim U({1 \over {10}},10)X∼U(101,10),根据均匀分布的性质,XXX的密度函数为f(x)=1099f(x) = {{10} \over {99}}f(x)=9910
令随机变量Y=1XY = {1 \over X}Y=X1,显然:对y∈(1,10),x∈(1/10,1)y \in (1,10),x \in (1/10,1)y∈(1,10),x∈(1/10,1),此时若计算上侧分位数α\alphaα,显然有:Xα=1Y1−α{X_\alpha } = {1 \over {{Y_{1 - \alpha }}}}Xα=Y1−α1
可以用密度函数计算验证此等式以获得初步理解,本质上是坐标轴以x=1x=1x=1进行了变换
ttt分布
定义:设随机变量XXX和YYY相互独立,且X∼N(0,1),Y∼χ2(n)X \sim N(0,1),Y \sim {\chi ^2}(n)X∼N(0,1),Y∼χ2(n),则称随机变量T=XY/nT = {X \over {\sqrt {Y/n} }}T=Y/nX服从自由度为nnn的ttt分布,记作T∼t(n)T \sim t(n)T∼t(n)
ttt分布性质
设T∼t(n)T \sim t(n)T∼t(n),对给定的α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),其上α\alphaα分位如下:P(T>tα(n))=∫tα(n)+∞f(x)dxP\left( {T > {t_\alpha }(n)} \right) = \int_{{t_\alpha }(n)}^{ + \infty } {f(x)dx}P(T>tα(n))=∫tα(n)+∞f(x)dx
ttt分布的概率密度函数f(x)f(x)f(x)是偶函数,即f(x)=f(−x)f(x)=f(-x)f(x)=f(−x),且当nnn充分大时,t(n)t(n)t(n)分布近似于N(0,1)N(0,1)N(0,1)
设T∼t(n)T \sim t(n)T∼t(n),对给定的α(0<α<1)\alpha (0 < \alpha < 1)α(0<α<1),其存在双侧α\alphaα分位,tα(n)=−t1−α(n){{t_\alpha }(n) = - {t_{1 - \alpha }}(n)}tα(n)=−t1−α(n)
注:结论2实质上利用了概率论的中心极限定理
数理统计基础 常用的统计分布相关推荐
- UA MATH564 概率论VI 数理统计基础4 t分布
UA MATH564 概率论VI 数理统计基础4 t分布 t分布的定义 t分布的概率密度 t分布的性质 t分布的定义 假设X,YX,YX,Y互相独立,X∼N(δ,1)X \sim N(\delta,1 ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布中
UA MATH564 概率论VI 数理统计基础3 卡方分布中 卡方分布的基本性质 上一讲介绍了卡方分布的定义:假设X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn互相独立,并且Xi∼N(a ...
- UA MATH564 概率论VI 数理统计基础2 多元正态分布
UA MATH564 概率论VI 数理统计基础2 多元正态分布 矩母函数 概率密度 多元正态分布的矩 条件分布 独立性 抽样分布简单地说就是统计量服从的分布,正态分布时最常用的总体分布,因此研究正态总 ...
- UA MATH564 概率论VI 数理统计基础1
UA MATH564 概率论VI 数理统计基础1 样本均值与样本方差 正态样本的均值与方差的性质 样本均值与样本方差 样本均值和样本方差是经常用到的两个统计量,大部分正态假设的统计模型均值和方差的OL ...
- 数学基础(2)~ 数理统计基础知识
出处:http://www.cnblogs.com/fanling999/p/6708458.html 参考:盛骤, 谢式千, 潘承毅. 概率论与数理统计, 第四版[M]. 高等教育出版社, 2008 ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理
UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理 多元正态随机变量二次型的分布 Cochran定理 这一讲介绍多元正态随机变量的二次型的相关性质以及非常常用的Cochr ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似
UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似 卡方分布的正态近似 Gamma分布的正态近似 基于卡方分布的近似 基于指数分布的近似 在做UA MATH566 统计理论 QE练习 ...
- UA MATH564 概率论VI 数理统计基础5 F分布
UA MATH564 概率论VI 数理统计基础5 F分布 假设X∼χm,δ2,Y∼χn2X \sim \chi^2_{m,\delta},Y \sim \chi^2_{n}X∼χm,δ2,Y∼χn2 ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布上
UA MATH564 概率论VI 数理统计基础3 卡方分布上 卡方分布 卡方分布的分布函数 中心化卡方分布 一般的卡方分布 卡方分布 这里给出卡方分布的一般性定义.假设X1,⋯,XnX_1,\cdot ...
- 机器学习之概率论与数理统计基础知识-(2)随机变量和数字特征
该博客是根据百度贴吧利_刃网友的内容进行整理的,原出处请点击此处! 2.1 统计学(Statistic) 统计学是通过搜索.整理.分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性 ...
最新文章
- LZMA demo挑选使用备忘
- 布隆过滤器Redis缓存穿透雪崩击穿热点key
- SAP Hybris Commerce Cloud 项目里的 eclipsebin 文件夹
- UTC时间、GMT时间、本地时间、Unix时间戳
- 同一个工作组无法查看计算机,win7系统在同一个工作组看不到其他电脑的解决方法...
- 200个最常见的JAVA面试问题(附答案)
- 1431.拥有最多糖果的孩z
- 如何在CAD中实现影像与矢量叠加套合(四参数法)
- 惠普打印机墨盒更换教程_hp打印机墨盒怎么安装 hp打印机墨盒安装方法【详解】...
- 【机器学习】对数线性模型之Logistic回归、SoftMax回归和最大熵模型
- 016 Rust死灵书之安全方式内存初始化
- 逆序字符串 和 字符串的逆序输出 的区别~
- 对合成大西瓜修改图片的实践
- Navicat数据库管理工具的基本操作
- python简单代码画皮卡丘-利用Python绘制萌萌哒的皮卡丘
- 集肤效应、邻近效应、边缘效应、涡流损耗
- vim配置及常用插件安装
- Git for windows下载、安装配置并从GitHub Clone项目
- 英伟达gt和gtx的区别
- Intellij IDEA插件之自动生成时序图(Sequence Diagram)
热门文章
- 吊销 BTChina 营业执照”后元旦之前可能相继落马的“影视下载”网站名单
- GICv3软件overview手册之配置GIC
- 华为od机考真题-平安果
- 为markdown目录标题添加序号
- 缓存 redis 缓存失效 分布式锁 Redisson SpringCache
- 拆 米家台灯_米家台灯Pro测评:色彩还原力接近阳光,支持米家与HomeKit
- Android调试出现问题:failed to connect to /10.0.2.2 (port 8080) from /192.168.31.150 (port 37592) after 300
- 2.13navigation导航系统
- 4个方法,教你1分钟查询你的手机注册了多少软件和网站
- 计算机中安装杀毒软件 的作用,360杀毒软件的功能及其使用方法介绍