UA MATH564 概率论VI 数理统计基础4 t分布
UA MATH564 概率论VI 数理统计基础4 t分布
- t分布的定义
- t分布的概率密度
- t分布的性质
t分布的定义
假设X,YX,YX,Y互相独立,X∼N(δ,1)X \sim N(\delta,1)X∼N(δ,1),Y∼χn2Y\sim \chi^2_nY∼χn2,则
Z=XY/n∼tn,δZ = \frac{X}{\sqrt{Y/n}}\sim t_{n,\delta}Z=Y/nX∼tn,δ
其中nnn被称为自由度,δ\deltaδ为非中心参数,δ=0\delta=0δ=0称为中心化的t分布,简称t分布。下面计算t分布的CDF与PDF并介绍几个常用性质。
t分布的概率密度
记ZZZ的概率密度为s(x∣n,δ)s(x|n,\delta)s(x∣n,δ),分布函数为S(x∣n,δ)S(x|n,\delta)S(x∣n,δ)。
引理1 假设X,YX,YX,Y互相独立,概率密度分别为g(x),h(y)g(x),h(y)g(x),h(y),Y>0,a.s.Y>0,a.s.Y>0,a.s.,Z=X/YZ=X/YZ=X/Y,则
fZ(z)=∫0∞tg(tz)h(t)dt,FZ(z)=∫0∞G(tz)h(t)dt,∀z∈Rf_Z(z) = \int_0^{\infty} tg(tz)h(t)dt,\ F_Z(z) = \int_0^{\infty} G(tz)h(t)dt,\forall z \in \mathbb{R}fZ(z)=∫0∞tg(tz)h(t)dt, FZ(z)=∫0∞G(tz)h(t)dt,∀z∈R
证明
FZ(z)=P(Z≤z)=P(XY≤z)=P(X≤zY)=∫x≤zyg(x)h(y)dxdy=∫0∞h(y)dy∫−∞zyg(x)dx=∫0∞G(zy)h(y)dyfZ(z)=FZ′(z)=∫0∞G′(zy)h(y)dy=∫0∞zg(zy)h(y)dyF_Z(z) = P(Z \le z) = P(\frac{X}{Y} \le z) = P(X \le zY) = \int_{x \le zy} g(x)h(y)dxdy \\ = \int_{0}^{\infty} h(y)dy \int_{-\infty}^{zy} g(x)dx = \int_{0}^{\infty} G(zy)h(y)dy \\ f_Z(z) = F_Z'(z) = \int_{0}^{\infty} G'(zy)h(y)dy = \int_{0}^{\infty} zg(zy)h(y)dyFZ(z)=P(Z≤z)=P(YX≤z)=P(X≤zY)=∫x≤zyg(x)h(y)dxdy=∫0∞h(y)dy∫−∞zyg(x)dx=∫0∞G(zy)h(y)dyfZ(z)=FZ′(z)=∫0∞G′(zy)h(y)dy=∫0∞zg(zy)h(y)dy
证毕
下面分别考虑XXX与Y/n\sqrt{Y/n}Y/n的分布。X∼N(δ,1)X \sim N(\delta,1)X∼N(δ,1),因此
g(x)=12πexp(−(x−δ)22)=12πe−x2+δ22e−δxg(x) = \frac{1}{\sqrt{2\pi}} \exp \left(-\frac{(x-\delta)^2}{2} \right) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2+\delta^2}{2}} e^{-\delta x}g(x)=2π1exp(−2(x−δ)2)=2π1e−2x2+δ2e−δx
类似我们在计算卡方分布时的处理,将e−δxe^{-\delta x}e−δx展开为级数,
g(x)=12πe−x2+δ22∑i=0∞(δx)ii!g(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2+\delta^2}{2}}\sum_{i=0}^{\infty} \frac{(\delta x)^i}{i!}g(x)=2π1e−2x2+δ2i=0∑∞i!(δx)i
因为Y∼χn2Y \sim \chi^2_nY∼χn2,记W=Y/nW=\sqrt{Y/n}W=Y/n,则
HW(w)=P(W≤w)=P(Y/n≤w)=P(Y≤nw2)=FY(nw2)hW(w)=FW′(w)=2nwfY(nw2)=2nw(1/2)n/2Γ(n/2)(nw2)n2−1e−nw2/2=nn2wn−12n2−1Γ(n2)e−nw22,w>0H_W(w) = P(W \le w) = P(\sqrt{Y/n} \le w) = P(Y \le nw^2) = F_Y(nw^2) \\ h_W(w) = F_W'(w) = 2nwf_Y(nw^2) = 2nw \frac{(1/2)^{n/2}}{\Gamma(n/2)}(nw^2)^{\frac{n}{2}-1}e^{-nw^2/2} \\ = \frac{n^{\frac{n}{2}}w^{n-1}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}e^{-\frac{nw^2}{2}},w>0HW(w)=P(W≤w)=P(Y/n≤w)=P(Y≤nw2)=FY(nw2)hW(w)=FW′(w)=2nwfY(nw2)=2nwΓ(n/2)(1/2)n/2(nw2)2n−1e−nw2/2=22n−1Γ(2n)n2nwn−1e−2nw2,w>0
下面根据引理1计算t分布的概率密度:
s(z∣n,δ)=∫0∞zg(zy)h(y)dy=∫0∞znn2yn−12n2−1Γ(n2)e−ny2212πe−(zy)2+δ22∑i=0∞(δzy)ii!dy=znn22n2−1Γ(n2)12πe−δ22∑i=0∞δizii!∫0∞yi+n−1e−n+z22y2dys(z|n,\delta) = \int_{0}^{\infty} zg(zy)h(y)dy=\int_{0}^{\infty} z\frac{n^{\frac{n}{2}}y^{n-1}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}e^{-\frac{ny^2}{2}}\frac{1}{\sqrt{2\pi}} e^{-\frac{(zy)^2+\delta^2}{2}}\sum_{i=0}^{\infty} \frac{(\delta zy)^i}{i!}dy \\ = z\frac{n^{\frac{n}{2}}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}\frac{1}{\sqrt{2\pi}}e^{-\frac{\delta^2}{2}}\sum_{i=0}^{\infty}\frac{\delta ^i z^i}{i!}\int_{0}^{\infty} y^{i+n-1}e^{-\frac{n+z^2}{2}y^2} dy s(z∣n,δ)=∫0∞zg(zy)h(y)dy=∫0∞z22n−1Γ(2n)n2nyn−1e−2ny22π1e−2(zy)2+δ2i=0∑∞i!(δzy)idy=z22n−1Γ(2n)n2n2π1e−2δ2i=0∑∞i!δizi∫0∞yi+n−1e−2n+z2y2dy
这里需要用到Gamma函数求积技巧:
∫0∞yi+n−1e−n+z22y2dy=1n+z2∫0∞yi+n−2e−n+z22y2d(n+z22y2)=2i+n−22(n+z2)i+n2∫0∞(n+z22y2)i+n−22e−n+z22y2d(n+z22y2)=2i+n−22(n+z2)i+n2Γ(n+i2)\int_{0}^{\infty} y^{i+n-1}e^{-\frac{n+z^2}{2}y^2} dy = \frac{1}{n+z^2} \int_{0}^{\infty} y^{i+n-2}e^{-\frac{n+z^2}{2}y^2} d\left( \frac{n+z^2}{2}y^2\right) \\ = \frac{2^{\frac{i+n-2}{2}}}{(n+z^2)^{\frac{i+n}{2}}} \int_{0}^{\infty} \left( \frac{n+z^2}{2}y^2\right) ^{\frac{i+n-2}{2}}e^{-\frac{n+z^2}{2}y^2} d\left( \frac{n+z^2}{2}y^2\right) =\frac{2^{\frac{i+n-2}{2}}}{(n+z^2)^{\frac{i+n}{2}}} \Gamma(\frac{n+i}{2}) ∫0∞yi+n−1e−2n+z2y2dy=n+z21∫0∞yi+n−2e−2n+z2y2d(2n+z2y2)=(n+z2)2i+n22i+n−2∫0∞(2n+z2y2)2i+n−2e−2n+z2y2d(2n+z2y2)=(n+z2)2i+n22i+n−2Γ(2n+i)
带入概率密度并化简:
s(z∣n,δ)=nn2πΓ(n2)e−δ22(n+z2)n+12∑i=0∞(n+i+1)(δz)i2i!(2n+z2)i2s(z|n,\delta) = \frac{n^{\frac{n}{2}}}{\sqrt{\pi}\Gamma(\frac{n}{2})} \frac{e^{-\frac{\delta^2}{2}}}{(n+z^2)^{\frac{n+1}{2}}}\sum_{i=0}^{\infty} \frac{(n+i+1)(\delta z)^i}{2i!} \left( \frac{2}{n+z^2} \right)^{\frac{i}{2}}s(z∣n,δ)=πΓ(2n)n2n(n+z2)2n+1e−2δ2i=0∑∞2i!(n+i+1)(δz)i(n+z22)2i
当δ=0\delta=0δ=0时,
s(z∣n,0)=Γ(n+12)nπΓ(n2)(1+z2n)−n+12s(z|n,0) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}\left(1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}s(z∣n,0)=nπΓ(2n)Γ(2n+1)(1+nz2)−2n+1
t分布的性质
性质1:X1,⋯,Xn∼iidN(μ,σ2)X_1,\cdots,X_n \sim_{iid} N(\mu,\sigma^2)X1,⋯,Xn∼iidN(μ,σ2),Z=n(Xˉ−b)1n−1∑i=1n(Xi−Xˉ)2∼tn−1,δZ = \frac{\sqrt{n}(\bar{X}-b)}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2}} \sim t_{n-1,\delta}Z=n−11∑i=1n(Xi−Xˉ)2n(Xˉ−b)∼tn−1,δ,δ=n(μ−b)σ\delta = \frac{\sqrt{n}(\mu-b)}{\sigma}δ=σn(μ−b)
性质2:X1,⋯,Xm∼iidN(a,σ2),Y1,⋯,Yn∼iidN(b,σ2)X_1,\cdots,X_m \sim_{iid} N(a,\sigma^2),Y_1,\cdots,Y_n \sim_{iid} N(b,\sigma^2)X1,⋯,Xm∼iidN(a,σ2),Y1,⋯,Yn∼iidN(b,σ2),他们均互相独立,则
Z=mn(m+n−2)m+nXˉ−Yˉ−c∑i=1m(Xi−Xˉ)2+∑j=1n(Yj−Yˉ)2∼tm+n−2,δZ = \sqrt{\frac{mn(m+n-2)}{m+n}}\frac{\bar{X}-\bar{Y}-c}{\sqrt{\sum_{i=1}^m(X_i-\bar{X})^2+\sum_{j=1}^n (Y_j - \bar{Y})^2}} \sim t_{m+n-2,\delta}Z=m+nmn(m+n−2)∑i=1m(Xi−Xˉ)2+∑j=1n(Yj−Yˉ)2Xˉ−Yˉ−c∼tm+n−2,δ
其中δ=mnm+na−b−cσ\delta = \sqrt{\frac{mn}{m+n}}\frac{a-b-c}{\sigma}δ=m+nmnσa−b−c
性质3:Xn∼tn,δX_n \sim t_{n,\delta}Xn∼tn,δ,则Xn→dN(δ,1)X_n \to _d N(\delta,1)Xn→dN(δ,1)
性质1和性质2都比较简单,性质1是单总体正态均值的t检验的基础;性质2是双总体正态均值的t检验的基础。性质1中,对ZZZ做简单变形:
Z=n(Xˉ−b)1n−1∑i=1n(Xi−Xˉ)2=n(Xˉ−b)σ1n−1∑i=1n(Xi−μσ−Xˉ−μσ)2Z = \frac{\sqrt{n}(\bar{X}-b)}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2}} = \frac{\frac{\sqrt{n}(\bar{X}-b)}{\sigma}}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(\frac{X_i-\mu}{\sigma}-\frac{\bar{X}-\mu}{\sigma})^2}}Z=n−11∑i=1n(Xi−Xˉ)2n(Xˉ−b)=n−11∑i=1n(σXi−μ−σXˉ−μ)2σn(Xˉ−b)
分子n(Xˉ−b)σ∼N(n(μ−b)σ,1)\frac{\sqrt{n}(\bar{X}-b)}{\sigma} \sim N(\frac{\sqrt{n}(\mu-b)}{\sigma},1)σn(Xˉ−b)∼N(σn(μ−b),1),并且与分母互相独立;数理统计基础1中已经证明了分母是服从χn−12\chi^2_{n-1}χn−12的。性质2的证明方法与性质1类似。下面证明性质3:
证明 定义+大数定律
根据定义,XnX_nXn可以写成Z/1n∑i=1nYi2Z/\sqrt{\frac{1}{n}\sum_{i=1}^n Y_i^2}Z/n1∑i=1nYi2,其中Z∼N(δ,1)Z \sim N(\delta,1)Z∼N(δ,1)且与所有的YiY_iYi独立,Y1,⋯,Yn∼iidN(0,1)Y_1,\cdots,Y_n \sim _{iid} N(0,1)Y1,⋯,Yn∼iidN(0,1),根据弱大数定律
1n∑i=1nYi2→PE[Y12]=1\frac{1}{n}\sum_{i=1}^n Y_i^2 \to_P E[Y_1^2] = 1n1i=1∑nYi2→PE[Y12]=1
因此当n→∞n\to \inftyn→∞时,Xn→dZ∼N(δ,1)X_n \to_d Z \sim N(\delta,1)Xn→dZ∼N(δ,1)。
UA MATH564 概率论VI 数理统计基础4 t分布相关推荐
- UA MATH564 概率论VI 数理统计基础5 F分布
UA MATH564 概率论VI 数理统计基础5 F分布 假设X∼χm,δ2,Y∼χn2X \sim \chi^2_{m,\delta},Y \sim \chi^2_{n}X∼χm,δ2,Y∼χn2 ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似
UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似 卡方分布的正态近似 Gamma分布的正态近似 基于卡方分布的近似 基于指数分布的近似 在做UA MATH566 统计理论 QE练习 ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布中
UA MATH564 概率论VI 数理统计基础3 卡方分布中 卡方分布的基本性质 上一讲介绍了卡方分布的定义:假设X1,⋯,XnX_1,\cdots,X_nX1,⋯,Xn互相独立,并且Xi∼N(a ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布上
UA MATH564 概率论VI 数理统计基础3 卡方分布上 卡方分布 卡方分布的分布函数 中心化卡方分布 一般的卡方分布 卡方分布 这里给出卡方分布的一般性定义.假设X1,⋯,XnX_1,\cdot ...
- UA MATH564 概率论VI 数理统计基础2 多元正态分布
UA MATH564 概率论VI 数理统计基础2 多元正态分布 矩母函数 概率密度 多元正态分布的矩 条件分布 独立性 抽样分布简单地说就是统计量服从的分布,正态分布时最常用的总体分布,因此研究正态总 ...
- UA MATH564 概率论VI 数理统计基础1
UA MATH564 概率论VI 数理统计基础1 样本均值与样本方差 正态样本的均值与方差的性质 样本均值与样本方差 样本均值和样本方差是经常用到的两个统计量,大部分正态假设的统计模型均值和方差的OL ...
- UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理
UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理 多元正态随机变量二次型的分布 Cochran定理 这一讲介绍多元正态随机变量的二次型的相关性质以及非常常用的Cochr ...
- UA MATH564 概率论I 求离散型随机变量的分布1
UA MATH564 概率论I 求离散型随机变量的分布1 题目 解答 对于离散型随机变量 XXX,记它的概率分布列为 P(X=xi)=pi,i=1,2,⋯P(X = x_i) = p_i,i=1,2, ...
- UA MATH564 概率论 QE练习题3
UA MATH564 概率论 QE练习题3 第一题 第二题 第三题 这是2015年1月的1-3题. 第一题 Part a Obvioulsy, EU=EW=0EU = EW = 0EU=EW=0, V ...
最新文章
- python注入_python的常见命令注入威胁
- bing浏览器_Bing正式改名Microsoft Bing:不再只是搜索
- 人工智能发展弊端的解决方案_高中优秀作文赏析:科技创新、人工智能与人类未来之辩...
- 关于printf()与自增自减运算符结和问题
- OpenStack vlan教程 (操作篇)
- I love max and multiply HDU - 6971(详细解答)
- 结构化机器学习项目 —— 1.1 为什么是ML策略
- Android笔记 notification
- ubuntu下安装与使用Log4cpp
- 在java保存游戏状态_保存游戏状态的最佳方法是什么?
- bfs (宽度搜素)
- 山西特岗考试计算机专业真题,山西特岗教师招聘考试模拟题_信息技术选择题...
- 网络配置管理大大减轻网络管理员的负担
- oracle 字段和当前时间比较,请教如何按照当前时间与数据库表中的字段时间比较提取记录,涉及跨天...
- 20线程测试cpu性能软件,cpu测试工具(wPrime Benchmark)
- 手机查看IGES,STP,STEP格式3D模型免费APP推荐-CAD Assistant
- Visionpro工具名称和用途
- 关于自己学习安卓的体会
- Window平台的eclipse连接linux的hadoop集群
- 太阳能电池基本特性实验报告_太阳能电池基本特性测定实验
热门文章
- Leetcode 114. 二叉树展开为链表 解题思路及C++实现
- Windows上 万能的串口调试助手
- python数据采集框架_20190715《Python网络数据采集》第 1 章
- pip安装ipython_Python -- 关于pip安装Ipython
- ahp层次分析法matlab代码_Matlab数据分析实战,基于AHP高校食堂满意度调查分析
- 高级指令——kill指令、ifconfig指令、reboot指令、shutdown指令、uptime指令、uname指令
- 单例设计模式介绍||单例设计模式八种方式——1) 饿汉式(静态常量) 2) 饿汉式(静态代码块) 3) 懒汉式(线程不安全) 4) 懒汉式(线程安全,同步方法)
- Appium 移动端自动化 - Android SDK的安装与配置,使用安卓SDK连接手机实例演示
- PyQt5 技术篇-设置alignment对齐方式。Qt Designer设置文本对齐方式。居中、左对齐、右对齐、上对齐、下对齐。
- 一维数组和二位数组作为函数参数进行传递的方式