UA MATH564 概率论VI 数理统计基础4 t分布

  • t分布的定义
  • t分布的概率密度
  • t分布的性质

t分布的定义

假设X,YX,YX,Y互相独立,X∼N(δ,1)X \sim N(\delta,1)X∼N(δ,1),Y∼χn2Y\sim \chi^2_nY∼χn2​,则
Z=XY/n∼tn,δZ = \frac{X}{\sqrt{Y/n}}\sim t_{n,\delta}Z=Y/n​X​∼tn,δ​
其中nnn被称为自由度,δ\deltaδ为非中心参数,δ=0\delta=0δ=0称为中心化的t分布,简称t分布。下面计算t分布的CDF与PDF并介绍几个常用性质。

t分布的概率密度

记ZZZ的概率密度为s(x∣n,δ)s(x|n,\delta)s(x∣n,δ),分布函数为S(x∣n,δ)S(x|n,\delta)S(x∣n,δ)。

引理1 假设X,YX,YX,Y互相独立,概率密度分别为g(x),h(y)g(x),h(y)g(x),h(y),Y>0,a.s.Y>0,a.s.Y>0,a.s.,Z=X/YZ=X/YZ=X/Y,则
fZ(z)=∫0∞tg(tz)h(t)dt,FZ(z)=∫0∞G(tz)h(t)dt,∀z∈Rf_Z(z) = \int_0^{\infty} tg(tz)h(t)dt,\ F_Z(z) = \int_0^{\infty} G(tz)h(t)dt,\forall z \in \mathbb{R}fZ​(z)=∫0∞​tg(tz)h(t)dt, FZ​(z)=∫0∞​G(tz)h(t)dt,∀z∈R
证明
FZ(z)=P(Z≤z)=P(XY≤z)=P(X≤zY)=∫x≤zyg(x)h(y)dxdy=∫0∞h(y)dy∫−∞zyg(x)dx=∫0∞G(zy)h(y)dyfZ(z)=FZ′(z)=∫0∞G′(zy)h(y)dy=∫0∞zg(zy)h(y)dyF_Z(z) = P(Z \le z) = P(\frac{X}{Y} \le z) = P(X \le zY) = \int_{x \le zy} g(x)h(y)dxdy \\ = \int_{0}^{\infty} h(y)dy \int_{-\infty}^{zy} g(x)dx = \int_{0}^{\infty} G(zy)h(y)dy \\ f_Z(z) = F_Z'(z) = \int_{0}^{\infty} G'(zy)h(y)dy = \int_{0}^{\infty} zg(zy)h(y)dyFZ​(z)=P(Z≤z)=P(YX​≤z)=P(X≤zY)=∫x≤zy​g(x)h(y)dxdy=∫0∞​h(y)dy∫−∞zy​g(x)dx=∫0∞​G(zy)h(y)dyfZ​(z)=FZ′​(z)=∫0∞​G′(zy)h(y)dy=∫0∞​zg(zy)h(y)dy

证毕

下面分别考虑XXX与Y/n\sqrt{Y/n}Y/n​的分布。X∼N(δ,1)X \sim N(\delta,1)X∼N(δ,1),因此
g(x)=12πexp⁡(−(x−δ)22)=12πe−x2+δ22e−δxg(x) = \frac{1}{\sqrt{2\pi}} \exp \left(-\frac{(x-\delta)^2}{2} \right) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2+\delta^2}{2}} e^{-\delta x}g(x)=2π​1​exp(−2(x−δ)2​)=2π​1​e−2x2+δ2​e−δx

类似我们在计算卡方分布时的处理,将e−δxe^{-\delta x}e−δx展开为级数,
g(x)=12πe−x2+δ22∑i=0∞(δx)ii!g(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2+\delta^2}{2}}\sum_{i=0}^{\infty} \frac{(\delta x)^i}{i!}g(x)=2π​1​e−2x2+δ2​i=0∑∞​i!(δx)i​

因为Y∼χn2Y \sim \chi^2_nY∼χn2​,记W=Y/nW=\sqrt{Y/n}W=Y/n​,则
HW(w)=P(W≤w)=P(Y/n≤w)=P(Y≤nw2)=FY(nw2)hW(w)=FW′(w)=2nwfY(nw2)=2nw(1/2)n/2Γ(n/2)(nw2)n2−1e−nw2/2=nn2wn−12n2−1Γ(n2)e−nw22,w>0H_W(w) = P(W \le w) = P(\sqrt{Y/n} \le w) = P(Y \le nw^2) = F_Y(nw^2) \\ h_W(w) = F_W'(w) = 2nwf_Y(nw^2) = 2nw \frac{(1/2)^{n/2}}{\Gamma(n/2)}(nw^2)^{\frac{n}{2}-1}e^{-nw^2/2} \\ = \frac{n^{\frac{n}{2}}w^{n-1}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}e^{-\frac{nw^2}{2}},w>0HW​(w)=P(W≤w)=P(Y/n​≤w)=P(Y≤nw2)=FY​(nw2)hW​(w)=FW′​(w)=2nwfY​(nw2)=2nwΓ(n/2)(1/2)n/2​(nw2)2n​−1e−nw2/2=22n​−1Γ(2n​)n2n​wn−1​e−2nw2​,w>0
下面根据引理1计算t分布的概率密度:
s(z∣n,δ)=∫0∞zg(zy)h(y)dy=∫0∞znn2yn−12n2−1Γ(n2)e−ny2212πe−(zy)2+δ22∑i=0∞(δzy)ii!dy=znn22n2−1Γ(n2)12πe−δ22∑i=0∞δizii!∫0∞yi+n−1e−n+z22y2dys(z|n,\delta) = \int_{0}^{\infty} zg(zy)h(y)dy=\int_{0}^{\infty} z\frac{n^{\frac{n}{2}}y^{n-1}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}e^{-\frac{ny^2}{2}}\frac{1}{\sqrt{2\pi}} e^{-\frac{(zy)^2+\delta^2}{2}}\sum_{i=0}^{\infty} \frac{(\delta zy)^i}{i!}dy \\ = z\frac{n^{\frac{n}{2}}}{2^{\frac{n}{2}-1}\Gamma(\frac{n}{2})}\frac{1}{\sqrt{2\pi}}e^{-\frac{\delta^2}{2}}\sum_{i=0}^{\infty}\frac{\delta ^i z^i}{i!}\int_{0}^{\infty} y^{i+n-1}e^{-\frac{n+z^2}{2}y^2} dy s(z∣n,δ)=∫0∞​zg(zy)h(y)dy=∫0∞​z22n​−1Γ(2n​)n2n​yn−1​e−2ny2​2π​1​e−2(zy)2+δ2​i=0∑∞​i!(δzy)i​dy=z22n​−1Γ(2n​)n2n​​2π​1​e−2δ2​i=0∑∞​i!δizi​∫0∞​yi+n−1e−2n+z2​y2dy

这里需要用到Gamma函数求积技巧:
∫0∞yi+n−1e−n+z22y2dy=1n+z2∫0∞yi+n−2e−n+z22y2d(n+z22y2)=2i+n−22(n+z2)i+n2∫0∞(n+z22y2)i+n−22e−n+z22y2d(n+z22y2)=2i+n−22(n+z2)i+n2Γ(n+i2)\int_{0}^{\infty} y^{i+n-1}e^{-\frac{n+z^2}{2}y^2} dy = \frac{1}{n+z^2} \int_{0}^{\infty} y^{i+n-2}e^{-\frac{n+z^2}{2}y^2} d\left( \frac{n+z^2}{2}y^2\right) \\ = \frac{2^{\frac{i+n-2}{2}}}{(n+z^2)^{\frac{i+n}{2}}} \int_{0}^{\infty} \left( \frac{n+z^2}{2}y^2\right) ^{\frac{i+n-2}{2}}e^{-\frac{n+z^2}{2}y^2} d\left( \frac{n+z^2}{2}y^2\right) =\frac{2^{\frac{i+n-2}{2}}}{(n+z^2)^{\frac{i+n}{2}}} \Gamma(\frac{n+i}{2}) ∫0∞​yi+n−1e−2n+z2​y2dy=n+z21​∫0∞​yi+n−2e−2n+z2​y2d(2n+z2​y2)=(n+z2)2i+n​22i+n−2​​∫0∞​(2n+z2​y2)2i+n−2​e−2n+z2​y2d(2n+z2​y2)=(n+z2)2i+n​22i+n−2​​Γ(2n+i​)

带入概率密度并化简:
s(z∣n,δ)=nn2πΓ(n2)e−δ22(n+z2)n+12∑i=0∞(n+i+1)(δz)i2i!(2n+z2)i2s(z|n,\delta) = \frac{n^{\frac{n}{2}}}{\sqrt{\pi}\Gamma(\frac{n}{2})} \frac{e^{-\frac{\delta^2}{2}}}{(n+z^2)^{\frac{n+1}{2}}}\sum_{i=0}^{\infty} \frac{(n+i+1)(\delta z)^i}{2i!} \left( \frac{2}{n+z^2} \right)^{\frac{i}{2}}s(z∣n,δ)=π​Γ(2n​)n2n​​(n+z2)2n+1​e−2δ2​​i=0∑∞​2i!(n+i+1)(δz)i​(n+z22​)2i​

当δ=0\delta=0δ=0时,
s(z∣n,0)=Γ(n+12)nπΓ(n2)(1+z2n)−n+12s(z|n,0) = \frac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}\left(1+\frac{z^2}{n} \right)^{-\frac{n+1}{2}}s(z∣n,0)=nπ​Γ(2n​)Γ(2n+1​)​(1+nz2​)−2n+1​

t分布的性质

性质1:X1,⋯,Xn∼iidN(μ,σ2)X_1,\cdots,X_n \sim_{iid} N(\mu,\sigma^2)X1​,⋯,Xn​∼iid​N(μ,σ2),Z=n(Xˉ−b)1n−1∑i=1n(Xi−Xˉ)2∼tn−1,δZ = \frac{\sqrt{n}(\bar{X}-b)}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2}} \sim t_{n-1,\delta}Z=n−11​∑i=1n​(Xi​−Xˉ)2​n​(Xˉ−b)​∼tn−1,δ​,δ=n(μ−b)σ\delta = \frac{\sqrt{n}(\mu-b)}{\sigma}δ=σn​(μ−b)​

性质2:X1,⋯,Xm∼iidN(a,σ2),Y1,⋯,Yn∼iidN(b,σ2)X_1,\cdots,X_m \sim_{iid} N(a,\sigma^2),Y_1,\cdots,Y_n \sim_{iid} N(b,\sigma^2)X1​,⋯,Xm​∼iid​N(a,σ2),Y1​,⋯,Yn​∼iid​N(b,σ2),他们均互相独立,则
Z=mn(m+n−2)m+nXˉ−Yˉ−c∑i=1m(Xi−Xˉ)2+∑j=1n(Yj−Yˉ)2∼tm+n−2,δZ = \sqrt{\frac{mn(m+n-2)}{m+n}}\frac{\bar{X}-\bar{Y}-c}{\sqrt{\sum_{i=1}^m(X_i-\bar{X})^2+\sum_{j=1}^n (Y_j - \bar{Y})^2}} \sim t_{m+n-2,\delta}Z=m+nmn(m+n−2)​​∑i=1m​(Xi​−Xˉ)2+∑j=1n​(Yj​−Yˉ)2​Xˉ−Yˉ−c​∼tm+n−2,δ​

其中δ=mnm+na−b−cσ\delta = \sqrt{\frac{mn}{m+n}}\frac{a-b-c}{\sigma}δ=m+nmn​​σa−b−c​

性质3:Xn∼tn,δX_n \sim t_{n,\delta}Xn​∼tn,δ​,则Xn→dN(δ,1)X_n \to _d N(\delta,1)Xn​→d​N(δ,1)

性质1和性质2都比较简单,性质1是单总体正态均值的t检验的基础;性质2是双总体正态均值的t检验的基础。性质1中,对ZZZ做简单变形:
Z=n(Xˉ−b)1n−1∑i=1n(Xi−Xˉ)2=n(Xˉ−b)σ1n−1∑i=1n(Xi−μσ−Xˉ−μσ)2Z = \frac{\sqrt{n}(\bar{X}-b)}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2}} = \frac{\frac{\sqrt{n}(\bar{X}-b)}{\sigma}}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n(\frac{X_i-\mu}{\sigma}-\frac{\bar{X}-\mu}{\sigma})^2}}Z=n−11​∑i=1n​(Xi​−Xˉ)2​n​(Xˉ−b)​=n−11​∑i=1n​(σXi​−μ​−σXˉ−μ​)2​σn​(Xˉ−b)​​

分子n(Xˉ−b)σ∼N(n(μ−b)σ,1)\frac{\sqrt{n}(\bar{X}-b)}{\sigma} \sim N(\frac{\sqrt{n}(\mu-b)}{\sigma},1)σn​(Xˉ−b)​∼N(σn​(μ−b)​,1),并且与分母互相独立;数理统计基础1中已经证明了分母是服从χn−12\chi^2_{n-1}χn−12​的。性质2的证明方法与性质1类似。下面证明性质3:

证明 定义+大数定律
根据定义,XnX_nXn​可以写成Z/1n∑i=1nYi2Z/\sqrt{\frac{1}{n}\sum_{i=1}^n Y_i^2}Z/n1​∑i=1n​Yi2​​,其中Z∼N(δ,1)Z \sim N(\delta,1)Z∼N(δ,1)且与所有的YiY_iYi​独立,Y1,⋯,Yn∼iidN(0,1)Y_1,\cdots,Y_n \sim _{iid} N(0,1)Y1​,⋯,Yn​∼iid​N(0,1),根据弱大数定律
1n∑i=1nYi2→PE[Y12]=1\frac{1}{n}\sum_{i=1}^n Y_i^2 \to_P E[Y_1^2] = 1n1​i=1∑n​Yi2​→P​E[Y12​]=1

因此当n→∞n\to \inftyn→∞时,Xn→dZ∼N(δ,1)X_n \to_d Z \sim N(\delta,1)Xn​→d​Z∼N(δ,1)。

UA MATH564 概率论VI 数理统计基础4 t分布相关推荐

  1. UA MATH564 概率论VI 数理统计基础5 F分布

    UA MATH564 概率论VI 数理统计基础5 F分布 假设X∼χm,δ2,Y∼χn2X \sim \chi^2_{m,\delta},Y \sim \chi^2_{n}X∼χm,δ2​,Y∼χn2 ...

  2. UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似

    UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似 卡方分布的正态近似 Gamma分布的正态近似 基于卡方分布的近似 基于指数分布的近似 在做UA MATH566 统计理论 QE练习 ...

  3. UA MATH564 概率论VI 数理统计基础3 卡方分布中

    UA MATH564 概率论VI 数理统计基础3 卡方分布中 卡方分布的基本性质 上一讲介绍了卡方分布的定义:假设X1,⋯,XnX_1,\cdots,X_nX1​,⋯,Xn​互相独立,并且Xi∼N(a ...

  4. UA MATH564 概率论VI 数理统计基础3 卡方分布上

    UA MATH564 概率论VI 数理统计基础3 卡方分布上 卡方分布 卡方分布的分布函数 中心化卡方分布 一般的卡方分布 卡方分布 这里给出卡方分布的一般性定义.假设X1,⋯,XnX_1,\cdot ...

  5. UA MATH564 概率论VI 数理统计基础2 多元正态分布

    UA MATH564 概率论VI 数理统计基础2 多元正态分布 矩母函数 概率密度 多元正态分布的矩 条件分布 独立性 抽样分布简单地说就是统计量服从的分布,正态分布时最常用的总体分布,因此研究正态总 ...

  6. UA MATH564 概率论VI 数理统计基础1

    UA MATH564 概率论VI 数理统计基础1 样本均值与样本方差 正态样本的均值与方差的性质 样本均值与样本方差 样本均值和样本方差是经常用到的两个统计量,大部分正态假设的统计模型均值和方差的OL ...

  7. UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理

    UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理 多元正态随机变量二次型的分布 Cochran定理 这一讲介绍多元正态随机变量的二次型的相关性质以及非常常用的Cochr ...

  8. UA MATH564 概率论I 求离散型随机变量的分布1

    UA MATH564 概率论I 求离散型随机变量的分布1 题目 解答 对于离散型随机变量 XXX,记它的概率分布列为 P(X=xi)=pi,i=1,2,⋯P(X = x_i) = p_i,i=1,2, ...

  9. UA MATH564 概率论 QE练习题3

    UA MATH564 概率论 QE练习题3 第一题 第二题 第三题 这是2015年1月的1-3题. 第一题 Part a Obvioulsy, EU=EW=0EU = EW = 0EU=EW=0, V ...

最新文章

  1. python注入_python的常见命令注入威胁
  2. bing浏览器_Bing正式改名Microsoft Bing:不再只是搜索
  3. 人工智能发展弊端的解决方案_高中优秀作文赏析:科技创新、人工智能与人类未来之辩...
  4. 关于printf()与自增自减运算符结和问题
  5. OpenStack vlan教程 (操作篇)
  6. I love max and multiply HDU - 6971(详细解答)
  7. 结构化机器学习项目 —— 1.1 为什么是ML策略
  8. Android笔记 notification
  9. ubuntu下安装与使用Log4cpp
  10. 在java保存游戏状态_保存游戏状态的最佳方法是什么?
  11. bfs (宽度搜素)
  12. 山西特岗考试计算机专业真题,山西特岗教师招聘考试模拟题_信息技术选择题...
  13. 网络配置管理大大减轻网络管理员的负担
  14. oracle 字段和当前时间比较,请教如何按照当前时间与数据库表中的字段时间比较提取记录,涉及跨天...
  15. 20线程测试cpu性能软件,cpu测试工具(wPrime Benchmark)
  16. 手机查看IGES,STP,STEP格式3D模型免费APP推荐-CAD Assistant
  17. Visionpro工具名称和用途
  18. 关于自己学习安卓的体会
  19. Window平台的eclipse连接linux的hadoop集群
  20. 太阳能电池基本特性实验报告_太阳能电池基本特性测定实验

热门文章

  1. Leetcode 114. 二叉树展开为链表 解题思路及C++实现
  2. Windows上 万能的串口调试助手
  3. python数据采集框架_20190715《Python网络数据采集》第 1 章
  4. pip安装ipython_Python -- 关于pip安装Ipython
  5. ahp层次分析法matlab代码_Matlab数据分析实战,基于AHP高校食堂满意度调查分析
  6. 高级指令——kill指令、ifconfig指令、reboot指令、shutdown指令、uptime指令、uname指令
  7. 单例设计模式介绍||单例设计模式八种方式——1) 饿汉式(静态常量) 2) 饿汉式(静态代码块) 3) 懒汉式(线程不安全) 4) 懒汉式(线程安全,同步方法)
  8. Appium 移动端自动化 - Android SDK的安装与配置,使用安卓SDK连接手机实例演示
  9. PyQt5 技术篇-设置alignment对齐方式。Qt Designer设置文本对齐方式。居中、左对齐、右对齐、上对齐、下对齐。
  10. 一维数组和二位数组作为函数参数进行传递的方式