要理解这些分布,要从基础的正态分布开始。

1. 正态分布

下面是维基百科对正态分布的介绍:
正态分布(英语:normal distribution)又名高斯分布(英语:Gaussian distribution),是一个非常常见的连续概率分布。若随机变量 X服从一个位置参数为 ?、尺度参数为 σ 的正态分布,记为:
X∼N(μ,σ)X \sim N(\mu, \sigma) X∼N(μ,σ)
则其概率密度函数为
f(x)=1σ2π e−(x−μ)22σ2f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {{(x-\mu )^2 \over 2\sigma^2}}} f(x)=σ2π​1​e−2σ2(x−μ)2​
正态分布的数学期望值或期望值 ? 等于位置参数,决定了分布的位置;其方差 σ2的开平方或标准差 σ 等于尺度参数,决定了分布的幅度。通常所说的标准正态分布是位置参数? =0,尺度参数 σ2 = 1的正态分布。

下面是正态分布图(来自维基):

2. t分布

2.1 概念

在概率论和统计学中,学生t-分布(Student’s t-distribution)可简称为t分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

假设 X是呈正态分布的独立的随机变量(随机变量的期望值是 ? ,方差是 σ2但未知)。 令:

X‾n=X1+⋯+Xnn{\overline {X}}_{n}= {\frac {X_{1}+\cdots +X_{n}}{n}} Xn​=nX1​+⋯+Xn​​

为样本均值。

Sn2=∑i=1n(Xi−X‾n)2n−1{S_{n}}^{2}={\frac {\sum _{{i=1}}^{n}\left(X_{i}-\overline {X}_{n}\right)^{2}}{n-1}} Sn​2=n−1∑i=1n​(Xi​−Xn​)2​

为样本方差。

T值定义:
T=X‾n−μSnnT={\frac {{\overline {X}}_{n}-\mu }{\frac {S_{n}}{\sqrt {n}}}} T=n​Sn​​Xn​−μ​

T的概率密度函数是:
f(t)=Γ(ν+12)νπ  Γ(ν2)(1+t2ν)−(ν+1)2f(t)={\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi \,}}\,\Gamma ({\frac {\nu }{2}})}}(1+{\frac {t^{2}}{\nu }})^{\frac {-(\nu +1)}{2}} f(t)=νπ​Γ(2ν​)Γ(2ν+1​)​(1+νt2​)2−(ν+1)​
参数 v = n − 1, 一般被称为自由度。 T的分布称为t-分布。
关于伽玛函数,不再具体展开,可点击链接参考维基百科。

2.2 分布图

T的概率密度函数的形状类似于标准正态分布(?=0, σ2=1),但更低更宽。随着自由度 v 的增加,则越来越接近均值为0方差为1的正态分布。
t-分布密度 (红色曲线) 在自由度为 1, 2, 3, 5, 10, 30比较于标准正态分布(蓝色曲线).
前幅图用绿色曲线表示.

2.3 应用

t分布是对两个样本均值差异进行显著性测试的学生t检验的基础。学生t检验改进了Z检验(Z-test),因为Z检验以母体标准差已知为前提。虽然在样本数量大(超过30个)时,可以应用Z检验来求得近似值,但Z检验用在小样本会产生很大的误差,因此必须改用学生t检验以求准确。

在母体标准差未知的情况下,不论样本数量大或小皆可应用学生t检验。
在待比较的数据有三组以上时,因为误差无法被压低,此时可以用变异数分析(ANOVA)代替学生t检验。

3.卡方分布

3.1 概念

卡方分布(chi-square distribution, χ²-distribution,或写作χ²分布)是概率论与统计学中常用的一种概率分布。
若k个随机变量 Z1、……、 Zk是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和
X=∑i=1kZi2X=\sum _{{i=1}}^{k}Z_{i}^{2} X=i=1∑k​Zi2​
被称为服从自由度为 k 的卡方分布,记作
X∼χ2(k)或X∼χk2X \sim \chi ^{2}(k) \space 或 \space X \sim \chi _{k}^{2} X∼χ2(k) 或 X∼χk2​

3.2 分布图

下面是卡方分布的概率密度函数:

3.3 应用

卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于:

样本某性质的比例分布与总体理论分布的拟合优度(例如某行政机关男女比是否符合该机关所在城镇的男女比);
同一总体的两个随机变量是否独立(例如人的身高与交通违规的关联性);
二或多个总体同一属性的同素性检定(意大利面店和寿司店的营业额有没有差距)。

4. F分布

4.1 概念

F分布定义:设X、Y为两个独立的随机变量,X服从自由度为k1的卡方分布,Y服从自由度为k2的卡方分布,F-分布是这两个卡方分布变量X、Y除以各自的自由度后的比率的分布:

X1/k1X2/k2=X1/X2k1/k2{\frac {X_{1}/k_{1}}{X_{2}/k_{2}}}={\frac {X_{1}/X_{2}}{k_{1}/k_{2}}} X2​/k2​X1​/k1​​=k1​/k2​X1​/X2​​

4.2 概率密度函数

F分布的形状依赖于分子和分母的自由度,分布不对称,在第一象限。

4.3 应用

F-分布(F-distribution)是一种连续概率分布,被广泛应用于似然比率检验,特别是ANOVA中。

在下篇F检验的应用着重介绍了两个应用:
a) 对于正态总体来说,两个总体的方差比较可以用F-分布来检验;
b) F检验应用于方差分析。

小结

对于来自呈正态分布而方差未知的总体的小样本,T值类似于基于小样本进行的正态分布标准化转换,T的概率密度函数的形状也类似于标准正态分布,且随着自由度增加会越来越接近。t分布是对两个样本均值差异进行显著性测试的学生t检验的基础,在母体标准差未知的情况下,不论样本数量大或小皆可应用学生t检验。

卡方分布是k个独立的标准正态分布变量的平方和服从的分布,自由度为k,可用于计算假设检验和置信区间,由其延伸的皮尔森卡方检验很常用。

F分布是基于卡方分布的。

正态分布、t分布、卡方分布、F分布的关系与差异相关推荐

  1. 数理统计四大分布---正态分布、卡方分布、学生t分布和F分布

    在统计学上,我们会遇到一些常见的分布,除了正态分布外,,如t检验对应的t分布,检验对应的分布,方差分析对应的F分布等.这些分布是统计学的基础,在假设检验.方差分析等领域都起着至关重要的作用.在此,我们 ...

  2. 连续分布——正态分布、卡方分布、t分布、F分布

    正态分布 某一地区的人群生长环境相似,我们随机选20个男性,量出他们的身高,近似地服从正态分布. 正态分布,即高斯分布,是自然界最常见的数据分布了. 用均值.标准差来确定一个正态分布概率密度图.比如N ...

  3. 数理统计三大分布:卡方分布、t分布、F分布

    数理统计三大分布:卡方分布.t分布.F分布 正态分布 卡方分布 定义 概率密度函数 性质 t分布 定义 概率密度函数 性质 F分布 定义 概率密度函数 性质 Attention 正态分布 由于χ2\c ...

  4. t分布 u分布 卡方分布_f分布t分布与卡方分布

    <f分布t分布与卡方分布>由会员分享,可在线阅读,更多相关<f分布t分布与卡方分布(8页珍藏版)>请在人人文库网上搜索. 1.1.4 常用的分布及其分位数1. 卡平方分布卡平方 ...

  5. χ² 分布到 F 分布到 ANOVA

    1. χ²分布 2. F分布 当需要计算方差的比值时,便会用到 F分布. 如下两个独立的分布: U1:χ²分布,自由度为 ν1 U2:χ²分布,自由度为 ν2 F-分布的概率密度函数为: f(x)=Γ ...

  6. 结合实例,直观理解正态分布、卡方分布、t分布、F分布和对应的Z检验、卡方检验、t检验、F检验

    1 正态分布与Z检验 1.1 理论 Z检验的目的是为了验证:已知一个总体服从均值,方差的正态分布,现在有一些样本,这些样本所代表的总体的均值是否为. 则构建一个统计量Z, (1) 式中,为样本均值,为 ...

  7. 正态分布/卡方分布/F分布/T分布

    正态分布: 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ.方差为σ^2的高斯分布,记为N(μ,σ^2). ...

  8. 几大分布:正态分布、卡方分布、t分布、F分布整理

    一.正态分布 正态分布(Normal distribution)又名高斯分布(Gaussiandistribution),若随机变量X服从一个数学期望为μ.方差为σ2的高斯分布,记为N(μ,σ2).其 ...

  9. f分布表完整图_【教育统计答疑】如何理解正态分布、均值分布、^2分布、t分布和F分布...

    许多教育统计的初学者都表示这几个分布感到学起来非常吃力,结合最近上课的体会以及答疑的情况,觉得很有必要在这里简单地对这部分内容进行澄清和梳理,以助理解. 首先,"为什么要学习这几个分布&qu ...

  10. t分布 u分布 卡方分布_重要抽样分布:卡方分布(χ2分布)、t分布和F分布

    冒泡~:最近在回顾一些以前学过的概率论和数理统计的知识 发现这三个抽样分布经常出现,在参数估计和假设检验也会运用到,所以做一下整理. [首先,这三个抽样分布都是来自正态总体的常用的分布 可以根据情况应 ...

最新文章

  1. 不小心执行了 rm -f,先别急着跑路
  2. 搭建XSS (跨网站指令码) 测试平台
  3. 项目管理系列之质量管理
  4. SAP UI5 attachment绑相对url
  5. android 存储方式以及路径简介
  6. CSS中可以通过哪些属性定义,使得一个DOM元素不显示在浏览器可视范围内?
  7. 关于一致性hash算法的几个问题
  8. HDU 4649 Professor Tian(概率DP)题解
  9. 生成器模式及C++代码实现
  10. 201671030113 词频统计软件项目报告
  11. tplink控制上网设备_tp link无线路由器设置里的主人设备 访客网络
  12. 网站外链如何才能被搜索引擎快速收录呢?
  13. IIS 无法启动:发生意外错误0x8ffe2740 的原因
  14. Minecraft 1.18.2 forge开发 | (1) 开发环境搭建
  15. flask peewee教程
  16. Mysql基础篇-23-触发器Tigger
  17. set the request's mode to 'no-cors' to fetch the resource with CORS disa
  18. css盒子样式有哪些,css盒子模型 css3盒子相关样式
  19. Git代码管理与发布流程
  20. [机器学习] 线性回归

热门文章

  1. 计算机科学与技术的研究背景,计算机科学与技术发展背景
  2. 二级c语言考试怎么调试程序,计算机二级C语言上机考试操作步骤及流程和注意事项...
  3. 查看计算机各程序运行时间,查看电脑运行时间_查看电脑运行时间命令
  4. 2022年 超详细的Android(安卓)入门编程教程
  5. 从DOS中装操作系统时要加载smartdrv命令
  6. Delphi外挂制作
  7. 驱动精灵w8ndows xp sp2,惠普HP LaserJet 1020打印机驱动官方正式版下载,适用于winxp,winvista,win7,win8,win10-驱动精灵...
  8. 北通 战戟 BTP-2118
  9. Redmi显示器调节亮度 27英寸/2k/ IPS技术/低蓝光
  10. Computer:C盘简介成功解决当Win10系统进行深度学习的时候发现系统C盘满了,教你如何正确卸载一些非必要的内容(提高磁盘内存和网速)