在统计学上,我们会遇到一些常见的分布,除了正态分布外,,如t检验对应的t分布,检验对应的分布,方差分析对应的F分布等。这些分布是统计学的基础,在假设检验、方差分析等领域都起着至关重要的作用。在此,我们对这四种分布做详细的介绍,并附上MATLAB代码。

四种分布的讲解摘自MATLAB 2016的统计学和机器学习工具箱,有兴趣的可以去查看英文原版。

另外,为了方便,上传文档为图片格式,可能有些模糊,需要pdfword原版的可以评论留下邮箱,有时间发送给大家。

一、正态分布

定义

正态分布的概率密度函数为

背景

正态分布是两个参数的曲线族,第一个参数µ是均值,第二个参数σ是标准差。标准正态分布(记为Φ(x)) 将 µ 设为0,将 σ 设为 1。

Φ(x) 在功能上与误差函数 erf有关

正态分布的第一次使用是对二项式的连续近似。使用正态分布进行建模的通常理由是中心极限定理,其中(大致)指出,当样本大小变为无穷大时,来自任何具有有限均值和方差的分布的独立样本的总和会收敛到正态分布。

参数

要可靠地使用平均值和标准差等统计参数,需要为它们提供一个好的估计器。 最大似然估计(MLE)提供一个这样的估计。 但是,MLE可能存在偏差,这意味着其参数的预期值可能与估计的参数不相等。 例如,MLE偏向于估计正态分布的方差。 通常用于估计正态分布参数的无偏估计是最小方差无偏估计(MVUE)。 MVUE具有参数的所有无偏估计的最小方差。

正态分布的参数μ和的MVUE是样本均值和方差。 样本均值也是μ的MLE。 以下是方差的两个常见公式。

(1)

(2)

其中

例如,假设您想要估计美国所有四年级儿童身高的平均值μ和方差。 函数normfit返回均值μ的MVUE和平方根的MVUE,以及μ和的置信区间。 这是一个有趣的例子,模拟随机选择的四年级班级学生的身高(英寸)。

rng default;                    % For reproducibility

height = normrnd(50,2,30,1);  % Simulate heights

[mu,s,muci,sci] = normfit(height)

mu =

51.1038

s =

2.6001

muci =

50.1329

52.0747

sci =

2.0707

3.4954

注意,s ^ 2是方差的MVUE。

s^2

ans =

6.7605

例子

计算并绘制正态分布pdf

计算标准正态分布的pdf,参数 等于0且等于1。

x = [-3:.1:3];

norm = normpdf(x,0,1);

figure;

plot(x,norm)

二、卡方分布

综述

卡方分布通常用于假设检验,特别是拟合优度的卡方检验。

参数

参数

描述

备注

ν

自由度

ν 是非负整数

概率密度函数(pdf

其中Γ(•)是Gamma函数,ν是自由度,x≥0。

累积分布函数(cdf

其中Γ(•)是Gamma函数,ν是自由度,x≥0。

统计量描述

均值是 ν.

方差是2ν.

与其他分布的关系

χ2分布是伽马分布的特殊情况,即下面的伽马分布的等式中b = 2。

χ2分布因其在正常采样理论中的重要性而受到特别关注。 如果一组n个观测值以方差分布,并且样本标准差是,那么

该关系用于计算normfit函数中的正态参数估计的置信区间。

例子

计算卡方分布的pdf

计算具有4个自由度的卡方分布的pdf。

x = 0:0.2:15;
y = chi2pdf(x,4);
figure;
plot(x,y)

卡方分布偏向右侧,特别是对于较小自由度。

三、学生氏t分布

综述

学生的t分布是一系列曲线,取决于单个参数ν(自由度)。

参数

学生的分布使用以下参数。

参数

描述

ν = 1, 2, 3,...

自由度

概率密度函数(pdf)

定义

学生t分布的概率密度函数(pdf)是

其中ν是自由度,Γ(•)是Gamma函数。 结果y是从具有ν自由度的学生t分布观察x的特定值的概率。

绘图

该图显示了如何改变自由度参数ν的值来改变pdf的形状。 对于三个不同的ν值,使用tpdf计算值x等于0到10的pdf。 然后在同一图上绘制所有三个pdf以进行视觉比较。

x = [0:.1:10];
y1 = tpdf(x,5);   % For nu = 5
y2 = tpdf(x,25);  % For nu = 25
y3 = tpdf(x,50);  % For nu = 50
figure;
plot(x,y1,'Color','black','LineStyle','-')
hold on
plot(x,y2,'Color','red','LineStyle','-.')
plot(x,y3,'Color','blue','LineStyle','--')
legend({'nu = 5','nu = 25','nu = 50'})
hold off

随机数生成

使用trnd从Student t分布中生成随机数。 例如,以下内容从Student t分布生成一个随机数,其自由度ν等于10。

nu = 10;
r = trnd(nu)
r =
    1.0585

和其他分布的关系

随着自由度ν变为无穷大,t分布接近标准正态分布。

如果x是来自具有平均μ的正态分布的大小为n的随机样本,则为统计量

是具有n-1自由度的学生t分布,其中是样本均值,s是样本标准差。

Cauchy分布是学生t分布,自由度ν为1.Cauchy分布具有不确定的均值和方差。

累积分布函数(cdf)

定义

学生t分布的cdf是

其中ν是自由度,Γ(•)是Gamma函数。 结果p是来自具有ν自由度的t分布的单个观测值将落在区间[-∞,x]中的概率。

绘图

该图显示了如何更改参数ν的值如何改变cdf的形状。 对于三个不同的ν值,使用tcdf计算值x等于0到10的cdf。 然后在同一图上绘制所有三个cdfs以进行视觉比较。

x = [0:.1:10];
y1 = tcdf(x,5);   % For nu = 5
y2 = tcdf(x,25);  % For nu = 25
y3 = tcdf(x,50);  % For nu = 50
figure;
plot(x,y1,'Color','black','LineStyle','-')
hold on
plot(x,y2,'Color','red','LineStyle','-.')
plot(x,y3,'Color','blue','LineStyle','--')
legend({'nu = 5','nu = 25','nu = 50'})
hold off

逆 cdf

使用tinv计算学生t分布的逆cdf。

p = .95;
nu = 50;
x = tinv(p,nu)
x =
    1.6759

均值和方差

学生氏t分布的均值为

mean=0

对于自由度ν大于1.如果ν等于1,则均值未定义。

学生t分布的方差是

自由度ν大于2.如果ν小于或等于2,则方差未定义。

使用tstat计算学生t分布的均值和方差。 例如,以下计算学生t分布的均值和方差,其自由度ν等于10。

nu = 10;

[m,v] = tstat(nu)
m =
     0
v =
    1.2500

例子

比较Student's t和标准正态分布的pdf

计算参数nu = 5的Student t分布的pdf,以及标准正态分布。
x = -5:0.1:5;
y = tpdf(x,5);
z = normpdf(x,0,1);
在同一图上绘制Student's t和标准普通pdf。 标准普通pdf(虚线)的尾部比学生氏 t pdf(实线)短。、
figure;
plot(x,y,'-',x,z,'-.')

四、F分布

定义

F分布的pdf为

其中Γ(•)是Gamma函数。

背景

F分布与卡方分布具有自然关系。 如果χ1和χ2分别是具有ν1和ν2自由度的卡方,则下面的统计量F是F分布。

两个参数ν1和ν2是分子和分母的自由度。 即,ν1和ν2分别是用于计算χ1和χ2的独立信息的数量。

例子   

计算F分布pdf

计算具有5个分子自由度和3分母自由度的F分布的pdf。

x = 0:0.01:10;

y = fpdf(x,5,3);

figure;

plot(x,y)

该图显示F分布存在于正实数上并且向右倾斜。

数理统计四大分布---正态分布、卡方分布、学生t分布和F分布相关推荐

  1. matlab中f分布,在matlab中用哪个函数求F分布的分位点(分子分母的自由度和概率均已知)...

    共回答了15个问题采纳率:100% poissinv(0.7211,5)ans = 6Critical Values of Distribution functions. betainv - Beta ...

  2. 数理统计三大分布:卡方分布、t分布、F分布

    数理统计三大分布:卡方分布.t分布.F分布 正态分布 卡方分布 定义 概率密度函数 性质 t分布 定义 概率密度函数 性质 F分布 定义 概率密度函数 性质 Attention 正态分布 由于χ2\c ...

  3. 如何理解方差分析和F分布?

    2020年初,整个世界遭受了新冠病毒地袭击,直到今天人类还没有走出阴霾.抗疫前线的医学专家们日以继夜地工作,同时进行着多种药物的临床试验.那么怎么判断哪一种药物效果更好呢?这就要说到一百年前问世的方差 ...

  4. 【概率论与数理统计02】那些年,正态分布、指数分布、伽马分布、卡方分布之间的发生的那些事儿(下)

    前记:书接上回,先来回顾一下四个分布之间的关系图. 图1 四个分布关系简图 3. 简洁的三哥--指数分布 指数分布及特性    形如其名,指数分布的概率密度函数应该是最简单的了,就是单纯的指数函数的形 ...

  5. 卡方分布、F分布、t分布和正态分布的关系

    这三个分布都是基于正态分布变形得到的,在实际中只能用来做假设检验.比如卡方分布(chi-square distribution, χ²-distribution,或写作χ²分布),已知样本X都是服从正 ...

  6. 数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)

    前言:   总结一下数理统计中的基本概念,一些用python的实现在这里.不断持续更新. 1. 几个基本概念  1.1 次序统计量  1.2 样本偏度与样本峰度  1.3 经验分布函数  1.4 抽样 ...

  7. 结合实例,直观理解正态分布、卡方分布、t分布、F分布和对应的Z检验、卡方检验、t检验、F检验

    1 正态分布与Z检验 1.1 理论 Z检验的目的是为了验证:已知一个总体服从均值,方差的正态分布,现在有一些样本,这些样本所代表的总体的均值是否为. 则构建一个统计量Z, (1) 式中,为样本均值,为 ...

  8. 连续分布——正态分布、卡方分布、t分布、F分布

    正态分布 某一地区的人群生长环境相似,我们随机选20个男性,量出他们的身高,近似地服从正态分布. 正态分布,即高斯分布,是自然界最常见的数据分布了. 用均值.标准差来确定一个正态分布概率密度图.比如N ...

  9. 机械学习07: 常用统计分布:正态分布、T分布、卡方分布、F分布

    目录 1.正态分布(高斯概率密度函数和概率分布函数) 2.t分布: 3.卡方分布 4.F 分布 1.正态分布(高斯概率密度函数和概率分布函数) 正态分布(Normal distribution)又名高 ...

最新文章

  1. v$open_cursor与session_cached_cursor
  2. html标签思维导图
  3. 树莓派更换软件源提高下载速度
  4. python3.7 安装cx_Freeze
  5. c++面向对象高级编程 学习九 pointer-like classes
  6. ​使用高斯过程回归指导网络轻量化
  7. TimeOut 超时问题解决方案
  8. SpringMVC结合ajaxfileupload文件无刷新上传
  9. 图片查看器-Python-tkinter
  10. 3、那智机器人手柄各操作键的功能
  11. ld链接动态库静态库问题
  12. android 第三方社区,从友盟微社区看Android第三方SDK架构实践
  13. Oracle11g在虚拟机win7上的详细安装过程(包括win7在虚拟机上的安装)
  14. 接口请求报错 504 Gateway Time-out
  15. 使用Python3开发的一款Android截屏神器
  16. PC电脑端常见蓝屏代码自检测与解决方案
  17. b 站神器更新,还出了新玩意
  18. openlayers4 入门开发系列之风场图篇
  19. 取消ctrl+alt+left旋转桌面
  20. 英伟达发布 GPU 驱动更新,修复25个漏洞

热门文章

  1. Discuz发帖时将远程图片自动下载并保存至服务器
  2. 2021考研英语新题型刘琦
  3. c语言代码表白_C语言学习日记(9)——用C语言写一个爱心吧
  4. 搭建光纤网络_光纤| 计算机网络
  5. CAPTCHA验证码无法加载/验证失败(UDebug)解决办法
  6. [多米诺骨牌单调栈模型]CodeForces 1131G. Most Dangerous Shark
  7. 推荐三个Windows远程桌面客户端,mRemote、TSMMC.MSC、Terminals
  8. 【题解】LuoGu7108:移花接木
  9. 求N个元素的全排列(C语言,递归,无脑方法)
  10. 如果伦敦变成了一个巨大的AR涂鸦游戏场……