机械学习04:概率统计中T检测、Z检测和F检测区别和案例
T检验、Z检验和F检验个人总结和案例说明:
1、Z检测案例:(方差已知)(H0:原假设; H1:备择假设)
T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n区别二:t分布是z分布的小样本分布,即当总体符合z分布时,从总体中抽取的小样本符合t分布,而对于符合t分布的变量,当样本量增大时,变量数据逐渐向z分布趋近;
F检验又叫方差齐性检验:从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。其中要判断两总体方差是否相等。
2、T检测案例:(方差已知)(H0:原假设; H1:备择假设)
3、线性检验的两种方法:F检验和T检验
4、卡方检验
假设有两个分类变量X和Y,它们的值域分别为{x1, x2}和{y1, y2},其样本频数列联表为:
y1 |
y2 |
总计 |
|
x1 |
a |
b |
a+b |
x2 |
c |
d |
c+d |
总计 |
a+c |
b+d |
a+b+c+d |
若要推断的论述为H1:"X与Y有关系",可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量
K^2的值越大,说明"X与Y有关系"成立的可能性越大。
当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论"X与Y有关系"的可信程度:
P(K^2≥k) |
0.50 |
0.40 |
0.25 |
0.15 |
0.10 |
k |
0.455 |
0.708 |
1.323 |
2.072 |
2.706 |
P(K^2≥k) |
0.05 |
0.025 |
0.010 |
0.005 |
0.001 |
k |
3.841 |
5.024 |
6.635 |
7.879 |
10.828 |
例如,当"X与Y有关系"的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以"X与Y有关系"成立的概率为1-0.025=0.975,即97.5%。
5、F检测
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 S^2,以确定他们的精密度是否有显著性差异
样本标准偏差的平方,即("^2"是表示平方):
S^2=∑(X-X平均)^2/(n-1)
两组数据就能得到两个S^2值,S大^2和S小^2
F=S大^2/S小^2
由表中f大和f小(f为自由度n-1),查得F表,
然后计算的F值与查表得到的F表值比较,如果
F < F表 表明两组数据没有显著差异;
F ≥ F表 表明两组数据存在显著差异
机械学习04:概率统计中T检测、Z检测和F检测区别和案例相关推荐
- Matlab在概率统计中的应用问题及解决方案集锦
前言 关于MATLAB系列的精品专栏大家可参见 MATLAB-30天带你从入门到精通 MATLAB深入理解高级教程(附源码) 喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! Matlab在概 ...
- 《Excel数据可视化:一样的数据不一样的图表》——2.3 概率统计中的正态分布和偏态分布...
本节书摘来自华章计算机<Excel数据可视化:一样的数据不一样的图表>一书中的第2章,第2.3节,作者 恒盛杰资讯,更多章节内容可以访问云栖社区"华章计算机"公众号查看 ...
- matlab在概率统计中的应用
概率统计 1.产生随机变量 binornd(n,p) 生成服从二项分布的随机数 normrnd(mu,sigma) 2.概率密度计算 3.累计概率分布 cdf 4.统计特征 平均值 中位数 排序 方差 ...
- 统计概率分布_概率统计中的重要分布
统计概率分布 Random Variables follow different types of distribution in probability space which decides th ...
- matlab unifit,【matlab】matlab在概率统计中的应用(二)
4.7.1 常见分布的参数估计 命令 β分布的参数a和b的最大似然估计值和置信区间 函数 betafit 格式 PHAT=betafit(X) [PHAT,PCI]=betafit(X,ALPHA) ...
- 计算机公式s是什么意思,概率统计中S是什么意思?如何算得?
是标准差(Standard Deviation) ,中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示.标准差是方差的算术平方根.标准差能反映一个数据集的离散程度.平均数相同的两组数据 ...
- 概率统计中的样本矩和顺序统计量
1.样本k阶(原点)矩 2.样本k阶中心矩 3.顺序统计量
- 关于概率分布理论的原理分析的一些讨论,以及经典概率分布的应用场景,以及概率统计其在工程实践中的应用...
1. 随机变量定义 0x1:为什么要引入随机变量这个数学概念 在早期的古典概率理论研究中,人们基于随机试验的样本空间去研究随机事件,也发展出了非常多辉煌的理论,包括著名的贝叶斯估计在内. 但是随着研究 ...
- 概率论在实际生活的例子_概率统计在实际生活中的应用
阿尔法趣味数学网小编来今天给同学们带来的趣味数学故事是:概率统计在实际生活中的应用. 每天10分钟头脑大风暴,开发智力,培养探索能力,让你成为学习小天才. 故事适合年级:小学 [概率统计在实际生活中的 ...
最新文章
- C内存2:程序是如何运行的
- Centos 6.5下一个SNMP简单配置(snmp protocol v3,监控宝)
- java项目集成mybatis_JAVA应用程序单独集成Mybatis使用Demo
- idea 中使用@Autowired注入mybatis Mapper接口时报错
- ASP.NET MVC 3 常用
- Python 数据分析三剑客之 Pandas(五):统计计算与统计描述
- cude的__ldg使用
- php fetch返回false,Php fetch返回字符串而不是布爾值“true / false”值
- web 开发之js---页面缓存, jsp 缓存, html 缓存, ajax缓存,解决方法
- Scala 安装(win)
- 可能是迄今为止最好的GitHub代码浏览插件--赞
- python课堂整理1
- 自动售货机软件工程课设_饮料自动售货机系统实验.docx
- 【十次方】Springboot中使用Redis做缓存
- 压力测试~一套完整的压力测试项目文档
- linux网络查看,Linux网络命令(网络环境查看和网络测试命令)
- Channel 通道详解
- Freertos中空闲任务的重要性
- poj3046 Ant Counting
- (C++)“韩信点兵”问题的求解方法