假设检验1——理论基础

假设检验和区间估计都依赖于抽样分布，利用抽样分布的特性推导出区间估计和假设检验的概率公式。

1.假设检验与区间估计
由于假设检验与区间估计都是基于抽样分布，即基于样本抽样分布的性质去计算相应的置信区间或者比较临界值判断假设是否成立，两者相比假设检验比区间估计多了一个已知条件，即假设总体参数等于某个常数。

例如，对于总体均值的区间估计和假设检验需要用到均值抽样分布（Z 分布或 T分布），如果样本容量大于30 ，总体分布未知，根据中心极限定理，均值的抽样分布服从正态分布，将其标准化为标准正态分布即Z分布；若样本容量小于30，且总体服从正态分布，则用T分布。
概率公式：
p(xˉ−zα2sn≤μz≤xˉ+zα2sn)=1−αp( \bar{x}- z_\frac{\alpha}{2} \frac{s}{\sqrt{n}} \leq \mu_z \le \bar{x}+z_\frac{\alpha}{2} \frac{s}{\sqrt{n}} ) =1- \alpha p(xˉ−z2αns≤μz≤xˉ+z2αns)=1−α
根据以上公式可以得到总体均值的置信区间，
而假设检验需要用到其变形前的公式：
p(−zα2≤xˉ−μzsn≤zα2)=1−αp( -z_\frac{\alpha}{2} \leq \frac{\bar{x}-\mu_z}{\frac{s}{\sqrt{n}}} \le z_\frac{\alpha}{2} ) =1- \alpha p(−z2α≤nsxˉ−μz≤z2α)=1−α
其中，Z统计量为：
z=xˉ−μzsnz=\frac{\bar{x}-\mu_z}{\frac{s}{\sqrt{n}}} z=nsxˉ−μz
通过比较z统计量的值和z分布的临界值zα2z_\frac{\alpha}{2}z2α，
如：−zα2<z<zα2-z_\frac{\alpha}{2}<z<z_\frac{\alpha}{2}−z2α<z<z2α,即z值落在接受域，因此接受原假设。

2.原假设和备择假设：

原假设和备择假设是一对对立假设，原假设通常是总体参数等于某个常数或等于另一个总体的参数，用H0表示，原假设的信息会被带入到式子中进行验证，如果结果不能拒绝原假设，就需要接受原假设所包含的信息，如果拒绝原假设就需要接受备择假设H1。

若原假设是总体参数等于某一数值，备择假设是总体参数不等于某一数值，则称这样的假设检验为双侧假设检验；若备择假设是总体参数大于此常数，这样的假设检验成为右侧假设检验；若备择假设是总体参数小于此常数，这样的假设检验成为左侧假设检验。

3.拒绝域和接受域：
小概率原理：即如果一件事情发生的可能性很小，那么他在一次试验中是几乎不可能发生的。小概率用a表示；对于双侧检验，中间的区域是接受域，面积等于置信水平1-a，两侧是拒绝域面积各为a 的一半；判别标准就是：如果样本计算结果落在接受域内则接受原假设，如果落在拒绝域内则拒绝原假设同时接受备择假设。

4.两类错误：
假设检验实质上是利用反证法对院级爱舍做出非对即错的判断，先假定原假设是正确的再带入验证。
两类错误是：一是原假设为真，却拒绝原假设，称为“弃真”错误，由于拒绝域的概率为a，所以范这类错误的概率最大值就是显著性水平a；二是原假设为假，却接受原假设, 范此类错误的概率是β\betaβ。

5.假设检验的一般步骤：

假设检验的依据是各种抽样分布，总体均值的假设检验适用Z分布和T分布；总体方差的假设检验适用卡方分布；两个总体方差比的假设检验适用F分布。在进行假设检验时，一般按照以下五个步骤操作：
a.根据实际问题建立原假设和备择假设；
b.选择合适的置信水平1-a;
c.选择合适的样本统计量，并确定以原假设为真时的抽样分布。
d.确定临界值；
e.进行判别，得到结论。

另外，假设检验的总体参数主要是总体均值，可根据原假设中涉及的样本数目（总体数目）分为单样本假设检验、两样本假设检验和多样本假设检验。

参考：《人人都会数据分析：从生活实例学统计》

假设检验1——理论基础相关推荐

python 离散数据时间序列图_每个人都学的会的数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力.很多人认为数据分析能力就是对数据进行描述和做出漂亮的统计图形的能力, ...
Deseq的理论基础
Deseq的理论基础原文:Differential Expression Analysis for Sequence Count Data by Anders and Huber 2010 写篇博文 ...
UA SIE545 优化理论基础0 优化建模3 线性回归的参数估计问题
UA SIE545 优化理论基础0 优化建模3 线性回归的参数估计问题 OLS Least Absolute Deviation (LAD) Least Max Deviation (LMD) Lea ...
大数据概论 (理论基础)
目录 1 数据科学的学科地位 2 统计学 2.1 统计学与数据科学 2.2 数据科学中常用的统计学知识 3 机器学习 3.1 机器学习与数据科学 3.1.1 机器学习基本思路 3.1.2 数据科学中常 ...
【数据分析】数据分析需要掌握的统计学理论基础知识
数据分析需要掌握的统计学理论基础知识最近在阅读徐麟老师的<数据分析师求职面试指南>,这本书系统性地描述了数据分析师的知识技能框架,非常值得阅读.对于一个数据分析师来说,统计学理论基础知识 ...
数据科学理论基础知识汇总---《数据科学理论与实践(第二版)》第二章
目录前言一.数据科学的学科地位二.统计学 2.1 统计学与数据科学 2.2 数据科学中常用的统计学知识 2.3 数据科学视角下的统计学三.机器学习 3.1 机器学习与数据科学 3.2 数据科学 ...
假设检验_python 重点
在统计学中,存在着数百种假设检验.而在数据分析.机器学习项目中,只有一小部分较常使用.本文介绍了17种常用的假设检验,包括适用场景及使用Python API的例子.让我们一起来学习吧! 正态分布检验 ...
【转载】图像缩放与插值理论基础
图像的缩放图像经过缩放后有可能在原图中招不到对应的像素点,这需要用图像插值来解决. 1.理论基础假设图像的X轴方向缩放比例是Kx,Y轴方向的缩放比是Ky,则缩放后输出图像的点(x' , y')对应 ...
机器学习理论基础到底有多可靠？
机器学习领域近年的发展非常迅速,然而我们对机器学习理论的理解还很有限,有些模型的实验效果甚至超出了我们对基础理论的理解. 目前,领域内越来越多的研究者开始重视和反思这个问题.近日,一位名为 Aidan ...
检验是否相关-------假设检验
原理: 在已知假设下,概率越小越不会发生步骤: (1)设置原假设H0,以及和其相反的备选假设H (2)通过数据分析,得到样本的均值,标准差,使用样本的特征参数代替或计算总体的特征参数 (3)根据 ...

假设检验1——理论基础

假设检验1——理论基础相关推荐

最新文章

热门文章