假设检验1——理论基础
假设检验和区间估计都依赖于抽样分布,利用抽样分布的特性推导出区间估计和假设检验的概率公式。
1.假设检验与区间估计
由于假设检验与区间估计都是基于抽样分布,即基于样本抽样分布的性质去计算相应的置信区间或者比较临界值判断假设是否成立,两者相比假设检验比区间估计多了一个已知条件,即假设总体参数等于某个常数。
例如,对于总体均值的区间估计和假设检验需要用到均值抽样分布(Z 分布或 T分布),如果样本容量大于30 ,总体分布未知,根据中心极限定理,均值的抽样分布服从正态分布,将其标准化为标准正态分布即Z分布;若样本容量小于30,且总体服从正态分布,则用T分布。
概率公式:
p(xˉ−zα2sn≤μz≤xˉ+zα2sn)=1−αp( \bar{x}- z_\frac{\alpha}{2} \frac{s}{\sqrt{n}} \leq \mu_z \le \bar{x}+z_\frac{\alpha}{2} \frac{s}{\sqrt{n}} ) =1- \alpha p(xˉ−z2αns≤μz≤xˉ+z2αns)=1−α
根据以上公式可以得到总体均值的置信区间,
而假设检验需要用到其变形前的公式:
p(−zα2≤xˉ−μzsn≤zα2)=1−αp( -z_\frac{\alpha}{2} \leq \frac{\bar{x}-\mu_z}{\frac{s}{\sqrt{n}}} \le z_\frac{\alpha}{2} ) =1- \alpha p(−z2α≤nsxˉ−μz≤z2α)=1−α
其中,Z统计量为:
z=xˉ−μzsnz=\frac{\bar{x}-\mu_z}{\frac{s}{\sqrt{n}}} z=nsxˉ−μz
通过比较z统计量的值和z分布的临界值zα2z_\frac{\alpha}{2}z2α,
如:−zα2<z<zα2-z_\frac{\alpha}{2}<z<z_\frac{\alpha}{2}−z2α<z<z2α,即z值落在接受域,因此接受原假设。
2.原假设和备择假设:
原假设和备择假设是一对对立假设,原假设通常是总体参数等于某个常数或等于另一个总体的参数,用H0表示,原假设的信息会被带入到式子中进行验证,如果结果不能拒绝原假设,就需要接受原假设所包含的信息,如果拒绝原假设就需要接受备择假设H1。
若原假设是总体参数等于某一数值,备择假设是总体参数不等于某一数值,则称这样的假设检验为双侧假设检验;若备择假设是总体参数大于此常数,这样的假设检验成为右侧假设检验;若备择假设是总体参数小于此常数,这样的假设检验成为左侧假设检验。
3.拒绝域和接受域:
小概率原理:即如果一件事情发生的可能性很小,那么他在一次试验中是几乎不可能发生的。小概率用a表示;对于双侧检验,中间的区域是接受域,面积等于置信水平1-a,两侧是拒绝域 面积各为a 的一半;判别标准就是:如果样本计算结果落在接受域内则接受原假设,如果落在拒绝域内则拒绝原假设同时接受备择假设。
4.两类错误:
假设检验实质上是利用反证法对院级爱舍做出非对即错的判断,先假定原假设是正确的再带入验证。
两类错误是:一是原假设为真,却拒绝原假设,称为“弃真”错误,由于拒绝域的概率为a,所以范这类错误的概率最大值就是显著性水平a;二是原假设为假,却接受原假设, 范此类错误的概率是β\betaβ。
5.假设检验的一般步骤:
假设检验的依据是各种抽样分布,总体均值的假设检验适用Z分布和T分布;总 体方差的假设检验适用卡方分布;两个总体方差比的假设检验适用F分布。在进行假设检验时,一般按照以下五个步骤操作:
a.根据实际问题建立原假设和备择假设;
b.选择合适的置信水平1-a;
c.选择合适的样本统计量,并确定以原假设为真时的抽样分布。
d.确定临界值;
e.进行判别,得到结论。
另外,假设检验的总体参数主要是总体均值,可根据原假设中涉及的样本数目(总体数目)分为单样本假设检验、两样本假设检验和多样本假设检验。
参考:《人人都会数据分析:从生活实例学统计》
假设检验1——理论基础相关推荐
- python 离散数据时间序列图_每个人都学的会的数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力.很多人认为数据分析能力就是对数据进行描述和做出漂亮的统计图形的能力, ...
- Deseq的理论基础
Deseq的理论基础 原文:Differential Expression Analysis for Sequence Count Data by Anders and Huber 2010 写篇博文 ...
- UA SIE545 优化理论基础0 优化建模3 线性回归的参数估计问题
UA SIE545 优化理论基础0 优化建模3 线性回归的参数估计问题 OLS Least Absolute Deviation (LAD) Least Max Deviation (LMD) Lea ...
- 大数据概论 (理论基础)
目录 1 数据科学的学科地位 2 统计学 2.1 统计学与数据科学 2.2 数据科学中常用的统计学知识 3 机器学习 3.1 机器学习与数据科学 3.1.1 机器学习基本思路 3.1.2 数据科学中常 ...
- 【数据分析】数据分析需要掌握的统计学理论基础知识
数据分析需要掌握的统计学理论基础知识 最近在阅读徐麟老师的<数据分析师求职面试指南>,这本书系统性地描述了数据分析师的知识技能框架,非常值得阅读.对于一个数据分析师来说,统计学理论基础知识 ...
- 数据科学理论基础知识汇总---《数据科学理论与实践(第二版)》第二章
目录 前言 一.数据科学的学科地位 二.统计学 2.1 统计学与数据科学 2.2 数据科学中常用的统计学知识 2.3 数据科学视角下的统计学 三.机器学习 3.1 机器学习与数据科学 3.2 数据科学 ...
- 假设检验_python 重点
在统计学中,存在着数百种假设检验.而在数据分析.机器学习项目中,只有一小部分较常使用.本文介绍了17种常用的假设检验,包括适用场景及使用Python API的例子.让我们一起来学习吧! 正态分布检验 ...
- 【转载】图像缩放与插值理论基础
图像的缩放 图像经过缩放后有可能在原图中招不到对应的像素点,这需要用图像插值来解决. 1.理论基础 假设图像的X轴方向缩放比例是Kx,Y轴方向的缩放比是Ky,则缩放后输出图像的点(x' , y')对应 ...
- 机器学习理论基础到底有多可靠?
机器学习领域近年的发展非常迅速,然而我们对机器学习理论的理解还很有限,有些模型的实验效果甚至超出了我们对基础理论的理解. 目前,领域内越来越多的研究者开始重视和反思这个问题.近日,一位名为 Aidan ...
- 检验是否相关-------假设检验
原理: 在已知假设下,概率越小越 不会发生 步骤: (1)设置原假设H0,以及和其 相反的备选假设H (2)通过数据分析,得到样本的均值,标准差,使用样本的特征参数代替或计算总体的特征参数 (3)根据 ...
最新文章
- java exception用法_JavaException的使用
- percent之集合
- 从这3个方面,帮你大幅度提升用户的搜索体验
- python重要函数eval
- hadoop的yarn与node中的yarn冲突问题
- python爬虫网易云音乐评论最多的歌_Python网易云音乐评论爬虫,歌曲的全部评论...
- SUSE团队已将重心偏向GCC 7
- 修改数据库端口为51433
- 程序员测试死循环给老板发了10000条短信……
- JQuery获得绝对,相对位置的坐标方法
- c语言坐标轮换法_优化设计-鲍威尔法程序(c语言)
- MATLAB分段三次 Hermite 插值
- MATLAB中范数norm()函数精讲
- 零基础学FPGA(二):FPGA生产厂家及产品(呕心沥血,小白如何选择板卡)
- Linux网络配置(NAT模式)
- win10 无线鼠标卡顿,跳帧
- watch | 监听器、computend
- 短信发送一次显示两条之谜
- linux统计排序命令,Linux命令去重统计排序
- 工具篇 之 Mac 安装 JDK 1.8 并配置环境变量
热门文章
- java怎么求最大值和最小值,java求最大值和最小值
- 计算机知识论,计算机科学与技术中的系统论与辩证法
- 突发!图森未来CEO侯晓迪被罢免,公司疑遭SEC、FBI联手调查,市值一夜砍半
- 华为手机备份的通讯录是什么文件_华为手机的联系人在哪个文件夹里?
- 选择云盾抗ddos防火墙,信息安全有保障
- UPnP 协议栈的威胁分析及防范方案
- 计算机网络视频信号怎么传,如何将摄像机视频信号通过NDI传输到Zoom会议软件...
- 定位到excel最后一个非空单元格操作技巧,你一定要知道!(二)
- ATFX:美联储会议纪要发布后,美元指数逼近105关口
- C# 图片识别技术(支持21种语言,提取图片中的文字)