数据分析(2)——假设检验的详细原理步骤
数据分析(2)——假设检验
- 1.假设检验及其相关概念的定义
- 1.1 什么是假设检验
- 1.2 一些基本概念
- 1.3 解释p值与计算p值
- 1.4 单双测检验
- 2 假设检验的方法
- 2.1 z检验
- 2.1.1 z检验的定义及公式
- 2.1.2 z检验的实例
- 2.2 t检验
- 2.2.1 t检验的定义
- 2.2.2 t检验的实例
- 2.2.2.1 单样本t检验
- 2.2.2.2 两独立样本t检验
- 2.2.2.3 配对样本t检验
- 3 假设检验的两种错误
- 4 三种检验的使用情况及计算公式
- 4.1 适用范围
- 4.2 计算公式
- 5 总结
1.假设检验及其相关概念的定义
1.1 什么是假设检验
在统计学中,想要证明一个命题是正确的,只能通过证明其否命题是错误的来达到目的。假设检验是用统计数据来判断命题真伪的方式。
通常会假设两个命题:H0:备受质疑的命题;H1:有待验证的问题
1.2 一些基本概念
① 显著性水平:估计总体参数落在某一区间内,可能犯错误的概率,通常用α表示。
② 置信度:通常用1-α表示,即测得的统计量和总体真实情况的差距小于这个给定值的概率。
③ 置信区间:在某一置信水平下,样本统计值与总体参数值间的误差范围,置信区间越大,置信水平越高。
1.3 解释p值与计算p值
①p值定义:度量样本所提供的证据对原假设的支持程度,p值越小说明拒绝原假设的证据越多。即观测值能够作出拒绝原假设的最小显著水平。
② 计算p值:上侧检验、下侧检验、双侧检验
③ 检验方式:z检验、t检验、卡方检验
1.4 单双测检验
① 当假设关键词有不得少于(低于)的时候用左侧检验,如灯泡的使用寿命不得少于700小时。
② 当假设关键词有不得多于(高于)的时候用右侧检验,如次品率不得高于5%。
③ 双侧检验指按分布两端计算显著性水平概率的检验,一般假设检验写作:H0:μ1=μ2。
2 假设检验的方法
2.1 z检验
2.1.1 z检验的定义及公式
定义:当总体标准差已知且样本量较大时,用标准正态分布推断差异发生的概率,从而比较两个平均数的差异是否显著。
公式:
① 检验一个样本平均数与一个总体平均数间差异是否显著:
② 检验来自两个的两组样本平均数的差异性:
2.1.2 z检验的实例
研究正常人与高血压患者的胆固醇含量,比较两组胆固醇含量是否有差异
正常人组数据:n1=506(样本量) μ1=180.6(样本均值) s1=34.2(标准差)
高血压组数据:n2=142 μ2=223.6 s2=45.8
2.2 t检验
2.2.1 t检验的定义
t检验:主要分为单样本t检验、配对样本t检验、两独立样本t检验。
t检验用于小样本比较,样本对总体有较好的代表性,且样本来自正态分布总体。
2.2.2 t检验的实例
2.2.2.1 单样本t检验
单样本t检验适用于样本均值μ与已知总体均值μ0的比较。应用于总体标准差未知的小样本比较。
实例:
某地新生儿出生体重为3.3kg,
从该地难产儿中随机抽取35名婴儿,平均体重为3.42kg,标准差为0.4kg,
问该地难产儿出生体重与新生儿体重是否不同?
2.2.2.2 两独立样本t检验
两独立样本t检验:(ab实验背后原理)适用于完全随机设计的两样本均数的比较,目对是检验两样本所来自总体的均数是否相等。
要求:两样本所代表的总体服从正态分布,且两总体方差相等,若方差不等需要先进行变换,假设检验H0:μ1=μ2
公式:
实例:
25例糖尿病患者随机分成两组,甲单纯药物治疗,乙采用药物合并饮食治疗,
二月后测空腹血糖如下,问两种疗法血糖值是否相同?
数据:n1=12,s1=182.5, n2=13,s2=141
2.2.2.3 配对样本t检验
定义:指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得到的两组数据。
公式:
3 假设检验的两种错误
第一类错误:原假设成立的情况下拒绝了原假设。
第二类错误:没有成功拒绝不成立的原假设。
4 三种检验的使用情况及计算公式
4.1 适用范围
① Z检验:
一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。在国内也被称作u检验。
② T检验:
主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
③ 卡方检验:
卡方检验:卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
4.2 计算公式
5 总结
独立样本t检验 和 配对样本t检验之间的区别:
① 独立样本t检验的数据来源是独立的样本,如同一个班级中男生和女生的成绩是否有差异。
配对样本t检验的范围是同一组对象,例如一个班级中的女生第一次月考和第二次月考的成绩是否有差异。
② 独立样本t检验中的各实验处理组无相关存在,即为独立样本。
配对样本t检验的数据是检验匹配而成的,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,组成的样本即为相关样本。
数据分析(2)——假设检验的详细原理步骤相关推荐
- Qt 实现钢笔画线效果详细原理
前言 上一篇文章:Qt 实现画线笔锋效果详细原理,根据这篇介绍的实现笔锋效果的原理,我们很容易实现另外一种笔效:钢笔. 所谓的钢笔笔效,就是真实还原钢笔书写出来的线条效果,其特征就是:根据笔的绘制速度 ...
- Matlab的详细安装步骤(看完了就会)
这里主要给大家介绍 matlab 2016a版本的详细安装步骤,看完估计大家都能安装成功(我已经亲手安装了很多遍了) matlab2016a软件地址和链接 1.微云下载 2.百度云盘下载(可以使用下文 ...
- flash计算机操作步骤,flash案例详细操作步骤(绝对全).doc
flash案例详细操作步骤(绝对全) 安徽理工大学 计算机专业2008级认识实习大纲.计划 (2009.10) 课内学时:2周 学分数:3.0 三.动画制作Flash 1.实习性质.任务与目的 本实习 ...
- UCINET-6软件及UCINET典型案例详细操作步骤解析
数据集名称:UCINET-6软件及UCINET典型案例详细操作步骤解析 相关说明:UCINET网络分析集成软件包括一维与二维数据分析的NetDraw,还有正在发展应用的三维展示分析软件Mage等, ...
- 长虹android电视安装apk,长虹电视怎么安装第三方软件,附上详细图文步骤说明...
长虹电视无论新旧型号,都遇上了无法安装U盘里apk安装包的问题,会出现下图的提示.网上很多文章说要刷固件降级才行,其实不然.本文以"蚂蚁市场"这个软件为例,教大家长虹电视怎么安装第 ...
- IM扫码登录技术专题(三):通俗易懂,IM扫码登录功能详细原理一篇就够
本文引用了作者"大古同学"的"二维码扫码登录是什么原理"一文的主要内容,为了更好的理解和阅读,即时通讯网收录时有修订和改动,感谢原作者的分享. 1.引言 自从微 ...
- k8s v1.9.6 超详细搭建步骤
部署说明 k8s新的版本与之前1.5的部署方式发生改变,官方将kubernetes大组件中的服务例如(kube-proxy.kube-api等服务)剥离出来封装成容器的形式来简化部署的方式.以下为三个 ...
- 【Linux】【服务器】 CentOS7下安装MySQL(版本8.0)详细过程步骤
一.检查是否安装过mysql [Linux][服务器]CentOS7下卸载MySQL详细过程步骤 二.下载Linux下的Mysql包,打开Mysql官网 1.MySQL官网 2.滑到最后,点击MySQ ...
- 安装 | Windows 10下基于Anaconda的TensorFlow详细安装步骤(续)——Pycharm运行tensorflow
github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 Blogger:MichaelBeecha ...
- Oracle 11g 11201_RHEL5.5_RAC_VBOX 详细搭建步骤
Oracle 11g 11201_RHEL5.5_RAC_VBOX 详细搭建步骤 1.安装好vbox,创建好虚拟机(红帽5.5),注意:VBOX全局设置VBOX磁盘的位置和备份位置 IP.hostna ...
最新文章
- 图像分类和目标检测技术有什么区别?
- 【采用】反欺诈之血缘关系分析和犯罪传导监测 - 知识图谱
- @autowired注解_SpringBoot常用注解大全
- 书评:精通Lambda:多核世界中的Java编程
- chrome 开发者工具,查看元素 hover 样式
- 11-[函数进阶]-闭包
- 链表合并面试100题系列之18链表合并
- An end-to-end TextSpotter with Explicit Alignment and Attention
- 雷军:若小米9首月供货不足百万 就去工厂拧螺丝
- 港中文用 Zoom 考试,中途遭黑客入侵传播不可描述内容
- html 英文字母不换行,css如何设置英文单词不换行?
- Mac电脑问题:磁盘读写NTFS怎么不行?
- Linux是实时系统还是分时操作系统?
- android随机抽奖代码_Android自定义效果——随机抽奖
- 初探移动设备管理——OMA DM协议向导
- 【Git】git tag
- HP ProLiant DL380 Gen9 SPP更新固件的两种方式
- 用matlab绘制三维图和三视图
- python 图片对比文件夹_使用python进行文件夹对比
- 【Android】BLE:蓝牙低功耗基础
热门文章
- 手机内存文件夹html,手机内存难清理?试试直接删掉这3个文件夹,网友:咋不早说?...
- 什么情况下会用上568A线序
- 设置表格单元格的背景颜色
- 油田大数据与创新之路的探究
- 浅谈几款软件的创新点
- python小学生口算题生成器_小学数学题生成器下载
- 国内有哪些不错的CV(计算机视觉)团队
- word中图片为嵌入式格式时显示不全_电脑中Word图片显示不全的六种处理方法
- 联想拯救者Legion Y7000P 2020款安装ubuntu16.04 解决WIFI 显卡 cuda10.2)
- u盘写保护+计算机管理,电脑如何去除u盘写保护?