1、问题与数据

某研究者招募了100位受试者,拟探讨体型与参加锻炼意愿之间的关系。但在进行该项目之前,该研究者想知道招募的受试者体型分布是否与总体人群一致。

该研究者已知总体人群中有50%是正常体型(normal),35%为超重(overweight)以及15%为肥胖(obese)。现该研究者统计了这100位受试者的体型(body_composition)信息,并按照分类汇总整理,部分数据如下:

2 、对问题的分析

若研究者拟检验数据是否服从某个指定分布,如本研究中拟判断招募的受试者体型分布是否与总体人群一致,我们建议使用卡方拟合优度检验,但需要先满足3项假设:

假设1:存在一个分类变量,如本研究中受试者的体型变量是分类变量。

假设2:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。

假设3:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。

经分析,本研究数据符合假设1和假设2,那么应该如何检验假设3,并进行卡方拟合优度呢?

3、SPSS操作

3.1 数据加权

在进行正式操作之前,我们需要先对数据加权(针对汇总数据),如下:

(1) 在主页面点击Data→Weight Cases

弹出下图

(2) 点击Weight cases by,激活Frequency Variable窗口

(3) 将freq变量放入Frequency Variable栏

(4) 点击OK

3.2 卡方拟合优度检验的SPSS操作

数据加权之后,我们要根据数据类型判断卡方拟合优度检验的类型。

一般来说,卡方拟合优度检验主要分为等比例(equal proportions)和自定义比例(unequal proportions)两种。

其中,等比例是指研究者假设受试者有相等的可能性被分为任一种类。比如,我们认为患者在一周中的任一一天中去医院就诊的可能性相同,那么该研究数据就是等比例数据。相反,如果我们认为患者在周一、周五和周六去医院就诊的可能性更高,那么该研究就是自定义比例数据。

针对这两种情况,卡方拟合优度检验有不同的SPSS操作方法。本研究指定了总体人群体型分布的比例,属于自定义比例数据,但是我们为了让大家更全面地了解该检验,我们分别介绍两种类型。

3.2.1 等比例操作

(1) 在主页面点击Analyze→ Nonparametric Tests→Legacy Dialogs→Chi-square

弹出下图

(2) 将变量body_composition放入Test Variable list栏

(3) 点击OK

3.2.2 自定义比例操作

(1) 在主页面点击Analyze→Nonparametric Tests→ Legacy Dialogs→Chi-square

弹出下图

(2) 将变量body_composition放入Test Variable list栏

(3) 点击Expected Values中的Values

(4) 输入“50”,并点击Add

注意:我们要按照body_composition变量的命名顺序输入总体人群的体型分布比例。如下图所示,body_composition变量是以正常、超重、肥胖的顺序命名的,那么,我们也要以对应的总体人群人比例 “50”、“35” 和 “15” 输入 “Values” 栏。

(5) 输入“35”,并点击Add

(6) 输入“15”,并点击Add

(7) 点击OK

经上述操作,SPSS输出等比例情况下的预期频数,如下所示:

该表显示,本研究最小的预测频数是33.3,大于5,满足假设3,具有足够的样本量。Test Statistics表格也对该结果做出提示,如下标注部分:

即在本研究中,没有小于5的预测频数,可以直接进行卡方拟合优度检验。

同样地,经上述操作,SPSS也输出自定义比例情况下的预期频数,如下所示:

该表显示,本研究最小的预测频数是15,大于5,满足假设3,具有足够的样本量。Test Statistics表格也对该结果做出提示,如下标注部分:

即在自定义比例的情况下,本研究也没有小于5的预测频数,可以直接进行卡方拟合优度检验。

4、结果解释

4.1 等比例的结果解释

在进行等比例卡方拟合优度检验的结果分析之前,我们需要先对研究数据有个基本的了解。SPSS输出结果如下:

该表提示本研究中共有100位受试者,可按照体型变量分为“正常”、“超重”和“肥胖”3类。在等比例数据的假设下,我们认为受试者有相等的可能性被分为任意一类。因此,每一类别的预测频数为100/3=33.3 (“Expected N”栏)。

但实际上,受试者体型类型的观测频数与预测频数并不相等,“Residual”栏提示了每一类型中观测频数与预测频数的差别,如下:

以体型正常的受试者为例,我们可以发现“Residual”栏的提示值刚好是观测频数和预测频数的差值,如下:

即51-33.3=17.7,提示在等比例的假设下,正常体型的观测频数比预测频数高17.7。其他两个分类的解释与此一致,我们就不再赘述。

在卡方拟合优度检验中,每一类别的残差值越小说明调查数据与指定分布的拟合程度越好。当我们假设数据是等比例分布时,本研究的数据残差值较大,提示受试者的体型数据不符合等比例分布。

但是这种简单比较的数据结果易受到抽样误差的影响,可信性不强,还需要进行统计学检验。

SPSS输出等比例卡方拟合优度检验的结果如下:

卡方拟合优度检验结果显示χ2=14.780,P = 0.001,说明本研究数据不符合指定数据分布情况,提示受试者的体型数据不符合等比例分布。如果P>0.05,那么就说明本研究数据符合指定数据分布情况,即认为受试者的体型数据符合等比例分布。

4.2 自定义比例的结果解释

在进行自定义比例卡方拟合优度检验的结果分析之前,我们也需要先对研究数据有个基本的了解。SPSS输出结果如下:

该表提示本研究中共有100位受试者,可按照体型变量分为“正常”、“超重”和“肥胖”3类。根据我们输入的指定分布比例:50%、35%和15%,SPSS计算出各体型类别的预测频数,如下:

即“Expected N”栏提示各体型类别的预测频数。以体型正常为例,我们认为在总体人群中,该体型人群应占50%。那么在这100位受试者中,体型正常的受试者应有100*50%=50位。

同样地,从该表也可以看出,受试者体型的观测频数与预测频数并不相等, “Residual” 栏提示了每一类型中观测频数与预测频数的差值,如下:

以体型正常的受试者为例,如下标注部分:

残差值刚好是观测频数与预测频数的差,即51-50.0=1.0,提示在指定比例的情况下,正常体型的观测频数比预测频数高1.0。其他两个分类的解释与其一致,我们就不再赘述。

在卡方拟合优度检验中,每一类别的残差值越小说明调查数据与指定分布的拟合程度越好。当我们假设总体人群的体型分布比例为50%、35%和15%时,本研究的数据残差值较小,提示受试者的体型数据符合该比例分布。但是这种简单比较的数据结果易受到抽样误差的影响,可信性不强,还需要进行统计学检验。

SPSS输出自定义比例卡方拟合优度检验的结果如下:

卡方拟合优度检验结果显示χ2=3.820, P = 0.148, 说明本研究数据符合指定数据分布情况,提示这100位受试者的体型分布情况与总体人群一致。如果P<0.05,那么就说明本研究数据不符合指定数据分布情况,即认为受试者的体型分布情况与总体人群不同。

5、撰写结论

5.1 等比例情况

本研究共招募100位受试者,其中51位体型正常,28位超重,21位肥胖。采用卡方拟合优度检验判断这些受试者的体型数据是否符合等比例分布。结果显示,本研究最小的预测频数为33,可以采用卡方拟合优度检验,χ2=14.780,P = 0.001,说明本研究数据不符合指定数据分布情况,提示受试者的体型数据不符合等比例分布。

5.2 自定义比例的情况

本研究共招募100位受试者,其中51位体型正常,28位超重,21位肥胖。采用卡方拟合优度检验判断这些受试者的体型分布是否与总体人群(正常、超重和肥胖的比例分别为50%、35%和15%)一致。结果显示,本研究最小的预测频数为15,可以采用卡方拟合优度检验,χ2=3.820,P = 0.148,说明本研究数据符合指定数据分布情况,提示这100位受试者的体型分布情况与总体人群一致。

(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)

python卡方拟合优度检验_SPSS超详细教程:卡方拟合优度检验相关推荐

  1. Python数据可视化之Plotnine库超详细教程系列

    Python数据可视化之Plotnine库超详细教程系列(一):概述 一.Plotnine库简介 ggplot2包奠定了R语言数据可视化在数据科学中的地位,数据可视化一直是Python的短板,即使有M ...

  2. 10分钟教你用python打造贪吃蛇超详细教程

    更多精彩尽在微信公众号[程序猿声] 10分钟教你用python打造贪吃蛇超详细教程 在家闲着没妹子约, 刚好最近又学了一下python,听说pygame挺好玩的.今天就在家研究一下, 弄了个贪吃蛇出来 ...

  3. Python实现飞机大战-第二部分(附源码、素材、超详细教程)

    飞机大战第二部分 1.前言 2.飞机射击 2.1.添加子弹的相关设置 2.2.创建文件bullet.py 2.3.修改game_functions.py 2.4.修改mian.py 2.5.射击效果 ...

  4. python爬虫之bs4模块(超详细)

    python爬虫之bs4模块(超详细) 一.bs4简介 二.使用方法 三.BeautifulSoup四大对象种类 (1)tag (2)NavigableString (3)BeautifulSoup ...

  5. 从无到有 Ubuntu16.04 18.04 20.04安装+Todesk+Chrome+NVIDIA驱动+CUDA+Cudnn+Anaconda3+Pycharm 超详细教程+踩坑问题

    从无到有 Ubuntu16.04 18.04 20.04安装+Todesk+Chrome+NVIDIA驱动+CUDA+Cudnn+Anaconda3+Pycharm 超详细教程+踩坑问题(有部分图片忘 ...

  6. NumPy 超详细教程(1):NumPy 数组

    系列文章地址 NumPy 最详细教程(1):NumPy 数组 NumPy 超详细教程(2):数据类型 NumPy 超详细教程(3):ndarray 的内部机理及高级迭代 文章目录 系列文章地址 1.N ...

  7. WebRTC VideoEngine超详细教程(三)——集成X264编码和ffmpeg解码

    转自:http://blog.csdn.net/nonmarking/article/details/47958395 本系列目前共三篇文章,后续还会更新 WebRTC VideoEngine超详细教 ...

  8. 微服务Springcloud超详细教程+实战(二)

    微服务Springcloud超详细教程+实战(二) -------------------------------------- 远程调用方式 无论是微服务还是分布式服务(都是SOA,都是面向服务编程 ...

  9. rtl8811au黑苹果10.15_荣耀MagicBook I5黑苹果折腾记(超详细教程与排坑)

    本文主要介绍如何安装Win10 + Mac OS双系统,以及安装过程中可能遇到的一些坑. 本人的机型是:MagicBook I5-8250U MX150独显 8GB+256GB (VLT-W50),更 ...

  10. tensorflow的regress(超详细教程)

    tensorflow的regress(超详细教程) 运行结果 代码如下: """ Know more, visit my Python tutorial page: ht ...

最新文章

  1. C++ 简单读写文本文件、统计文件的行数、读取文件数据到数组
  2. php图片编辑失真,PHP上传真彩图片缩略图质量失真解决方法
  3. [渝粤教育] 西南科技大学 理论力学 在线考试复习资料
  4. mysql large pages_Innodb内存管理解析
  5. 阶段3 3.SpringMVC·_06.异常处理及拦截器_5 SpringMVC拦截器之编写controller
  6. HDU_5688 (map)
  7. 原生js实现多语言切换
  8. Java项目:springboot超市进销存管理系统
  9. python forward函数___call__、__init__和 forward三个函数在python中的调用方法
  10. IPHONE苹果手机短信短消息备份导出,格式分析,数据库sqlite
  11. 苹果xr截屏怎么截_苹果系统截屏录屏+标记剪辑功能详解( iPhone/iPad/Mac)
  12. strtodate mysql_MySQL str_to_date()函数
  13. 利用Matlab将任意曲线旋转任意角度
  14. 长文图解:金字塔原理如何指导技术系统优化
  15. PHM寿命预测内容定稿
  16. 第二章 系统集成及服务管理知识点1
  17. 淘宝同行店铺采集软件可以采集淘宝店铺吗?
  18. 高版本自动接听电话方法
  19. 互联网资讯:高德打车推“出游无忧”服务,乘客遇恶意绕路等七类情况可获额外补偿
  20. UDP的可靠性传输详解

热门文章

  1. cdr转换成html格式,如何将CDR高版本转换成低版本?CDRX7文件转换成X4教程
  2. 微软商店 错误代码0x80073CF9
  3. TextView 倾斜属性
  4. matlab生成16进制正弦波表
  5. python 爬虫——模拟登录古诗文网
  6. linux环境下安装curl,Linux环境下curl安装和移植
  7. (金税盘版)开票软件,登录提示密钥容器不存在,怎么处理?
  8. layui表单验证,表单提交的若干个方法
  9. Ubuntu安装显卡驱动教程
  10. 科立捷对讲机频道频率_信道式对讲机和频率式对讲机怎么调频?