通常情况下,卡方检验是研究分类数据与分类数据之间关系的分析方法,如性别和是否戴隐形眼镜之间的关系。卡方检验通常会涉及卡方值和P值两个名词术语。卡方值与P值有对应关系,P值小于0.05则说明有差异存在,即性别与是否戴隐形眼镜之间有联系。在具体差异分析的基础上,进一步分析不同性别样本戴隐形眼镜的百分比,例如,男性戴隐形眼镜的百分比为30%,而女性戴隐形眼镜的百分比为50%,说明女性样本戴隐形眼镜的比例要明显高于男性样本。

除此之外,卡方检验(准确说是卡方拟合优度检验)还可以检验定类数据的分布特征是否与预期保持一致。比如本来预计男性和女性的比例各占一半(50%),但收集回来的数据却是45%和55%,那么收集回来的数据是否就明显的偏差预期(50%)呢?此时也可以使用卡方检验。

卡方检验在实际使用过程中,还可用于问卷多选题的分析(也称作多重响应分析),比如多选题的选择比例是否均匀,也或者单选题和多选题之间的差异关系情况如何呢,均可使用卡方检验进行分析。下表格为卡方检验的实际使用类型说明:

检验类型

说明

举例

卡方检验

定类和定类数据的差异

比如性别和是否戴眼镜

卡方拟合优度检验

定类数据的选项占比差异

比如预期性别中男和女各占一半,数据是否是这样呢?

多重响应分析

多选题的选项分布情况是否有差异?单选题和多选题之间是否有着选择差异?

多选题涉及到的差异分析

1 卡方检验理论说明

通常理解的卡方检验,其检验目的在于定类和定类数据的差异。比如性别和是否戴眼镜的关系,性别和是否戴眼镜都是定类数据,因此可以研究性别和是否戴眼镜的比例是否有明显的差异性。

除此之外,还有一种卡方检验(准确说是卡方拟合优度检验),其目的是研究定类数据各选项的分布比例上是否有着差异性,比如性别男和女预期是50%和50%,那事实上的样本是否明显的偏离这一比例呢,这种即卡方拟合优度检验。

在问卷研究里面,有很多的多选题,多选题各项的比例是否均匀呢?那么就可以利用卡方拟合优度检验进行分析(SPSSAU默认提供);如果想研究单选题和多选题的选择差异关系,那么这种是研究定类数据和定类数据的差异性,SPSSAU默认也提供卡方检验结果。

2 如何使用SPSSAU进行卡方检验

说明

SPSSAU位置

定类和定类数据的差异

  • 通用方法-》交叉(卡方)
  • 医学研究-》卡方检验

定类数据的选项占比差异

  • 医学研究-》卡方拟合优度检验

多选题的选项分布情况是否有差异?单选题和多选题之间是否有着选择差异?

  • 问卷研究-》多选题
  • 问卷研究-》单选-多选
  • 问卷研究-》多选-多选

1)绝大多数情况下,均是直接研究定类和定类数据差异,SPSSAU共有两个地方可实现,分别是通用方法里面的“交叉(卡方)”和医学研究里面的卡方检验。如果是汇总数据,即加权数据,此时只能使用医学研究里面的卡方检验,同时,如果希望提供更多详细的数据指标,比如自由度,列联系数,Cramer V等,均需要使用医学研究里面的卡方检验。

2)如果是进行卡方拟合优度检验,即研究定类数据选项占比差异,此时应该使用医学研究里面的卡方拟合优度检验。操作如下图所示:

默认SPSSAU会假定选项的选择比例完全一致,即男和女的比例是50%和50%。如果预期是40%和60%,那么可对“期望值设置(默认相等)”这个按钮进行设置,如下图:

3)如果是问卷研究里面的多选题操作,直接使用SPSSAU问卷研究里面对应多选题的按钮即可,比如下图:

如果是希望研究多选题的选择比例和选择差异情况,那么直接使用‘多选题’;

  • 如果是研究单选题和多选题的差异情况,使用‘单选-多选’;
  • 如果是研究多选题和单选题的差异情况,使用‘多选-单选’;
  • 如果是研究多选题和多选题的差异情况,使用‘多选-多选’;

特别说明一点:多选题的数据格式非常特殊,一个选项一个标题,比如5个选项就有5个标题,而且需要使用数字标识‘选中’还是‘没有选中’,一般情况下数字1表示‘选中’,数字0表示‘没有选中’。

如果原始数据使用数字表示选中,null值表示没有选中,那么需要把null值全部替换成数字0,可使用SPSSAU数据处理->异常值功能进行批量处理,把null值即缺失值填补成数字0即可。

3 卡方检验相关问题?

使用卡方检验时,数据格式非常重要,因为SPSSAU支付加权和非加权两种格式,而且有时想利用卡方检验查看相关关系情况,此时还需要看一些新的指标,比如列联系数、Cramer V或Lambda指标等。当然还会有一些其它问题,汇总如下图:

第1点:卡方检验数据格式问题?

SPSSAU共支持2种数据格式,分别是常规数据格式(非加权格式)和加权格式,如下说明:

上图为常规格式(即非加权格式),一行代表一个样本,一列代表一个属性,将全部的原始数据信息列出即可,比如有100个样本,那么就有100行数据。

在医学/实验研究时,很多时候只有汇总数据,即带加权项的数据,比如下图中X有2种情况,Y有3个情况,一种有2*3=6种组合,数据信息只有6种组别的汇总项(即加权项),分别是40,10,20,30,20,50;相当于总共有170个样本,如果是使用常规格式(即非加权格式),此时应该有170行;但加权格式则只需要6行即可表示,如下图:

在使用SPSSAU医学研究-》卡方检验,也或者医学研究-》卡方拟合优度检验时,SPSSAU均支持加权数据格式。一旦数据是加权格式,那么分析时需要把‘加权项’放到对应的框中即可。

第2点:fisher卡方值问题?

在SPSSAU的医学研究->卡方检验里面,如果数据是2*2格式,比如性别为男和女2个选项,学历分为本科以下和本科以上共2个选项。那么此时为2*2的组合,此时spssau默认会提供fisher卡方检验值。

当然,SPSSAU还会提供一些其它的卡方指标值,包括pearson卡方,连续校正卡方,各选择单元格的期望值和比例值等中间过程值等等(当然具体应该使用那一个,SPSSAU会自动进行判断和选择),下图仅为中间过程值等。

第3点:相关关系问题?

如果希望看出差异的幅度,而不仅仅是看是否有差异。除了使用肉眼进行分析,即对比选择百分比的具体值情况进行分析外。还可以使用效应量(effect size),effect size值通常包括Phi、列联系数、校正列联系数、Cramer V和Lambda等。此五个系数的意义都是查看差异幅度,但使用的前提并不一样,通常只需要使用其中一个即可,具体使用的标准和说明如下:

第4点:到底用卡方,还是方差,也或者非参数检验?

有时候会出现一种疑问,比如看下面的例子。

当前想研究性别和满意度的差异关系,满意度分为“非常不满意、比较不满意、一般、满意和非常满意”共五项。满意度看上去更像是定量数据,而非定类数据,但看成是定类数据也可以。

那么此时到底用卡方呢,还是使用方差(也或者非参数检验呢?)。其实这里的满意度是一种有序的定类数据,一般这种数据可能看成是定量更多,即使用方差分析更适合(当然也可使用卡方检验)。

但比如医学里面有这样的数据“未见疗效,好转和治愈”,这个也是有序的定类数据,这个仅3项,看成是定类数据就更适合了,所以使用卡方检验较好。

别错过,卡方检验实用总结!相关推荐

  1. 怎样修复小米服务器,小米手机删除的视频想要恢复?那你一定不能错过这些实用技巧...

    原标题:小米手机删除的视频想要恢复?那你一定不能错过这些实用技巧 手机功能的不断丰富,在现代社会基本都能达到人手一台手机.手机上的各种功能能够满足我们生活中的多种需要,特别是现在抖音.快手.火山等手机 ...

  2. .Net 高效开发之不可错过的实用工具

    工欲善其事,必先利其器,没有好的工具,怎么能高效的开发出高质量的代码呢?本文为 ASP.NET 开发者介绍一些高效实用的工具,包括 SQL 管理,VS插件,内存管理,诊断工具等,涉及开发过程的各个环节 ...

  3. .Net 高效开发之不可错过的实用工具(转载)

    转自 http://www.cnblogs.com/powertoolsteam/p/5240908.html Visual Studio Visual Studio Productivity Pow ...

  4. 100个不能错过的实用JS自定义函数

    转载地址:http://www.bitscn.com/school/JavaScript/201408/306460.html 1.原生JavaScript实现字符串长度截取代码如下: functio ...

  5. Mac新手必备技巧之Excel不可错过的16个实用快捷键

    你知道哪些Mac版Excel的快捷键组合?Excel 2019 for Mac是一款简单实用的电子表格制作软件,一直深受广大Mac用户好评.如果你能掌握这16个快捷键组合,那你的工作效率可以得到有效的 ...

  6. 华为官方:寻找AI开发者!

    随着互联网时代的不断发展,许多企业对应用性能的要求越来越高,应用的复杂程度也越来越高,在架构和性能提升的同时,也带来了生产环境性能问题定位难度高.修复周期长等挑战 那么 如何利用华为云服务 提升应用读 ...

  7. 硬件模拟大师_科普丨硬件检测软件3D Mark究竟多“硬核”?

    随着硬件更新换代和兼容性增强,笔记本电脑的综合性能甄别变得愈发复杂,如何精准评判一款电脑性能对众多电脑小白来说显得至关重要.尽管鲁大师同样可以提供简约直观的跑分但其偏向系统优化,高性能硬件测试更多只能 ...

  8. excel打开空白_啥?下载的文件显示“文件已损坏,无法打开”?

    推荐文章: Windows10系统的优化工具神器 对于一个开发人员的我,这两天在网站做一个导出Excel表格功能,遇到了一个坑.在本地测试导出并且可以打开,但是到了测试环境导出打开却显示"文 ...

  9. unity 自动将文件上传_unity如何存储文件夹

    玩转Unity资源,对象和序列化(上) 文章目录[点击展开](?)[+] 这是一系列文章中的第二章,覆盖了Unity5的Assets,Resources和资源管理 本文将从Unity编辑器和运行时两个 ...

  10. unity将本地文件上传到mysql_unity上传数据到数据库

    <AR与VR开发实战>--2.5 柱形识别 本节书摘来自华章出版社<AR与VR开发实战>一书中的第2章,第2.5节,作者 张克发 赵兴 谢有龙,更多章节内容可以访问云栖社区&q ...

最新文章

  1. 【推荐】年终已至,十张图告诉你15年领取年终奖的正确姿势
  2. JAVA中使用XFire调用WebService接口
  3. Elasticsearch对垒8大竞品技术
  4. An Introduction to Our Code Breaking Team
  5. oracle中sp怎么写_校招简历中的实习和项目经历该怎么写?
  6. 最长上升子序列 (LIS算法(nlong(n)))
  7. 解决Winform应用程序中窗体背景闪烁的问题
  8. DirectX11 With Windows SDK--21 鼠标拾取
  9. 超大日志文件分割方法
  10. 毕业论文开题报告模板
  11. pdfjs转图片_Vue项目pdf(base64)转图片
  12. 芝诺数解|「八」旅途中的“家”——重庆酒店特征分析
  13. RS-485电路设计及接口防护
  14. 趋势交易大师php,系统交易的初阶——趋势交易者路在何方?
  15. 数据库查询语句(书上例题)
  16. Windows版Docker桌面
  17. 歌名:江湖笑 演唱:周华健
  18. 盘点全球最热十家大数据公司中国占三席
  19. Arduino Uno + APDS9930 实现手势控制LED灯亮灭、调光等
  20. 织信Informat-低代码开发平台 JNPF快速开发平台可视化工具 3.3.3版本

热门文章

  1. win10分辨率设置_win10分辨率设置方法教程
  2. python爬取微信公众号的几种方法_一种爬取微信公众号信息的方法与流程
  3. 数据字典在mysql中怎么做_如何编写数据字典
  4. 2021-2027全球与中国大数据工程服务市场现状及未来发展趋势
  5. 离散数据编码方式总结(OneHotEncoder、LabelEncoder、OrdinalEncoder、get_dummies、DictVectorizer、to_categorical的区别?)
  6. 【Word】批量修改Word 图片大小
  7. 向量微积分——理解梯度
  8. 电脑桌面下栏和计算机里面全黑,电脑桌面下面菜单栏变黑条了,为什么?
  9. 原生小说APP源码,可二次开发,小说阅读,四端互通:android端,ios端,h5端,公众号端
  10. 论文阅读《LSD-SLAM: Large-Scale Direct Monocular SLAM》