大家好啊!最近SPSSAU后台有很多小伙伴留言提问,其中有两个问题:

其实上面的问题,主要是想要研究定类数据和定类数据之间的差异关系,而不是相关性的分析,我们进行数据研究,就是想要挖掘数据间的信息和价值,看清数据间的关系。数据间的关系可以分为三类关系,差异关系、相关关系、其它关系。

其中差异关系和相关关系有时候会被搞混,它们是不同的,区别是:

差异研究的目的在于比较两组数据或多组数据之间的差异。差异关系中的差异是指不同样本组的某个指标的差异,例如男生和女生的智力差异,涉及到了变量的分组;相关分析是两个变量之间的关系,和样本分组无关,例如智力和学习成绩是否相关。

今天这篇文章总结几个常用的差异性分析的方法,分享怎么简单选择出合适的分析方法。

一、

实际研究中有三种常见的差异性分析方法:T检验、方差分析、卡方检验。三个方法的区别如下表:

其实核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用卡方分析;如果是定类和定量,此时应该使用方差或者T检验。

方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。

二、

上面三种方法还可以细分:

01 T检验

T检验共分为三种方法,分别是独立样本T检验,配对样本T检验和单样本T检验。

独立样本T检验和单因素方差分析功能上基本一致,但是独立样本T检验只能比较两组选项的差异,比如男性和女性。

相对来讲,独立样本T检验在实验比较时使用频率更高,尤其是生物、医学相关领域。针对问卷研究,如果比较的类别为两组,独立样本T检验和单因素方差分析均可实现,研究者自行选择使用即可。

独立样本T检验和配对样本T检验功能上都是比较差异,而且均是比较两个组别差异。但二者有着实质性区别,如果是比较不同性别,婚姻状况(已婚和未婚)样本对某变量的差异时,应该使用独立样本T检验。如果比较组别之间有配对关系时,只能使用配对样本T检验,配对关系是指类似实验组和对照组的这类关系。另外独立样本T检验两组样本个数可以不相等,而配对样本T检验的两组样本量需要完全相等。

T检验的第三种分析方法为单样本T检验。单样本T检验是比较某个题项的平均得分是否与某数字(例子是与3进行对比)有着明显的差异,如果呈现出显著性差异,即说明明显该题项平均打分明显不等于3分。此分析方法在问卷研究中较少使用,平均得分是否明显不为3分可以很直观的看出,而不需要单独进行检验分析。

02 方差分析

根据X的不同,方差分析又可以进行细分。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差

03卡方检验

卡方检验用于分析定类数据与定类数据之间的关系情况。例如研究人员想知道两组学生对于手机品牌的偏好差异情况,则应该使用卡方分析。卡方是通过分析不同类别数据的相对选择频数和占比情况,进而进行差异判断,单选题或多选题均可以使用卡方分析进行对比差异分析。

卡方拟合优度检验用于研究实际比例情况,是否与预期比例表现一致,它只针对于类别数据。比如总共收集100份数据,其中男性为48个,女性为52个;在收集数据之前预期男女比例应该是4:6 (40%为男性,60%为女性),分析预期的比例是否与实际的比例有着明显的差异性,则可以使用卡方拟合优度检验。

三、

SPSSAU进行差异性分析的操作也很容易,具体怎么用?这里以卡方检验的一个例子作为说明:

研究者希望研究化妆情况(全妆,淡妆,不化妆)与外出情况(出,不出)之间的差异性,调查了100个样本。化妆情况和外出情况都是定类变量,这里使用卡方检验分析方法。

首先,整理数据为加权格式上传到SPSSAU中:

接着,简单三步完成分析操作:

得出分析结果表格:

同时提供智能文字分析:

可视化:

便于研究者深入分析还提供卡方检验统计量过程值表格和效应量指标表格:

自动生成卡方检验的多重比较结果:

要做差异性分析,如何选择正确的统计方法?相关推荐

  1. 软件部署更新:选择正确的更新方法

    在某些情况下,您选择的更新方法由您为应用程序选择的部署方法限定.但是,最适当的方法通常由您要部署的更新的性质决定.例如,您可能只是复制新文件以覆盖 旧文件,或者您可能希望更新的应用程序与旧应用程序并列 ...

  2. 样本量对差异性分析(Anova)或者T 检验的影响

    样本量大的时候做差异性分析容易得到有显著性差异的结论,原因如下图, 求p值的过程中,n越大,Z0也越大,相对应的p就小了.当然这里默认方差变化不大的情况下,因为一般来说很多数据经过平均后方差不会变化很 ...

  3. 普中F28335GPIO正确的初始化方法(由LED、继电器总结)

    文章目录 前言 1. GPIO正确的初始化方法 1.1 LED初始化出现的问题 1.2 原因分析 1.3 正确的初始化方法 1.4 总结 2. 继电器的初始化 总结 前言 前面介绍了GPIO的内部结构 ...

  4. 差异性分析该如何选择?

    最近小编收到最多的问题就是想做差异分析,应该选择那种分析方法?数据之间的关系一般分为四种:差异关系.相关关系.影响关系以及其它关系. 一.说明 差异研究的目的在于比较两组数据或多组数据之间的差异.差异 ...

  5. edger多组差异性分析_【step by step】菜鸟学TCGA(4)-用edgeR做差异表达分析

    大家好,工作太忙,太久没有更新了,哎,泪-- 有的同学问我要代码,有的发了,后面的还没有发,一个一个发好累啊,大家有建议吗? 感觉某宝的这个课程也不贵,300多,有经济能力的小伙伴可以自己买,学得快些 ...

  6. 教程 | 算法太多挑花眼?教你如何选择正确的机器学习算法

    选自Hackernoon 作者:Rajat Harlalka 机器之心编译 机器学习算法虽多,却没有什么普适的解决方案.决策树.随机森林.朴素贝叶斯.深度网络等等等等,是不是有时候觉得挑花了眼呢?福利 ...

  7. ecshop 搜索热词推荐_拼多多搜索推广实操——如何选择正确的关键词实现高投产!...

    原标题:拼多多搜索推广实操--如何选择正确的关键词实现高投产! 大家好我是拼多多运营林枫,每天都会更新新的内容哦,没关注的记得关注一下哦! 今天和大家讲讲搜索推广怎么正确选择有效的关键词,很多商家可能 ...

  8. 算法太多挑花眼?教你如何选择正确的机器学习算法

    选自Hackernoon,作者:Rajat Harlalka,机器之心编译. 机器学习算法虽多,却没有什么普适的解决方案.决策树.随机森林.朴素贝叶斯.深度网络等等等等,是不是有时候觉得挑花了眼呢?福 ...

  9. 用python做舆情分析系统_如何用Python做舆情时间序列可视化?

    如何批量处理评论信息情感分析,并且在时间轴上可视化呈现?舆情分析并不难,让我们用Python来实现它吧. 痛点 你是一家连锁火锅店的区域经理,很注重顾客对餐厅的评价.从前,你苦恼的是顾客不爱写评价.最 ...

最新文章

  1. SQL2005禁用和启用索引
  2. Springboot、Mybatis 事务示例
  3. 基于TLD2331完成动态LED显示驱动
  4. java关键字和保留字整合(不定期补充) 转自小码哥
  5. c多线程并发处理方式_ElasticSearch 并发的处理方式:锁和版本控制
  6. [无向图割点] PKU 1523 SPF
  7. 实战01_SSM整合ActiveMQ支持多种类型消息
  8. 电脑怎么卸载软件干净_不要说你的电脑卸载很干净!分享两款卸载神器!
  9. 如何免费注册使用虚拟主机和二级域名建站
  10. python seo 外链_百度链接提交-主动推送程序Python版
  11. 《现代前端技术解析》第七章读书笔记
  12. OpenCR介绍以及自制OpenCR
  13. curry化 js_JS手动实现柯里化(curry)函数
  14. Simple Contrastive Representation Adversarial Learning for NLP Tasks
  15. 通过安卓手机,获取微信小程序包进行反编译方法
  16. **Javase 重要知识点总结 day08
  17. Redis数据莫名其妙全部丢失
  18. webkit笑傲江湖,悲乎?乐乎?
  19. 后互联网:无聊已死、社交危机、故事崛起
  20. enterprise linux 5 图形化登录,配置XManager5连接Linux图形化界面详解

热门文章

  1. jquery-weui扩展功能Picker实现营业时间选择
  2. Zeus: Uber 开发的分布式的高扩展 Shuffle 服务组件
  3. linux下的mkfifo 命令
  4. linux 驱动 device,driver ,bus 关系
  5. nyoj 3 多边形重心问题
  6. 为什么“公有云”在中国落地那么难?
  7. 做网站注意事项,网站建设标准流程
  8. Pytorch 学习率衰减 之 余弦退火与余弦warmup 自定义学习率衰减scheduler
  9. python调用微信客户端_用Python编写的简化版微信客户端
  10. Camera Tuning 常见缩写