列联表分析(Crosstabs)

列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。

例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为 15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。

山东烟台历年观测数据分级表()

年份

59

60

61

62

63

64

65

66

67

69

70

71

72

73

74

75

76

77

y

1

3

1

1

3

1

1

2

1

3

2

1

2

2

3

2

2

1

x1

3

2

2

3

1

3

2

3

3

1

2

3

1

1

1

2

2

1

x2

1

2

3

1

1

2

2

1

1

1

1

2

3

1

1

1

1

2

x3

3

1

1

3

1

2

1

3

2

2

1

2

1

2

3

2

3

1

x4

3

1

1

1

1

1

1

1

1

1

3

1

1

2

1

1

1

1

注:摘自《农业病虫统计测报》 131页。

1) 输入分析数据

在数据编辑器窗口打开“data1-3.sav”数据文件。

数据文件中变量格式如下:

2) 调用分析过程

在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图

3) 设置分析变量

选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变量选入“Rows:”行变量框中。

选择列变量:将“玉米螟卵高峰发生期[y]”变量选入 “Columns:”列变量框中。

4) 输出条形图和频数分布表

Display clustered bar charts: 选中显示复式条形图。

Suppress table: 选中则不输出多维频数分布表。。

5) 统计量输出

点击“Statistics”按钮,弹出统计分析对话框(如下图)。

Chi-Square: 卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验

(Continuity Correction)及Fisher精确概率检验(Fisher’s Exact test)的结果。

Correlations: 选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。

Nominal:两分类变量的关联度(Association)测量

Contingency Coefficient: 列联系数,其值越大关联性越强。

Phi and Cramer’s V:Cramer列联系数,其值越大关联性越强。

Lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。

Uncertainty Coefficient: 不定系数

Ordinal:两有序分类变量(等级变量)的关联度测量

Gamma: 关联度,+1表示完全正关联,-1表示负关联,0表示无联。

Somers’d:列联度,其取值范围和意义同上。

Kendall’s tau-b:

Nominal by Interval:一个定性变量和一个定量变量的关联度

Eta:关联度统计量。

Kappa:吻合度系数,其取值-1至+1,其值越大吻合程度越高。

Risk:危险度分析。

McNemar:配对计数资料的卡方检验。

Cochran’s and Mantel-Haenszel statistics: 检验在协变量存在下,两个二分类变量是否独立。

6) 设置列联表的显示

单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。

Counts:频数

Observed: 观测频数。

Expected: 期望频数。

Percentages:百分比

Row: 占本行的百分比。

Column: 占本列的百分比。

Total: 占全部的百分比。

Residuals:残差分析

Unstandardized: 非标准化残差分析。

Standardized: 标准化残差分析。

Adj. Standardized: 调整的标准化残差分析。

Noninteger Weights:

⊙ Round cell counts: 临近列计算。

○ Truncate cell counts:。

○ Round case Weights临近记录度量

○ Truncate case Weights

○ No adjustments: 不调整。

7)设置输出格式

单击Format按钮,弹出列联表输出格式对话框(如下图)。

Row Order:频数

⊙ Ascending: 行变量从小到大升序排列。

○ Descending: 行变量从大到小降序排列。

8)设置检验

单击“Exact”按钮,弹出精确检验对话框(如下图)。

⊙Asymptotic only 近似的,系统设置。

○Monte Carlo

Confidence level: 99% 置信度,系统默认99%。

Number of samples: 10000 样本数量,系统默认10000。

○Exact

Time limit per test: 5 minutes 限时检验时间,系统默认值5分钟。

9)提交执行

设置完成后,在列联表分析对话框中,点击OK 按钮,计算结果输出在结果窗口中。

10)结果与分析

在结果窗口中查看计算结果,主要输出内容如下。

五月气温*玉米螟卵高峰发生期

Crosstab

玉米螟卵高峰发生期

Total

6月20日前

6月21-25日

6月25日以后

五月气温

16.5以下

Count(频数)

Expected Count(期望值)

1

2.7

2

2.0

3

1.3

6

6.0

16.6-17.8

Count(频数)

Expected Count(期望值)

2

2.7

3

2.0

1

1.3

6

6.0

17.8以上

Count(频数)

Expected Count(期望值)

5

2.7

1

2.0

0

1.3

6

6.0

Total

Count(频数)

Expected Count

8

8.0

6

6.0

4

4.0

18

18.0

Chi-Square Tests

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

皮尔森卡方检验

7.750(a)

4

.101

Likelihood Ratio

似然比卡方检验

8.510

4

.075

Linear-by-Linear Association

6.248

1

.012

N of Valid Cases

18

a 9 cells (100.0%) have expected count less than 5. The minimum expected count is 1.33.

(其余的省约)

结果分析:

从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上出现的频数大于期望值(5>2.7,3>2.0,3>1.3)。

从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验(Linear-by-Linear Association),双尾检验p<0.012。

因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。

皮尔森残差_用SPSS进行列联表分析(Crosstabs)实例相关推荐

  1. 皮尔森残差_线性回归的假设和pearson相关系数的假设

    pearson相关系数是最经常使用的相关系数,一般情况下我们会毫不犹豫的选择它,而大部分情况下都没有考虑到数据是否符合它的假设,如下所示: 1 两个变量间有线性关系 2 变量是连续变量 3 变量均符合 ...

  2. 【SPSS】列联表分析详细操作教程(附案例实战)

  3. 实体词典 情感词典_基于词典的情感分析——简单实例

    基于词典的情感分析方法非常容易被理解,主要利用情感词判断一句话或者一篇文章的情感倾向,下面的程序利用BosonNLP情感词典(从https://bosonnlp.com/dev/resource 下载 ...

  4. python 卡方检验批量筛选_用python和Excel进行列联表分析(卡方检验)

    用python和Excel进行列联表分析 卡方检验回顾(独立性检验) 行(\(r_i\))列(\(c_j\)) \(j=1\) \(j=2\) \(\cdots\) 合计 \(i=1\) \(f_{1 ...

  5. spss相关性分析看结果_利用spss做Pearson相关性分析步骤详解

    有蛮多的学生私信老徐问如何利用spss做相关性分析,其实相关性分析应该是spss分析中较为基础的一个功能应用,很多学生可能是因为跨专业或者对统计软件了解较少,在没有经过系统学习的前提下,感觉云里雾里. ...

  6. 怎么用spss做冗余分析_用SPSS进行医学统计信度分析——【杏花开医学统计】

    杏花开生物医药统计 一号在手,统计无忧! 关 注 用SPSS进行医学统计信度分析 关键词:SPSS.信度分析 导 读 上期,我们介绍了量表的基本形式及其研制步骤. 点击观看:<医学研究中量表研制 ...

  7. r语言聚类分析_「SPSS数据分析」SPSS聚类分析(R型聚类)的软件操作与结果解读...

    ​ 在上一讲中,我们讲述了针对样本进行聚类的分析方法-Q型聚类.今天我们将详细讲解针对变量数据进行的聚类分析--系统聚类之R型聚类. 我们要将数据变量进行聚类,但不知道要分成几类,或者没有明确的分类指 ...

  8. varclus变量聚类对变量有啥要求_「SPSS数据分析」SPSS聚类分析(K-均值聚类)软件操作结果解读...

    ​ 上一期我们讲到了SPSS聚类分析中的系统聚类.无论是系统聚类中的Q型聚类还是R型聚类,都是一种探索的聚类分析,就是我们没有明确要将目标划分为几类,只是想探索可以分为几类,根据探索出来的结果再来决定 ...

  9. 如何应用SPSS的频率分析,分析数值分布规律

    IBM SPSS Statistics的频率分析是描述统计的一种分析方法,可用于描述多种类型变量的统计数值,其中包含了定性与定量变量,同时也提供了多种图形显示,如条形图.直方图等,用于数据的可视化呈现 ...

  10. spss交叉表分析 + SPSS卡方检验

    spss中交叉分析主要用来检验两个变量之间是否存在关系,或者说是否独立,其零假设为两个变量之间没有关系.在实际工作中,经常用交叉表来分析比例是否相等.例如分析不同的性别对不同的报纸的选择有什么不同. ...

最新文章

  1. Android中的ImageView的getDrawableCache获取背景图片的时候注意的问题
  2. 汇编的8种寻址方式,以及2个默认段寄存器
  3. Qt之QHeaderView排序
  4. python三种基本控制结构_Python学习手册之控制结构(一)
  5. SAP 电商云 Spartacus UI quick order 搜索结果的索引设置实现
  6. Python 列表List - Python零基础入门教程
  7. oracle 慕课课程_我在慕课网学习到的oracle
  8. 【白皮书分享】快手私域经营白皮书.pdf(附下载链接)
  9. Android内核开发:从源码树中删除出厂的app应用
  10. 数据库备份工具mysqldump重要参数详解
  11. UWP 如何阻止WebView自动打开浏览器?
  12. 软件插件安装激活教程以及密钥
  13. 什么是DOM0,DOM2,DOM3?
  14. 【数据库和SQL学习笔记】6.SELECT查询4:嵌套查询、对查询结果进行操作
  15. uni-app ios 苹果真机或安卓机运行
  16. 微信小程序+.NET(十一) 小程序之小说阅读器实现
  17. 【VBA编程】VBA基础语法(二)
  18. 【Linux】常见命令总结
  19. echart 图表类型
  20. 前端埋点设计/小程序+友盟埋点方案

热门文章

  1. 活动分区恢复为不活动分区的步骤
  2. 2021年4月11日-粤嵌智能小车兴趣课笔记(3)
  3. 虚幻4英雄联盟模型分享——荆棘之刺婕拉
  4. 微擎修复去水印微信小程序源码
  5. 如何将 Excel 数据分组后按次序横向排列
  6. linux隔离磁盘坏道,Repartion Bad Drive(硬盘坏道隔离工具
  7. 如何把一张照片的像素提高_简单操作,让一张模糊的照片秒变清晰
  8. 手机无线可以上网 电脑却没网络连接服务器,电脑连接手机热点不能上网怎么办 值得一看...
  9. 电脑开启热点手机显示不可上网
  10. matlab的方法定义变量,Matlab定义变量怎么操作?定义变量方法介绍