SPSS的中分层聚类法的实际应用详解
IBM SPSS Statistics中的分层聚类法,也称作系统聚类法,是按照度量数据距离的远近,对预先设定的分类范围进行聚类的分析方法。其优点是可设定分类的范围、可处理分类变量与连续变量、可选择的数据距离计算方法多等。
但需要注意的是,分层聚类法无法同时处理两种变量类型,即单次分析只能在同一种变量类型中进行。接下来,我们通过实例具体演示下操作方法。
一、数据准备
本文使用到的是一组包含连续变量(销售额、销售量等)与分类变量(店铺类型、星级等)的店铺数据。
图1:店铺数据
二、系统聚类参数设置
如图2所示,依次打开SPSS的分类-系统聚类分析。
图2:系统聚类
如图3所示,SPSS的系统聚类可进行个案与变量的聚类分析。本例选择个案的系统聚类分析。
图3:设置面板
系统聚类单次只可分析一种变量类型,如图4所示,本例进行的是客流量、销售额、销售量的连续型变量系统聚类分析,以账号作为标注依据。
图4:变量设置
在统计设置中,如图5所示,勾选“解的范围”,并将范围设定为2-5。
图5:统计设置
在图设置中,勾选“谱系图”选项,以观察聚类的过程。
图6:图设置
在计算方法中,根据连续变量使用欧氏距离法,分类变量使用计数型卡方测量法的原则,设置区间的平方欧式距离法。
图7:方法设置
最后,在保存设置中,保存“解的范围”,以在数据表中生成解范围的新变量。
图8:解的范围
三、结果解读
运行分析后,返回到数据集,如图9所示,在原数据集的末端生成了新的变量,分别展示的是解在2-5范围时,个案所属的聚类。
图9:生成新变量
本次系统聚类分析了23个个案,从集中计划表看到,在第5阶段,15与16聚合为一类,15在第4个阶段中出现了,16则是第一次出现,因此在聚类中分别记为“4”与“0”。
在进行22个阶段后,所有个案完成聚类。
图10:集中计划
如图11所示,在谱系图中画红色竖线并向左观察,可将个案分为三大类。当然,也可以移动红色竖线,将个案分为两大类、四大类、五大类,并观察其个案的组成。
图11:谱系图
四、小结
综上所述,SPSS分层聚类分析可进行连续型与分类型变量的聚类分析,并设定解的范围,使得数据在预设的范围内进行聚类。
但另一方面来说,分层聚类主要是依靠图形,如谱系图进行聚类结果的输出,因此,如果个案数目过大,将不利于结果的观察。
SPSS的中分层聚类法的实际应用详解相关推荐
- PX4飞控中利用EKF估计姿态角代码详解
PX4飞控中利用EKF估计姿态角代码详解 PX4飞控中主要用EKF算法来估计飞行器三轴姿态角,具体c文件在px4\Firmware\src\modules\attitude_estimator_ekf ...
- dijkstra标号法表格_标号法求最短路径例题详解.ppt
标号法求最短路径例题详解 r * 最短路径 带权图G=, 其中w:E?R. ?e?E, w(e)称作e的权. e=(vi,vj), 记w(e)=wij . 若vi,vj不 相邻, 记wij =?. 设 ...
- Matlab中的FCM算法代码及中文详解
Matlab中的FCM算法代码及中文详解 转自:http://xiaozu.renren.com/xiaozu/106512/336681453 function [center, U, obj_fc ...
- 数学建模二:TOPSIS法(优劣解距离法) 附代码详解
数学建模二:TOPSIS法(优劣解距离法)附代码详解 TOPSIS法(优劣解距离法)用于评价类问题. 层次分析法因为受限于一致性检验指标的数量,最多只能选择15个准则或方案.同时层次分析法也难以处理已 ...
- 【整理】串口(RS232/RS485等)通讯中RTS/CTS,DTR/DSR的含义详解
[整理]串口(RS232/RS485等)通讯中RTS/CTS,DTR/DSR的含义详解 RS232 crifan 7年前 (2013-10-17) 14942浏览 0评论 [背景] 之前就折腾过很多关 ...
- matlab中存档算法代码,Matlab中的FCM算法代码及中文详解
Matlab中的FCM算法代码及中文详解 转自:http://xiaozu.renren.com/xiaozu/106512/336681453 function [center, U, obj_fc ...
- 站长在线Python精讲:在Python中格式化字符串的两种方法详解
欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<在Python中格式化字符串的两种方法详解>.本知识点主要内容有:使用%操作符格式化字符串和使用format()方法格式化字 ...
- oracle中的exists 和 not exists 用法详解
from:http://blog.sina.com.cn/s/blog_601d1ce30100cyrb.html oracle中的exists 和 not exists 用法详解 (2009-05- ...
- R语言中如何计算C-Statistics?几种计算方法详解
R语言中如何计算C-Statistics?几种计算方法详解 目录 R语言中如何计算C-Statistics? #包导入 #数据加载编码
- python中的class怎么用_对python 中class与变量的使用方法详解
python中的变量定义是很灵活的,很容易搞混淆,特别是对于class的变量的定义,如何定义使用类里的变量是我们维护代码和保证代码稳定性的关键. #!/usr/bin/python #encoding ...
最新文章
- 【arduino】继续蜂鸣器音乐播放,arduinoIDE里调用音乐播放库
- 安卓机更新系统会卡吗_iOS13.3系统值得更新吗?信号怎么样?续航改善了没有?...
- 连锁商店 状态压缩dp(女赛)
- 软件测试课程学习总结
- win2008 查询 tcp连接失败_TCP详解(转)
- 【Antlr】rule expr: must label all alternatives or none
- Python 数据结构与算法——选择排序(迭代版、递归版)
- RJ-45接口信号定义
- 升级ubuntu后EMACS 无法使用
- Keil 使用教程(详解)
- eeupdate 更新MAC地址
- iphone与计算机连接,苹果usb怎么与电脑连接_苹果怎么设置与电脑连接的图文步骤...
- 西北农林科技大学计算机导师,信息工程学院-西北农林科技大学
- express+socket.io 共享session
- 一篇文章搞懂php文件系统基本操作
- OpenFOAM-v2006重叠网格挖洞问题研究以及overset代码解析(二)PATCH是什么类型的patch?
- HDU2604Queuing
- 匕年级下册计算机计划,七年级下学期班主任工作计划
- 华为手机便捷好用的原因,终于被我找到了
- https://blog.csdn.net/codezjx/article/details/8872090