IBM SPSS Statistics中的分层聚类法,也称作系统聚类法,是按照度量数据距离的远近,对预先设定的分类范围进行聚类的分析方法。其优点是可设定分类的范围、可处理分类变量与连续变量、可选择的数据距离计算方法多等。

但需要注意的是,分层聚类法无法同时处理两种变量类型,即单次分析只能在同一种变量类型中进行。接下来,我们通过实例具体演示下操作方法。

一、数据准备

本文使用到的是一组包含连续变量(销售额、销售量等)与分类变量(店铺类型、星级等)的店铺数据。

图1:店铺数据

二、系统聚类参数设置

如图2所示,依次打开SPSS的分类-系统聚类分析。

图2:系统聚类

如图3所示,SPSS的系统聚类可进行个案与变量的聚类分析。本例选择个案的系统聚类分析。

图3:设置面板

系统聚类单次只可分析一种变量类型,如图4所示,本例进行的是客流量、销售额、销售量的连续型变量系统聚类分析,以账号作为标注依据。

图4:变量设置

在统计设置中,如图5所示,勾选“解的范围”,并将范围设定为2-5。

图5:统计设置

在图设置中,勾选“谱系图”选项,以观察聚类的过程。

图6:图设置

在计算方法中,根据连续变量使用欧氏距离法,分类变量使用计数型卡方测量法的原则,设置区间的平方欧式距离法。

图7:方法设置

最后,在保存设置中,保存“解的范围”,以在数据表中生成解范围的新变量。

图8:解的范围

三、结果解读

运行分析后,返回到数据集,如图9所示,在原数据集的末端生成了新的变量,分别展示的是解在2-5范围时,个案所属的聚类。

图9:生成新变量

本次系统聚类分析了23个个案,从集中计划表看到,在第5阶段,15与16聚合为一类,15在第4个阶段中出现了,16则是第一次出现,因此在聚类中分别记为“4”与“0”。

在进行22个阶段后,所有个案完成聚类。

图10:集中计划

如图11所示,在谱系图中画红色竖线并向左观察,可将个案分为三大类。当然,也可以移动红色竖线,将个案分为两大类、四大类、五大类,并观察其个案的组成。

图11:谱系图

四、小结

综上所述,SPSS分层聚类分析可进行连续型与分类型变量的聚类分析,并设定解的范围,使得数据在预设的范围内进行聚类。

但另一方面来说,分层聚类主要是依靠图形,如谱系图进行聚类结果的输出,因此,如果个案数目过大,将不利于结果的观察。

SPSS的中分层聚类法的实际应用详解相关推荐

  1. PX4飞控中利用EKF估计姿态角代码详解

    PX4飞控中利用EKF估计姿态角代码详解 PX4飞控中主要用EKF算法来估计飞行器三轴姿态角,具体c文件在px4\Firmware\src\modules\attitude_estimator_ekf ...

  2. dijkstra标号法表格_标号法求最短路径例题详解.ppt

    标号法求最短路径例题详解 r * 最短路径 带权图G=, 其中w:E?R. ?e?E, w(e)称作e的权. e=(vi,vj), 记w(e)=wij . 若vi,vj不 相邻, 记wij =?. 设 ...

  3. Matlab中的FCM算法代码及中文详解

    Matlab中的FCM算法代码及中文详解 转自:http://xiaozu.renren.com/xiaozu/106512/336681453 function [center, U, obj_fc ...

  4. 数学建模二:TOPSIS法(优劣解距离法) 附代码详解

    数学建模二:TOPSIS法(优劣解距离法)附代码详解 TOPSIS法(优劣解距离法)用于评价类问题. 层次分析法因为受限于一致性检验指标的数量,最多只能选择15个准则或方案.同时层次分析法也难以处理已 ...

  5. 【整理】串口(RS232/RS485等)通讯中RTS/CTS,DTR/DSR的含义详解

    [整理]串口(RS232/RS485等)通讯中RTS/CTS,DTR/DSR的含义详解 RS232 crifan 7年前 (2013-10-17) 14942浏览 0评论 [背景] 之前就折腾过很多关 ...

  6. matlab中存档算法代码,Matlab中的FCM算法代码及中文详解

    Matlab中的FCM算法代码及中文详解 转自:http://xiaozu.renren.com/xiaozu/106512/336681453 function [center, U, obj_fc ...

  7. 站长在线Python精讲:在Python中格式化字符串的两种方法详解

    欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是<在Python中格式化字符串的两种方法详解>.本知识点主要内容有:使用%操作符格式化字符串和使用format()方法格式化字 ...

  8. oracle中的exists 和 not exists 用法详解

    from:http://blog.sina.com.cn/s/blog_601d1ce30100cyrb.html oracle中的exists 和 not exists 用法详解 (2009-05- ...

  9. R语言中如何计算C-Statistics?几种计算方法详解

    R语言中如何计算C-Statistics?几种计算方法详解 目录 R语言中如何计算C-Statistics? #包导入 #数据加载编码

  10. python中的class怎么用_对python 中class与变量的使用方法详解

    python中的变量定义是很灵活的,很容易搞混淆,特别是对于class的变量的定义,如何定义使用类里的变量是我们维护代码和保证代码稳定性的关键. #!/usr/bin/python #encoding ...

最新文章

  1. 【arduino】继续蜂鸣器音乐播放,arduinoIDE里调用音乐播放库
  2. 安卓机更新系统会卡吗_iOS13.3系统值得更新吗?信号怎么样?续航改善了没有?...
  3. 连锁商店 状态压缩dp(女赛)
  4. 软件测试课程学习总结
  5. win2008 查询 tcp连接失败_TCP详解(转)
  6. 【Antlr】rule expr: must label all alternatives or none
  7. Python 数据结构与算法——选择排序(迭代版、递归版)
  8. RJ-45接口信号定义
  9. 升级ubuntu后EMACS 无法使用
  10. Keil 使用教程(详解)
  11. eeupdate 更新MAC地址
  12. iphone与计算机连接,苹果usb怎么与电脑连接_苹果怎么设置与电脑连接的图文步骤...
  13. 西北农林科技大学计算机导师,信息工程学院-西北农林科技大学
  14. express+socket.io 共享session
  15. 一篇文章搞懂php文件系统基本操作
  16. OpenFOAM-v2006重叠网格挖洞问题研究以及overset代码解析(二)PATCH是什么类型的patch?
  17. HDU2604Queuing
  18. 匕年级下册计算机计划,七年级下学期班主任工作计划
  19. 华为手机便捷好用的原因,终于被我找到了
  20. https://blog.csdn.net/codezjx/article/details/8872090

热门文章

  1. 动态规划解最长公共子串
  2. Linux部署SSM项目
  3. 大型天燃气供应商遭勒索攻击、Log4Shell正在突变|12月15日全球网络安全热点
  4. C++二维vector初始化大小方法
  5. Vue电商后台管理系统功能展示
  6. 在ubuntu20.04下解决:E: 无法定位软件包 mingw32 的问题
  7. php 回显,PHP实时回显 实时输出结果的方法 实时反馈结果到浏览器
  8. PRINCE2认证之项目四大管理步骤
  9. MYSQL 数据库的常用语句
  10. 数据库基本语句(SQL)