SPSS聚类分析——一个案例演示聚类分析全过程

摘要: 案例数据源: 有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS for Windows 统计分析》

案例数据源:

有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS for Windows 统计分析》data11-03。点击下载

【一】问题一:选择那些变量进行聚类?——采用“R型聚类”

1、现在我们有4个变量用来对啤酒分类,是否有必要将4个变量都纳入作为分类变量呢?热量、钠含量、酒精含量这3个指标是要通过化验员的辛苦努力来测定,而且还有花费不少成本,如果都纳入分析的话,岂不太麻烦太浪费?所以,有必要对4个变量进行降维处理,这里采用spss R型聚类(变量聚类),对4个变量进行降维处理。输出“相似性矩阵”有助于我们理解降维的过程。

2、4个分类变量量纲各自不同,这一次我们先确定用相似性来测度,度量标准选用pearson系数,聚类方法选最远元素,此时,涉及到相关,4个变量可不用标准化处理,将来的相似性矩阵里的数字为相关系数。若果有某两个变量的相关系数接近1或-1,说明两个变量可互相替代。

3、只输出“树状图”就可以了,个人觉得冰柱图很复杂,看起来没有树状图清晰明了。从proximity matrix表中可以看出热量和酒精含量两个变量相关系数0.903,最大,二者选其一即可,没有必要都作为聚类变量,导致成本增加。至于热量和酒精含量选择哪一个作为典型指标来代替原来的两个变量,可以根据专业知识或测定的难易程度决定。(与因子分析不同,是完全踢掉其中一个变量以达到降维的目的。)这里选用酒精含量,至此,确定出用于聚类的变量为:酒精含量,钠含量,价格。

【二】问题二:20中啤酒能分为几类?——采用“Q型聚类”

1、现在开始对20中啤酒进行聚类。开始不确定应该分为几类,暂时用一个3-5类范围来试探。Q型聚类要求量纲相同,所以我们需要对数据标准化,这一回用欧式距离平方进行测度。

2、主要通过树状图和冰柱图来理解类别。最终是分为4类还是3类,这是个复杂的过程,需要专业知识和最初的目的来识别。我这里试着确定分为4类。选择“保存”,则在数据区域内会自动生成聚类结果。

【三】问题三:用于聚类的变量对聚类过程、结果又贡献么,有用么?——采用“单因素方差分析”

1、聚类分析除了对类别的确定需讨论外,还有一个比较关键的问题就是分类变量到底对聚类有没有作用有没有贡献,如果有个别变量对分类没有作用的话,应该剔除。

2、这个过程一般用单因素方差分析来判断。注意此时,因子变量选择聚为4类的结果,而将三个聚类变量作为因变量处理。方差分析结果显示,三个聚类变量sig值均极显著,我们用于分类的3个变量对分类有作用,可以使用,作为聚类变量是比较合理的。

【四】问题四:聚类结果的解释?——采用”均值比较描述统计“

1、聚类分析最后一步,也是最为困难的就是对分出的各类进行定义解释,描述各类的特征,即各类别特征描述。这需要专业知识作为基础并结合分析目的才能得出。

2、我们可以采用spss的means均值比较过程,或者excel的透视表功能对各类的各个指标进行描述。其中,report报表用于描述聚类结果。对各类指标的比较来初步定义类别,主要根据专业知识来判定。这里到此为止。

以上过程涉及到spss层次聚类中的Q型聚类和R型聚类,单因素方差分析,means过程等,是一个很不错的多种分析方法联合使用的案例。数据源和部分介绍均摘自《SPSS for Windows 统计分析》书中。

SPSS聚类分析——一个案例演示聚类分析全过程相关推荐

  1. 数据挖掘时功能和一个聚类分析应用案例

    数据挖掘时功能和一个聚类分析应用案例 数据挖掘的常用方法和数据挖掘的重要功能(出自MBA智库百科).当然,横看成岭侧成峰,这些常用方法和重要功能也许并不完全正确或完整.除此以外,笔者尝试学习了SMAR ...

  2. SPSS聚类分析:K均值聚类分析

    SPSS聚类分析:K均值聚类分析 一.概念:(分析-分类-K均值聚类) 1.此过程使用可以处理大量个案的算法,根据选定的特征尝试对相对均一的个案组进行标识.不过,该算法要求您指定聚类的个数.如果知道, ...

  3. 2021年大数据Flink(二十三):​​​​​​​Watermaker案例演示

    目录 Watermaker案例演示 需求 API 代码实现-1-开发版-掌握 代码实现-2-验证版-了解 Watermaker案例演示 需求 有订单数据,格式为: (订单ID,用户ID,时间戳/事件时 ...

  4. javascript案例_如何在JavaScript中使用增强现实-一个案例研究

    javascript案例 by Apurav Chauhan 通过Apurav Chauhan 如何在JavaScript中使用增强现实-一个案例研究 (How to use Augmented Re ...

  5. 用两个使用Caffe的小项目案例演示迁移学习的实用性

    近年来随着深度学习的急剧升温,不管是学术界还是工业界都把大量资源投入了深度学习.作为一个普通的工程师或者程序员,也想对机器学习,尤其是深度学习有所了解,应当如何入手?最好的回答当然是"get ...

  6. Nginx跨域问题的案例演示

    跨域问题的案例演示 出现跨域问题会有什么效果?,接下来通过一个需求来给大家演示下: (1)nginx的html目录下新建一个a.html <html><head><met ...

  7. 【原创 HadoopSpark 动手实践 6】Spark 编程实例与案例演示

     [原创 Hadoop&Spark 动手实践 6]Spark 编程实例与案例演示 Spark 编程实例和简易电影分析系统的编写 目标: 1. 掌握理论:了解Spark编程的理论基础 2. 搭建 ...

  8. 学校计算机教学演示,案例演示在计算机基础教学中的运用

    随着电脑的普及,计算机基础教学也在逐步地发展,教学方法和教学理念也日趋完善.由于计算机基础是一门比较强调动手能力和实用性的学科,它要求学生能自己动手操作,那么案例演示这种教学方法就比较适用于计算机基础 ...

  9. flink sql udf jar包_Flink 生态:一个案例快速上手 PyFlink

    简介: Flink 从 1.9.0 版本开始增加了对 Python 的支持(PyFlink),在刚刚发布的 Flink 1.10 中,PyFlink 添加了对 Python UDFs 的支持,现在可以 ...

  10. 软件工程六大设计原则总结,案例演示

    本文源码:GitHub·点这里 || GitEE·点这里 文章目录 一.单一职责原则 二.接口隔离原则 三.依赖倒转原则 四.里氏替换原则 五.开闭原则 六.迪米特原则 七.设计原则总结 八.源代码地 ...

最新文章

  1. matlab 通过矩阵变换使图像旋转平移_数字图像处理|P11 第三章 第四节 图像的几何变换...
  2. C#读写xml文件最简单方法(操作配置文件)
  3. java构造函数的重载_java初学者对构造方法和重载的理解
  4. 程序员工资虽高,但日子过得....
  5. poj1036GangstersDP
  6. 为什么优秀的程序员也是优秀的设计师
  7. KVM 介绍(8):使用 libvirt 迁移 QEMU/KVM 虚机和 Nova 虚机 [Nova Libvirt QEMU/KVM Live Migration]
  8. PHP根据配置设置可变变量
  9. java解析字符串_java 拼接字符和解析字符串
  10. pcb天线和纯铜天线_各种PCB板载天线以及PCB设计的要点是什么
  11. [Power--IC]电源管理IC-STNS01
  12. 【Unity】AvProVideo 实现当前视频播放完毕自动加载下一视频
  13. cesium polygon添加边界线不起作用
  14. 使用unity制作的一款生存类游戏demo(一)
  15. 如何解决oracle中文乱码问题,oracle中解决中文乱码问题
  16. 高德地图3D轨迹回放 + 视野跟随功能
  17. Win10 VC++运行库集合|VC++ 2005 2008 2010 2012 2015
  18. 华为裁员1100人!任正非痛批管理层:这种领导鼠目寸光
  19. 十年总结(15):产品化-有心杀敌,无力回天
  20. UnityShader---SurfaceShader(模板和各种效果实现:边缘自发光、火焰流动、燃烧、法线扭曲、简单模糊、消融、区域过度、雪效果等)---17

热门文章

  1. Ubuntu 链接ln的使用:创建和删除符号链接
  2. 区分LJMP、AJMP、SJMP、JMP指令
  3. 泛函分析笔记08:有界线性算子和泛函介绍与共鸣定理
  4. 3、ARM嵌入式系统:按键 初始化
  5. php混淆解密,关于php混淆加密解密详解
  6. python课程设计实验报告-python课程设计
  7. hex2000使用方法
  8. (三)基于Phyphox的三线摆法测量物体转动惯量
  9. ubuntu使用命令粉碎文件
  10. 【软测面试】找工作前的准备|面试题