文章目录

  • 一、系统(层次)聚类介绍
    • 1.分类准则
    • 2.算法的流程步骤
    • 2.样本与样本之间的距离计算公式
    • 4.类与类之间的距离
    • 5.聚类分析需要注意的问题
  • 二、系统聚类的SPSS实现
  • 三、用图形估计聚类个数
    • 1.原理
    • 2.绘制图形,辅助确定
  • 四、绘制聚类结果图

一、系统(层次)聚类介绍

系统聚类的合并算法通过计算两类数据点间的距离,对最为接近的两类数据点进行组合,并反复迭代这一过程,直到将所有数据点合成一类,并生成聚类谱系图。


1.分类准则

距离近的样本聚为一类

2.算法的流程步骤

  1. 计算n个样本两两之间的距离D
  2. 构建n个类,每个类只包含一个样本
  3. 合并距离最近的两个类为一个新类
  4. 计算新类与当前各类的距离
  5. 重复3、4步骤,直至类的个数变为1
  6. 画聚类图
  7. 决定分类个数和类

2.样本与样本之间的距离计算公式


绝对值距离公式适合于网状道路的距离;欧氏距离公式是Minkowski距离公式的一个特例;一般情况下,除非严格要求是网状道路,其他情况下使用欧氏距离公式即可。


4.类与类之间的距离

  1. 由一个样本组成的类是最基本的类;如果每一个类都是由一个样本组成,那么样本间的距离就是类间距离;
  2. 如果某一类包含不止一个样本,那么就要确定类间距离,类间距离是基于样本间距离定义的;
  3. 类间距离的方法有最短距离、最长距离法、重心法、组间平均连接法和组内平均连接法;
  4. 具体选择哪个定义方法取决于哪个方法对于求解的问题更有效、更具解释力。(使用哪个方法,你能解释清楚,就用哪个方法)

5.聚类分析需要注意的问题

  1. 对于一个实际问题要根据分类的目的来选取指标,指标选取的不同分类结果一般也不同;
  2. 样本间距离定义方式的不同,聚类结果一般也不同;
  3. 聚类方法的不同,聚类结果一般也不同(尤其是样本特别多的时候)。最好能通过各种方法找出其中的共性;
  4. 注意指标的量纲,量纲差别太大会导致聚类结果不合理;
  5. 聚类分析的结果可能不令人满意,数学的处理可能与实际出现差异,但是找到一个合理的解释是必要的。

二、系统聚类的SPSS实现

分析 — 分类 — 系统聚类 — 右移自变量和个案标注依据(目标变量,即因变量)-— 图,勾选谱系图 — 方法 — 选择聚类方法(即类与类距离方法) — 选择区间(即样本与样本之间距离方法)— 标准化,勾选z得分 — 保存,勾选无 — 确认


三、用图形估计聚类个数

1.原理

肘部法则:通过图形大致的估计出最优的聚类数量。
 


2.绘制图形,辅助确定

SPSS — 聚类分析 — 双击进入集中计划 — 复制系数 — Excel — 粘贴(匹配目标格式)— 插入 — 推荐的图表 — 散点图 — 结合图形,选择转折点,决定最优K值


四、绘制聚类结果图

注意:只有当指标个数为2或者3个时候,才能绘制聚类分析的结果图。
 
SPSS — 分析 — 分类 — 系统聚类 — 保存 — 勾选单个解,输入所需聚类数 — 图形 — 图表构造器 — 图库 — 散点图/点图 — 右移变量 — 设置颜色,就是选择原则 — 组/点 ID — 勾选点 ID标签 — 确定
 
双击输出的结果图表,可以进行编辑和美化

浅尝辄止_数学建模(笔记_系统(层次)聚类算法及其SPSS实现)相关推荐

  1. python 两阶段聚类_挑子学习笔记:两步聚类算法(TwoStep Cluster Algorithm)——改进的BIRCH算法...

    转载请标明出处:http://www.cnblogs.com/tiaozistudy/p/twostep_cluster_algorithm.html 两步聚类算法是在SPSS Modeler中使用的 ...

  2. python三次样条插值拟合的树行线_数学建模笔记——插值拟合模型(一)

    啊好像距离上次写作又过了七天,啊好像我之前计划的一周两三篇,啊辣鸡小说毁我青春,啊我是一只可怜的鸽子. 不管怎样,我又回来了,并坚定地更新着hhh.再过两三天就是我们学校数学建模选拔,再过八九天就是期 ...

  3. 图书销量时间序列预测_数学建模_Prophet实现

    图书销量时间序列预测_数学建模_Prophet实现 前言 主要参考 代码 库导入与函数设置 导库 展示函数 取数据函数 训练函数 评估函数 数据预处理 数据集划分 数据分布查看 销售曲线查看 销售预测 ...

  4. 数学建模笔记之一起读论文2019年C题——机场的出租车问题

    数学建模笔记之一起读论文--机场的出租车问题 2021-8-28 全国大学生数学建模竞赛 2019年C题 B站链接--国赛C题真题解析 1 赛题阅读与分析 原题再现: 问题C 机场的出租车问题 大多数 ...

  5. 数学建模第一讲:层次分析法

    数学建模第一讲:层次分析法 笔记大部分由观看[强烈推荐]清风:数学建模算法.编程和写作培训的视频课程整理出: 视频链接:https://www.bilibili.com/video/BV1DW411s ...

  6. 层次聚类算法 算法_聚类算法简介

    层次聚类算法 算法 Take a look at the image below. It's a collection of bugs and creepy-crawlies of different ...

  7. 数学建模笔记——插值拟合模型(二)

    今天是8月21日,距离上次写文章好像将近一个月了--这段时间经历了建模校内选拔赛,考试周,以及与网络小说的斗智斗勇--好吧,其实也没干什么,除了考试就是荒废-- 我最近有在思考一个问题,就是我所关注的 ...

  8. python 凝聚层次聚类_关于层次聚类算法的python实现

    from scipy.cluster import hierarchy 0.层次聚类的概念 层次聚类和k-means一样都是很常用的聚类方法.层次聚类是对群体的划分,最终将样本划分为树状的结构.他的基 ...

  9. 数学建模中常用的十大算法

    数学建模中常用的十大算法 这里,我们将对数学建模中常用的十大算法做一个简单的梳理,并给出一些可以继续学习的参考Blogs 文章目录 数学建模中常用的十大算法 1.蒙特卡罗算法 2.数据拟合.参数估计. ...

  10. 层次聚类算法原理总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 层次聚类(hierarchical clustering)基于簇间 ...

最新文章

  1. 怎样在bug管理上节省时间
  2. 5.7 matlab数据插值与曲线拟合的比较
  3. specgram python
  4. 陈敏敏-130242014024-实验一
  5. 修改mongodb最大查询数_WebFlux系列(十二)MongoDB应用,新增、修改、查询、删除
  6. Mybatis源码之数据源模块分析
  7. CAN总线技术 | 数据链路层02 - 帧结构
  8. 判断玫瑰花数c语言程序设计教程课后答案,编写程序判断某个四位整数是否为玫瑰花数(用自定义函数)...
  9. 167. Two Sum II - Input array is sorted (C, C++, Python)
  10. 在pfSense下设置GoDaddy动态DNS API记录
  11. 杨凌职业技术学院计算机专业宿舍,杨凌职业技术学院宿舍条件怎么样
  12. 【转】snort 笔记2 ----- 规则编写
  13. lua安装教程 linux,Linux 安装 luarocks(lua的模块管理工具)
  14. 学生信息管理系统(SSM+JSP)
  15. html5妇女节游戏,2020三八妇女节趣味游戏大全_妇女节可以举办哪些活动
  16. 2018年安徽批捕涉黑涉恶犯罪2691人
  17. Win11dns解析状态异常怎么处理?Win11dns解析失败解决方法
  18. 机械螺旋缠绕法管道非开挖修复
  19. 有限元分析中的常识(持续更新)
  20. PHPExcel设置页边距 格式 颜色 大小等

热门文章

  1. 什么是Civil3D
  2. 一种文件捆绑型病毒研究
  3. 直流侧电力有源滤波器滤除谐波干扰的原理及方案
  4. 突然讨厌做前端,讨厌代码_如何安全清洁讨厌的游戏控制器
  5. 洛谷 P1911 L国的战斗之排兵布阵
  6. 初学Java简易自助饮品消费系统项目实践
  7. java如何连接与断开SQL server2008数据库
  8. 惠普服务器蓝屏怎么修复,Win10惠普电脑出现蓝屏?解决教程附上
  9. 在Win10中安装Openfoam
  10. Typecho情侣博客Brave主题源码