IBM SPSS Modeler 实验

1、2、“两步”聚类分析实验

接下来,继续进行“两步聚类分析模型”的实验。

(1)          SPSS Modeler 中的“两步”聚类分析方法与 K-Means 聚类分析方法的前四步完全相同。

(2)          进行接入模型。首先,使用“两步”模型进行聚类分析。选中工作区的“类型” 节点,在下面“建模”选项卡中,找到“两步”模型,并双击。在工作区中,即得到一个“两步”模型节点,如图 12所示。

 图 12 工作区中的”两步”模型

(3)          同样,在此采用了默认的设置,因此直接运行。运行完毕之后,就可以在窗口右上侧框中看到“两步”聚类分析模型,右键单击该模型,并选择“浏览”。即可得到如图 13 的聚类分析图。

 图 13 “两步”聚类分析图

(4)          从图 13 中可以发现,“两步”聚类分析得到的是三个类,分类预测字段的重要性也由药类含量、钾含量、血压、钠含量、性别、年龄和胆固醇含量逐渐递减。

3、Kohonen聚类分析实验

Kohonen 聚类分析实验的步骤也比较简单。

(1)          前四步同 K-Means 聚类分析完全相同,即完成数据的导入、生成类型节点等步骤。

(2)          进行接入模型。选中工作区的“类型”节点,在下面“建模”选项卡中,找到“Kohonen” 模型,并双击。在工作区中,即得到一个“Kohonen”模型节点,如图 14 所示。

 图 14 工作区中的“Kohonen”模型

(3)          运行“Kohonen”节点,得到聚类分析模型,如图 15。

 图 15 “Kohonen”聚类分析图

(4)          从表中的数据,可以看到模型将数据分成 9 类。对于分类,字段的重要性如下逐渐递减:药类含量、血压、钾含量、性别、胆固醇含量、钠含量、年龄。其他信息也可以从模型中获得。

4、聚类分析模型

以上,完成三种聚类分析的建模。接下来,利用 K-Means 得到的结果进行模型分析。

(1)           添加 K-Means 模型。选定工作区中的“类型”节点,双击右上侧的“K-Means”  模型,即将 K-Means 模型添加到工作区中。

(2)           查看 K-Means 模型。利用“输出”选项卡中的“表”节点对模型的数据进行查看,如图 1-16。在表中,可以看到每个病人所属的类型,表中最后一列“$KND-K-Means” 是指每一个元素距离类中心的距离,距离越小,表示效果越好。

 图 16 用于查看“K-Means”的表

(3)           采用其他形式查看聚类结果。除了“表”的查看方法外,还可以利用其它的查看方式。在这里,采用“图形”选项卡下的“分布”节点进行展示。选定“K-Means”节点,双击“分布”,即可得到“分布节点”。然后,双击该节点,既可以为图选定字段,如图 17 所示。在这里,将“字段”选为“$KND-K-Means”,颜色选为“Drug”,点击运行。

 图 17 “分布图形”节点编辑窗口

(4)           分析分布图。如图 18 所示,从分布图中可以看到每个聚类所占的比例和个数,以及该类所拥有的药类。

 图 18 “K-Means”聚类分布图

5、直接分析数据

除了对聚类分析模型进行分析外,还可以对源数据直接分析。在这里,使用“图形”选项卡下的“集合”节点对原始数据进行分析。

(1)          添加“集合”节点。选定“DRUG1n”节点,双击“集合”,既可以添加“集合” 节点到工作区中。

(2)          选择分析的字段。在这里,双击“集合”节点,将 “图”选项卡中的“收集” 下拉列表设置为“Na”,“超出”下拉列表设置为“K”,如图 19 所示。

 图 19 “集合”节点编辑窗口

(3)          运行节点流。运行该节点流,既可获得如图 20 的分布图。图中横轴表示“K” 的含量,纵轴表示在横轴上所有拥有“K”含量对应的病人所含有的“Na”含量之和。

 图 20 节点流分布图

IBM SPSS Modeler 【2】 两步聚类相关推荐

  1. IBM SPSS Modeler 【1】 K均值聚类

    一.聚类分析 在数据挖掘中,聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体.聚类分析的目标就是在相似的基础上对数据进行分类. IBM SPSS Modeler 提供了多种聚类分析模型 ...

  2. 非常值得收藏的 IBM SPSS Modeler 算法简介

    IBM SPSS Modeler以图形化的界面.简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学.机器学习.人工智能等方面的分析算法和数据模型,包括如关联.分 ...

  3. python 两阶段聚类_挑子学习笔记:两步聚类算法(TwoStep Cluster Algorithm)——改进的BIRCH算法...

    转载请标明出处:http://www.cnblogs.com/tiaozistudy/p/twostep_cluster_algorithm.html 两步聚类算法是在SPSS Modeler中使用的 ...

  4. java基于聚类的离群点检测_挑子学习笔记:基于两步聚类的离群点检测

    转载请标明出处:http://www.cnblogs.com/tiaozistudy/p/anomaly_detection.html 本文主要针对IBM SPSS Modeler 18.0中离群点检 ...

  5. java基于聚类的离群点检测_基于两步聚类的离群点检测

    转载请标明出处:http://www.cnblogs.com/tiaozistudy/p/anomaly_detection.html 本文主要针对IBM SPSS Modeler 18.0中离群点检 ...

  6. 两步聚类算法+Two Step

    两步聚类算法+Two Step 两步聚类算法是在SPSS Modeler中使用的一种聚类算法,是BIRCH层次聚类算法的改进版本.可以应用于混合属性数据集的聚类,同时加入了自动确定最佳簇数量的机制,使 ...

  7. php 集成 spss,〖SPSS Modeler〗 IBM SPSS Modeler 整合不同数据库之间的数据

    来自IBM DEVELOPERWORKS 简介 由于目前企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理 ...

  8. 《IBM SPSS Modeler数据与文本挖掘实战》之文本挖掘算法

    随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一 ...

  9. IBM SPSS Modeler数据库内建模

    IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza.IBM DB2 InfoSphere Warehouse.Oracle ...

最新文章

  1. 插件框架Extensible Framework for Delphi
  2. python3中的编码与解码
  3. 《深入解析 MAC OS X iOS 操作系统》PDF 带书签
  4. 这应该是目前最快速有效的ASP.NET Core学习方式(视频)
  5. Oracle创建pfile spfile 文件及其恢复
  6. object address data read debug
  7. 嵌套套娃,MySQL子查询,单行与多行子查询,相关和不相关(关联)子查询,完整详细可收藏
  8. 苹果屏幕上的小圆点_苹果或明年部署miniLED屏幕 最早用在Macbook上
  9. 拦截导弹(信息学奥赛一本通-T1260)
  10. 聚合 aggregate
  11. maven 打包javadoc乱码解决方案
  12. 网络收包流程-网络层处理流程ip_rcv(五)
  13. ajax submit 文件上传,ajaxSubmit() 上传文件和进度条显示
  14. 常见的IC封装形式大全
  15. Django v3.1 官方中文文档(免费)
  16. 管理理念:导致员工工作效率低下的8大原因
  17. c语言实验报告指针数组,C语言实验报告-数组与指针.doc
  18. KDS加密软件的实际应用
  19. CMUSphinx适应声学模型
  20. mysql grant授权用户_mysql grant 用户权限总结

热门文章

  1. 基于深度学习的花卉识别
  2. Pyecharts之日历图(Calendar)
  3. Semantic Foggy Scene Understanding with Synthetic Data
  4. 星星之火-54:量子通信前序,什么是传统的纵观世界的“电”通信?
  5. Windtalkers 风语者
  6. c语言 scanf为什么要用来取地址
  7. 汽车清新剂行业调研报告 - 市场现状分析与发展前景预测
  8. UOJ#273. 【清华集训2016】你的生命已如风中残烛
  9. mysql 服务器端错误码
  10. 设计模式之基础篇UML(类图)