案例实践:用SPSS做K均值聚类分析
01
案例数据背景
某公司对应聘的48人进行多项测试后,对直接表现其特征的14个方面进行了打分,每个单项都采用10分制,得分越高说明当事人在此方面表现越好。试对应聘者做聚类。
对应聘者做聚类,在现实中可能有些意义。比如同一类型的应聘者5人,公司仅有2个名额的话,是不是就方便HR在同一类型人中做更小范围的筛选。
另外不同类型的应聘者,可以提供不同的工作和培训。
02
SPSS菜单操作
菜单:【分析】→【分类】→【K均值聚类】:
1)聚类依据是至关重要的,多一个少一个都可能引起聚类结果的改变,本例将所有品质得分数据作为聚类依据。
2)聚几个类合适呢?可以采用遍历的方式反复多次聚类,并对结果进行比较总结经验,类可以不要太多,本例聚成3类。因此聚类数直接输入数字3。
K均值聚类要求用户在开始聚类前对聚类对象的分类有所认知,开始聚类时应明确指出聚成几个类,如果对类的结果没有经验参考,那么采取遍历的方式寻找最佳的聚类个数K。
点开【保存】按钮,要求软件根据聚类算法计算各应聘者的分类及距离类中心的距离。
打开【选项】按钮,勾选【初始聚类中心】和【ANOVA】表,后者有一定价值,是以聚类结果作为因子,以各参与聚类的变量作为因变量,做单因素方差分析,考察类结果对各指标的区分情况。
返主对话框,点【确定】后执行。
03
SPSS结果解读
聚类结果之各类规模或各类成员数。出现了一个小类,编号为3,仅有3个应聘者成员。
在数据视图下可以看到原始数据新增了一个聚类结果变量,给出每一位应聘者的分类编号。比如分类水平1代表归属与编号1的类型。
至于这三个类的特征,需要用户自己提炼信息并命名。这里和因子分析有些类似。类的特征需要各自独立,且符合实际指导意义。
有没有办法从可视化效果的角度来看看聚类结果呢?有,我们绘制一个立体3维散点图吧。
这个角度看,三个分类的区分还是比较明显的。但此图缺点也很明显,怎么选定绘制图所需的三个变量?聚类变量重要性排序吗?
SPSS并没有给出明确方案。况且散点图我们只能最多放三个轴,可我们现在有10多个聚类依据啊,如何去展示呢?如何辅助去提炼类特征呢?
小兵给大家一个最简单的方案。
我们以最终聚类中心为数据资料,绘制各类在各项目上的条形图,对比条形图的高低来对类做特征描述。
看着此图,我们找一找各个项目的最高得分,最低得分,总结提炼类的特征。编号为1的类型是【忠厚老实】,编号为2的类型是【缺乏经验】,其他方面都不错,编号为3的类型是【经验丰富老油条】或是在某方面有特别之才能。
对类特征有一个总体把握之后,对各类型应聘者提供不同的,相对应的职位和工作。
案例实践:用SPSS做K均值聚类分析相关推荐
- 手把手教你做K均值聚类分析
1.案例数据探索 案例采用著名的鸢尾花iris数据集,按鸢尾花的三个类别(刚毛,变色,佛吉尼亚),每一类50株,共测得150株鸢尾花的花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性数据. 1.1 浏览 ...
- 手把手教你R语言做k均值聚类分析
今天聊聊k均值聚类分析,我们先要知道什么是类,在大数据时代,我们每个人都被打上很多个性标签,比如:宅男,月光族,手机控,非主流等等,每个标签都可以算是一个类,因此,可以不严谨的说:类是一些有特殊属性个 ...
- SPSS聚类分析:K均值聚类分析
SPSS聚类分析:K均值聚类分析 一.概念:(分析-分类-K均值聚类) 1.此过程使用可以处理大量个案的算法,根据选定的特征尝试对相对均一的个案组进行标识.不过,该算法要求您指定聚类的个数.如果知道, ...
- 【MATLAB统计分析与应用100例】案例018:matlab读取Excel数据,进行K均值聚类分析
文章目录 1. K均值聚类分析结果 2. matlab完整代码 (1)读取数据,并进行标准化变换 (2)选取初始凝聚点,进行聚类 (3)绘制轮廓图 1. K均值聚类分析结果 2. matlab完整代码 ...
- 【MATLAB统计分析与应用100例】案例019:matlab读取Excel数据,进行K均值聚类分析
文章目录 1. 读取数据,并进行标准化变换 2. 进行模糊C均值聚类 3. 查看聚类结果 4. K均值聚类分析结果 1. 读取数据,并进行标准化变换 % 从文件examp09_05.xls中读取数据 ...
- Matlab 主成分分析与K均值聚类分析实验报告
Matlab 主成分分析与K均值聚类分析实验报告 提示:数据资源在本CSDN号的上传资料中直接领取 1 引言 数据:gyzb.mat(按顺序对应每一列)为:31个省市区的国有控股企业的主要指标(包括: ...
- 全国113个城市空气质量的K均值聚类分析--基于R
下表给出了2017年全国113个环保重点城市空气质量年度数据(资料来源:中华人们共和国国家统计局).它们分别为:二氧化硫平均浓度(微克每立方米,),二氧化氮平均浓度(微克每立方米,);可吸入颗粒物(P ...
- Python数据分析案例03——天气K均值聚类分析
聚类常用的算法肯定是K均值聚类了,本次案例采用陕西的十个地区的天气数据,构建特征,进行聚类分析. 首先数据都装在'天气数据'这个文件夹里面,如图: 打开其中一个excel,长这个样子 下面开始数据处理 ...
- 基于SPSS的K均值算法
文章目录 前言 一.K均值算法是什么? 二.动画演示 1.网站 2.示例 三.缺点解决(K-means++算法) 四.SPSS实现 总结 前言 菜鸡学习数学建模 一.K均值算法是什么? K-means ...
最新文章
- 2.爬虫的Python基础
- DRV8301的使用
- js 显示当前时间(年月日时分秒)——getYear()与getFullYear()
- 数据分析软件python 对电脑的要求-用于数据分析的BI工具还是python?
- 事务的四个特性-ACID
- jQuery利用JSONP解决AJAX跨域请求
- 【动态规划】状压dp:蓝桥2020补给(旅行商问题)
- vue视频保存不下来_vue视频如何导出? 视频导出方法攻略解答!
- 记录一次keil调试过程:自动识别GPS厂家芯片
- 普渡大学计算机科学本科,美国普渡大学计算机科学CS本科申请条件及案例
- 分发自动化_使用bitrise自动化应用分发
- 人文思考与科研探索之管锥篇
- 刷题记录:牛客NC16122郊区春游
- CTF-WEB——HTTP Headers类型
- python写井字棋_python 游戏(井字棋)
- 树莓派基础实验18:声音传感器实验
- html+css+js好看的梅花
- h3c 静态链路聚合及动态链路聚合
- JavaScript函数调用中的this绑定
- 潍坊学院java比赛_潍坊学院在山东省第六届“超星杯”高校教师教学比赛中再获佳绩...