01

案例数据背景

某公司对应聘的48人进行多项测试后,对直接表现其特征的14个方面进行了打分,每个单项都采用10分制,得分越高说明当事人在此方面表现越好。试对应聘者做聚类。

对应聘者做聚类,在现实中可能有些意义。比如同一类型的应聘者5人,公司仅有2个名额的话,是不是就方便HR在同一类型人中做更小范围的筛选。

另外不同类型的应聘者,可以提供不同的工作和培训。

02

SPSS菜单操作

菜单:【分析】→【分类】→【K均值聚类】:

1)聚类依据是至关重要的,多一个少一个都可能引起聚类结果的改变,本例将所有品质得分数据作为聚类依据。

2)聚几个类合适呢?可以采用遍历的方式反复多次聚类,并对结果进行比较总结经验,类可以不要太多,本例聚成3类。因此聚类数直接输入数字3。

K均值聚类要求用户在开始聚类前对聚类对象的分类有所认知,开始聚类时应明确指出聚成几个类,如果对类的结果没有经验参考,那么采取遍历的方式寻找最佳的聚类个数K。

点开【保存】按钮,要求软件根据聚类算法计算各应聘者的分类及距离类中心的距离。

打开【选项】按钮,勾选【初始聚类中心】和【ANOVA】表,后者有一定价值,是以聚类结果作为因子,以各参与聚类的变量作为因变量,做单因素方差分析,考察类结果对各指标的区分情况。

返主对话框,点【确定】后执行。

03

SPSS结果解读

聚类结果之各类规模或各类成员数。出现了一个小类,编号为3,仅有3个应聘者成员。

在数据视图下可以看到原始数据新增了一个聚类结果变量,给出每一位应聘者的分类编号。比如分类水平1代表归属与编号1的类型。

至于这三个类的特征,需要用户自己提炼信息并命名。这里和因子分析有些类似。类的特征需要各自独立,且符合实际指导意义。

有没有办法从可视化效果的角度来看看聚类结果呢?有,我们绘制一个立体3维散点图吧。

这个角度看,三个分类的区分还是比较明显的。但此图缺点也很明显,怎么选定绘制图所需的三个变量?聚类变量重要性排序吗?

SPSS并没有给出明确方案。况且散点图我们只能最多放三个轴,可我们现在有10多个聚类依据啊,如何去展示呢?如何辅助去提炼类特征呢?

小兵给大家一个最简单的方案。

我们以最终聚类中心为数据资料,绘制各类在各项目上的条形图,对比条形图的高低来对类做特征描述。

看着此图,我们找一找各个项目的最高得分,最低得分,总结提炼类的特征。编号为1的类型是【忠厚老实】,编号为2的类型是【缺乏经验】,其他方面都不错,编号为3的类型是【经验丰富老油条】或是在某方面有特别之才能。

对类特征有一个总体把握之后,对各类型应聘者提供不同的,相对应的职位和工作。

案例实践:用SPSS做K均值聚类分析相关推荐

  1. 手把手教你做K均值聚类分析

    1.案例数据探索 案例采用著名的鸢尾花iris数据集,按鸢尾花的三个类别(刚毛,变色,佛吉尼亚),每一类50株,共测得150株鸢尾花的花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性数据. 1.1 浏览 ...

  2. 手把手教你R语言做k均值聚类分析

    今天聊聊k均值聚类分析,我们先要知道什么是类,在大数据时代,我们每个人都被打上很多个性标签,比如:宅男,月光族,手机控,非主流等等,每个标签都可以算是一个类,因此,可以不严谨的说:类是一些有特殊属性个 ...

  3. SPSS聚类分析:K均值聚类分析

    SPSS聚类分析:K均值聚类分析 一.概念:(分析-分类-K均值聚类) 1.此过程使用可以处理大量个案的算法,根据选定的特征尝试对相对均一的个案组进行标识.不过,该算法要求您指定聚类的个数.如果知道, ...

  4. 【MATLAB统计分析与应用100例】案例018:matlab读取Excel数据,进行K均值聚类分析

    文章目录 1. K均值聚类分析结果 2. matlab完整代码 (1)读取数据,并进行标准化变换 (2)选取初始凝聚点,进行聚类 (3)绘制轮廓图 1. K均值聚类分析结果 2. matlab完整代码 ...

  5. 【MATLAB统计分析与应用100例】案例019:matlab读取Excel数据,进行K均值聚类分析

    文章目录 1. 读取数据,并进行标准化变换 2. 进行模糊C均值聚类 3. 查看聚类结果 4. K均值聚类分析结果 1. 读取数据,并进行标准化变换 % 从文件examp09_05.xls中读取数据 ...

  6. Matlab 主成分分析与K均值聚类分析实验报告

    Matlab 主成分分析与K均值聚类分析实验报告 提示:数据资源在本CSDN号的上传资料中直接领取 1 引言 数据:gyzb.mat(按顺序对应每一列)为:31个省市区的国有控股企业的主要指标(包括: ...

  7. 全国113个城市空气质量的K均值聚类分析--基于R

    下表给出了2017年全国113个环保重点城市空气质量年度数据(资料来源:中华人们共和国国家统计局).它们分别为:二氧化硫平均浓度(微克每立方米,),二氧化氮平均浓度(微克每立方米,);可吸入颗粒物(P ...

  8. Python数据分析案例03——天气K均值聚类分析

    聚类常用的算法肯定是K均值聚类了,本次案例采用陕西的十个地区的天气数据,构建特征,进行聚类分析. 首先数据都装在'天气数据'这个文件夹里面,如图: 打开其中一个excel,长这个样子 下面开始数据处理 ...

  9. 基于SPSS的K均值算法

    文章目录 前言 一.K均值算法是什么? 二.动画演示 1.网站 2.示例 三.缺点解决(K-means++算法) 四.SPSS实现 总结 前言 菜鸡学习数学建模 一.K均值算法是什么? K-means ...

最新文章

  1. 2.爬虫的Python基础
  2. DRV8301的使用
  3. js 显示当前时间(年月日时分秒)——getYear()与getFullYear()
  4. 数据分析软件python 对电脑的要求-用于数据分析的BI工具还是python?
  5. 事务的四个特性-ACID
  6. jQuery利用JSONP解决AJAX跨域请求
  7. 【动态规划】状压dp:蓝桥2020补给(旅行商问题)
  8. vue视频保存不下来_vue视频如何导出? 视频导出方法攻略解答!
  9. 记录一次keil调试过程:自动识别GPS厂家芯片
  10. 普渡大学计算机科学本科,美国普渡大学计算机科学CS本科申请条件及案例
  11. 分发自动化_使用bitrise自动化应用分发
  12. 人文思考与科研探索之管锥篇
  13. 刷题记录:牛客NC16122郊区春游
  14. CTF-WEB——HTTP Headers类型
  15. python写井字棋_python 游戏(井字棋)
  16. 树莓派基础实验18:声音传感器实验
  17. html+css+js好看的梅花
  18. h3c 静态链路聚合及动态链路聚合
  19. JavaScript函数调用中的this绑定
  20. 潍坊学院java比赛_潍坊学院在山东省第六届“超星杯”高校教师教学比赛中再获佳绩...

热门文章

  1. Java接口练习(组装电脑)
  2. 用frp开源工具,实现内网穿透(详细教程)
  3. Mac上将mp4视频做成屏保
  4. 骑行318、 2016.7.20
  5. 不叫 Andromeda?Google 新系统疑为 Fuchsia
  6. web3d-手机产品展示_onePlus6
  7. CSS 利用@media screen判断识别手机/PC端浏览器
  8. layui多选下拉框,多选
  9. csdn上面文章转发
  10. xml和html的区别和联系