Matlab提供系列函数用于聚类分析,归纳起来具体方法有如下:

方法一:直接聚类,利用clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法,该方法的使用者无需了解聚类的原理和过程,但是聚类效果受限制。

方法二:层次聚类,该方法较为灵活,需要进行细节了解聚类原理,具体需要进行如下过程处理:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。

方法三:划分聚类,包括K均值聚类和K中心聚类,同样需要系列步骤完成该过程,要求使用者对聚类原理和过程有较清晰的认识。

接下来,介绍Matlab中的相关函数和相关聚类方法。

1.Matlab中相关函数介绍

1.1 pdist函数

调用格式:Y=pdist(X,’metric’)

说明:用 ‘metric’指定的方法计算 X 数据矩阵中对象之间的距离。’

X:一个m×n的矩阵,它是由m个对象组成的数据集,每个对象的大小为n。

metric’取值如下:

‘euclidean’:欧氏距离(默认);‘seuclidean’:标准化欧氏距离;

‘mahalanobis’:马氏距离;‘cityblock’:布洛克距离;

‘minkowski’:明可夫斯基距离;‘cosine’:

‘correlation’: ‘hamming’:

‘jaccard’: ‘chebychev’:Chebychev距离。

1.2 squareform函数

调用格式:Z=squareform(Y,..)

说明: 强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。

1.3 linkage函数

调用格式:Z=linkage(Y,’method’)

说 明:用‘method’参数指定的算法计算系统聚类树。

Y:pdist函数返回的距离向量;

method:可取值如下:

‘single’:最短距离法(默认); ‘complete’:最长距离法;

‘average’:未加权平均距离法; ‘weighted’: 加权平均法;

‘centroid’:质心距离法; ‘median’:加权质心距离法;

‘ward’:内平方距离法(最小方差算法)

返回:Z为一个包含聚类树信息的(m-1)×3的矩阵。

1.4 dendrogram函数

调用格式:[H,T,…]=dendrogram(Z,p,…)

说明:生成只有顶部p个节点的冰柱图(谱系图)。

1.5 cophenet函数

调用格式:c=cophenetic(Z,Y)

说明:利用pdist函数生成的Y和linkage函数生成的Z计算cophenet相关系数。

1.6 cluster 函数

调用格式:T=cluster(Z,…)

说明:根据linkage函数的输出Z 创建分类。

1.7 clusterdata函数

调用格式:T=clusterdata(X,…)

说明:根据数据创建分类。

T=clusterdata(X,cutoff)与下面的一组命令等价:

Y=pdist(X,’euclid’);

Z=linkage(Y,’single’);

T=cluster(Z,cutoff);

2. Matlab聚类程序的设计

2.1 方法一:一次聚类法

X=[11978 12.5 93.5 31908;…;57500 67.6 238.0 15900];

T=clusterdata(X,0.9)

2.2 方法二和方法三设计流程:分步聚类

Step1 寻找变量之间的相似性

用pdist函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用zscore函数进行标准化。

X2=zscore(X); %标准化数据

Y2=pdist(X2); %计算距离

Step2 定义变量之间的连接

Z2=linkage(Y2);

Step3 评价聚类信息

C2=cophenet(Z2,Y2); //0.94698

Step4 创建聚类,并作出谱系图

T=cluster(Z2,6);

H=dendrogram(Z2);

原文:http://www.cnblogs.com/yymn/p/4622398.html

cophenet matlab,Matlab聚类分析[转]相关推荐

  1. Matlab绘制聚类分析树状图

    工作环境(蓝色粗体字为特别注意内容) 1.软件环境:Windows 7 Ultimate sp1.MatlabR2012b 32bit. 在使用Matlab做聚类分析的时候一般这样用: Y = pdi ...

  2. matlab 自定义距离函数,用MATLAB做聚类分析时非常有用的自定义距离函数和标准化函数...

    聚类分析中,经常遇到观测值缺失的情况. 例如统计历史降水资料时,某个月的资料缺失了,这时用MATLAB做聚类分析时, 就需要自定义距离函数,处理nan的问题. 下面是相关的MATLAB函数,里面有例子 ...

  3. MATLAB层次聚类分析

    实验题目 给出六个民族的出生死亡率,和他们的平均寿命,如下表所示 出生死亡率(%) 平均寿命 1 5.80 70.59 2 7.44 67.14 3 8.11 65.48 4 10.21 58.88 ...

  4. matlab中的聚类算法,kmeans聚类算法matlab matlab 聚类算法silhouette

    怎样用matlab实现多维K-means聚类算法小编觉得一个好的周末应该是这样的:睡到中午醒来,在床上躺着玩两个小时手机,起床随便吃点东西,下午去超市买一大堆零食,五六点的时候去约小伙伴们吃火锅烧烤, ...

  5. matlab 样本均值,Matlab | Matlab从入门到放弃(4)——样本均值

    Matlab | Matlab从入门到放弃(4)--样本均值 Matlab | Matlab从入门到放弃(4)--样本均值 博主github:https://github.com/MichaelBee ...

  6. matlab 如何捕捉错误,【matlab|matlab运行错误捕捉方法】

    『傻大方知识库摘要_matlab|matlab运行错误捕捉方法』需安装VC2005运行库.Matlab错误提示往往以DOS窗口显示,错误提示经常一闪而过,无法查看具体错误信息,可以按照如下操作进行查看 ...

  7. wav数据提取 matlab,matlab 读取处理 wav 文件

    最近工作需要,要对wav文件中存储的声音信息进行分析处理.所以花了些时间收集了各种数学软件中处理wav文件的方法. Matlab Matlab 是最方便的.甚至于不用写任何代码就能读取wav文件(我用 ...

  8. [matlab]matlab cftool点了没反应

    [matlab]matlab cftool点了没反应 命名重复 首先排除是不是在同目录文件下新建了一个cftool.m文件,如果是的话将其改名,自定义为其他名字. 这就和写代码时同名变量覆盖一样,ma ...

  9. [C#] 调用MATLAB(Matlab COM接口) (一)调用函数

    目录 说明 一.Visual Studio 程序 1. Vs 新建项目 2. 编写 C# 程序 二.matlab.Execute() 1. MATLAB函数的输入输出 2. MATLAB Comman ...

  10. saber与matlab,MATLAB与SABER联合仿真(Co-sim)遇到的问题

    问题描述: 系统环境:WinXP SP3 简体中文 软件版本:Saber2008, Matlab R2008a. 仿真程序:throttle_controller, 对照软件给出的Tutorial执行 ...

最新文章

  1. jQuery 超屏加载
  2. mysql 允许远程登录
  3. Linux下安装java(Ubuntu为例)
  4. FarBox--另类有趣的网站服务【转】
  5. 程序员级别鉴定书(.NET面试问答集锦)
  6. python电脑上怎么下载-python下载文件的三种方法
  7. 《C与指针》第七章练习
  8. python有效变量名_Python变量命名规则
  9. java第三章_【Java】第三章 变量
  10. list.action.php,doAction.php里代码可以这样写,大大减少了重复的代码
  11. glDrawArrays,glDrawElements用法
  12. 我的WCF之旅(10):如何在WCF进行Exception Handling
  13. ubuntu无法连接网络
  14. webpack的安装和执行
  15. Matlab运行程序_暂停方法
  16. JMETER录制脚本,脚本增强,参数化,作用域和执行顺序
  17. 中兴软件笔试 c语言,【中兴通讯员工笔试试题及答案】 - 面试网
  18. acrobat PDF删除部分_PDF文件如何删除部分内容?
  19. 计算机怎么搜索特定格式文件,win10 查找指定类型文件方法_win10怎么查找指定类型文件-win7之家...
  20. 对象数据如何转化成数组

热门文章

  1. 软件测试 PreDay 决策表
  2. 注塑模设计必懂的知识
  3. 生信自学笔记(三)分子数据库
  4. 西门子PLC s7-1200学习之路
  5. 深度学习中的9种归一化方法概述
  6. XPS查看器(XPS Viewer)适用Win10系统安装说明
  7. OPPO A11解账号锁刷机包
  8. 数据处理SPSS的数据类型分析
  9. RDCMan安装使用说明
  10. 远程服务器维护工具,免费小工具轻松实现多台服务器维护