一,引言

之前几个章节讨论的都是监督聚类,从本章开始讨论非监督聚类,即训练模式不带标签的情形。

聚类的步骤:

1,特征选择。选取最能够表示我们目标物体信息的特征。

2,相似性度量。给出两个特征量相似点或者不想似的地方。

3,聚类标准。聚类标准。可能由损耗函数(cost function)或者其他形式表达。

4,聚类算法。根据相似性度量和聚类标准,阐明数据的结构。

5,结果验证。

6,解释结果。

不同的特征、相似性度量、聚类标准和聚类算法会导致完全不同的结果。

主观性会一直伴随我们。(Subjectivity is a reality we have to live with from now on.)

聚类的应用:

1,数据简化。

2,提出假设。

3,验证假设。

4,基于组群的预测。

二,相似性度量

1,点间度量

2,点和数据集间度量

3,数据集间度量

[模式识别].(希腊)西奥多里蒂斯第四版笔记11之__聚类:基本概念相关推荐

  1. [模式识别].(希腊)西奥多里蒂斯第四版笔记3之__线性分类器

    1,线性分类器主要优点是他们的简化和计算吸引力 2,线性判别函数和决策超平面 3,感知器算法 4,最小二乘法:均方误差估计:随机近似和LMS算法:方差和估计 5,均方估计回顾:均方误差回归:MSE估计 ...

  2. [模式识别].(希腊)西奥多里蒂斯第四版笔记2之__基于贝叶斯决策理论的分类器

    本章的主要工作在基于训练集的特征向量,估计概率密度函数. 1,贝叶斯决策理论 条件概率公式.其中P(w)为先验概率,P(x|w)为类条件概率密度 2,基于正态分布的贝叶斯分类 高斯分布和正态分布是最常 ...

  3. [模式识别].(希腊)西奥多里蒂斯第四版笔记1之__模式识别相关领域

    1. 模式识别相关领域 ①  Machine vision, ② Character (letter or number)recognition->Optical character recog ...

  4. [模式识别].(希腊)西奥多里蒂斯第四版笔记4之__非线性分类器

    1,Exclusive OR(XOR)Booleanfunction问题 布尔量AND和OR是线性可分的 2,两层感知器 对Figure4.1中A类和B类,首先能想到的是画两条直线.如图Figure4 ...

  5. [模式识别].(希腊)西奥多里蒂斯第四版笔记8之__模板匹配

      对语音识别来讲,同一个单词被同一个人每次说的情况都不同,给识别带来困难.本章讨论的就是对不同的情形如何定义适应不同特性的度量. 1,基于最优路径搜索的度量:①贝尔曼最优性原则和动态编程②编辑距离( ...

  6. [模式识别].(希腊)西奥多里蒂斯第四版笔记10之__监督学习:后记

    本章是监督学习的最后一部分,主要有三个目标.   首先,根据系统的分类错误概率来评估系统性能. 其次,将整个系统设计的各个阶段组合到一起. 最后,引入无标签数据,简单介绍半监督学习 1,ERROR-C ...

  7. [模式识别].(希腊)西奥多里蒂斯第四版笔记7之__feature generation (2)

    本章将关注图像分析领域的feature generation. 1,区域特征:①纹理特性②局部线性变换提取纹理特征③矩④参数模型 2,形状和尺寸特征:①傅里叶特征②链式编码,它是边界形状描述最常用的技 ...

  8. [模式识别].(希腊)西奥多里蒂斯第四版笔记6之__feature generation (1):数据转换和降维

    1,单值分解:线性代数的重要部分,已经被广泛用于模式识别中的降维和信息检索应用中. 2,独立成分分析 3,非负矩阵分解 4,非线性降维算法:① kernel PCA②基于图的方法(拉普拉斯算子,Loc ...

  9. [模式识别].(希腊)西奥多里蒂斯第四版笔记9之__context-based classification

    本章的假设前提是不同类之间存在相关性.连续的特征向量不是孤立的. 1,贝叶斯分类器 2,马尔科夫链模型 3,the viterbi algorithm 4, 信道均衡(channel equaliza ...

最新文章

  1. 基于mysql-proxy读写分离
  2. 多视图关联选择的例子
  3. 大数据之-Hadoop源码编译_编译hadoop源码前_需要准备的软件_以及编译步骤---大数据之hadoop工作笔记0045
  4. [转载]敏捷开发,你真的做对了吗?
  5. RAC连接时的2种方式Connect Time Failver和taf
  6. flask第九篇——url_for【2】
  7. MTK 修改ro.hardware 获取cpu 和固件版本号方法
  8. 如何养成早起的好习惯?
  9. Grammarly:最优秀的日常英文写作辅助工具——论文英文校验
  10. 三星设备如何打开开发者模式、如何下载安装play store以便进行正常的Android开发中的google购买测试
  11. 一万块内工作站型计算机配置,1.5万元i7-7700K用于图形工作站高端电脑配置推荐...
  12. 关于IE主页被篡改成2345、360、hao123等页面的说明
  13. 重庆云阳2021云中高考成绩查询,重庆云阳中学2021年招生简章
  14. 「水花投资」是什么?是个人吗?
  15. Delphi CxGrid 用法详解
  16. 编译原理算符分析器实现 -* c语言代码,C语言实现算符优先文法源代码(编译原理)...
  17. 公网IP,内网IP,动态IP,静态IP的区别
  18. 一款基于chatGPT的插件【Merlin】,聊天式感受强大AI能力
  19. 开关电源IC的选择要求
  20. 毕业设计之基于Vue的数据可视化平台

热门文章

  1. opencv、C++开发报错之丢失 opencv_worldXXXd.dll
  2. jquery.autocomplete 实现实时查询
  3. 调用接口登录禅道_调用禅道api创建新用户
  4. 【第146期】回复网友@pcy:如何准备校招
  5. 【无标题】音频蓝牙语音芯片,WT2605C-32N实时录音上传技术方案介绍
  6. php 让百度蜘蛛抓取403,百度蜘蛛不抓取页面的解决方法
  7. Mybatis 标签合集
  8. 为什么游戏玩家和开发者应该关心光线追踪
  9. 新华三 HCL模拟器配置ssh远程登陆
  10. 非连续性概率分布的概率密度(有间断点时如何求数学期望)