如何初始化聚类中心

通常,我们会随机选取 KKK 个样本作为 KKK 个聚类中心(K<m)( K<m )(K<m)。但是,如下图所示,不同的初始化有可能引起不同的聚类结果,能达到全局最优(global optimal)固然是好的,但是,往往得到的是局部最优(local optimal)。


现在,想要提前避免不好的聚类结果仍是困难的,我们只能尝试不同的初始化:

fori=1to100:for\quad i=1\ to\ 100 :fori=1 to 100:

  1. 随机初始化,执行 K-Means,得到每个所属的簇 c(i)c^{(i)}c(i) ,以及各聚类的中心位置 μμμ :
    c(1),c(2),...,c(m),μ1,μ2,...,μkc^{(1)},c^{(2)},...,c^{(m)},\ μ_1,μ_2,...,μ_kc(1),c(2),...,c(m), μ1​,μ2​,...,μk​

  2. 计算失真函数 JJJ

选择这 100 次中, JJJ 最小的作为最终的聚类结果。

显然,该方法计算量较大,所以只适用于 KKK 值较小的场景。

6.4 如何初始化聚类中心-机器学习笔记-斯坦福吴恩达教授相关推荐

  1. 6.5 如何确定聚类数-机器学习笔记-斯坦福吴恩达教授

    如何确定聚类数 实际上,一开始是很难确定聚类数的,下图的两种聚类数似乎都是可行的: 但是,也存在一种称之为 肘部法则(Elbow Method) 的方法来选定适当的K值: 上图曲线类似于人的手肘,&q ...

  2. 4.4 机器学习系统设计--垃圾邮件分类-机器学习笔记-斯坦福吴恩达教授

    机器学习系统设计–垃圾邮件分类 假定我们现有一封邮件,其内容如下: From: cheapsales@buystufffromme.com To: ang@cs.stanford.edu Subjec ...

  3. 6.6 二分 K-Means 算法-机器学习笔记-斯坦福吴恩达教授

    二分 K-Means 算法 该算法补充自 <机器学习实战> 一书 常规的 K-Means 算法的误差通常只能收敛到局部最小,在此,引入一种称为二分 K-Means(bisecting km ...

  4. 6.3 优化-机器学习笔记-斯坦福吴恩达教授

    优化 和其他机器学习算法一样,K-Means 也要评估并且最小化聚类代价,在引入 K-Means 的代价函数之前,先引入如下定义: μc(i)=样本x(i)被分配到的聚类中心μ^{(i)}_c=样本\ ...

  5. 6.2 K-Means 算法步骤-机器学习笔记-斯坦福吴恩达教授

    K-Means 算法步骤 那么,K-Means 这个算法是如何完成聚类过程的呢?其实算法名称中对此已有体现: K: 描述了簇的数量,也就是应当聚合成的几何数. Means:均值求解会是该算法的核心. ...

  6. 3.6 权值初始化-机器学习笔记-斯坦福吴恩达教授

    权值初始化 0值初始化 在逻辑回归中,我们通常会初始化所有权值为 0 ,假如在如下的神经网络也采用 0 值初始化: 则可以得到: a1(1)=a2(2)a^{(1)}_1=a^{(2)}_2a1(1) ...

  7. 6.1 无监督学习-机器学习笔记-斯坦福吴恩达教授

    无监督学习 从本节开始,将正式进入到无监督学习(Unsupervised Learning)部分.无监督学习,顾名思义,就是不受监督的学习,一种自由的学习方式.该学习方式不需要先验知识进行指导,而是不 ...

  8. 5.7 程序示例--基于 SMO 的 SVM 模型-机器学习笔记-斯坦福吴恩达教授

    程序示例–基于 SMO 的 SVM 模型 在这里,我们会实现一个基于 SMO 的 SVM 模型,在其中,提供了简化版 SMO 和 完整版 SMO 的实现. 简化版 SMO:不使用启发式方法选择 (α( ...

  9. 3.12 程序示例--多分类问题-机器学习笔记-斯坦福吴恩达教授

    多分类问题 我们手上包含有手写字符的数据集,该数据集来自斯坦福机器学习的课后作业,每个字符图片大小为 20×20 ,总的样本规模为 5000×400 , 我们的神经网络设计如下,包含 1 个隐含层,隐 ...

最新文章

  1. 学会这些Python美图技巧,就等女朋友夸我了
  2. 关闭Struts2中s:property的HTML自动转码
  3. vue如何使用原生js写动画效果_原生js写一个无缝轮播图插件(支持vue)
  4. android 用dx.bat 转换class 为dex
  5. java extensions JAR files
  6. iOS 利用UIDocumentInteractionController打开和预览文档
  7. 3G或应尽早步入细分市场时代
  8. ansible web_最小的Web浏览器,Microsoft Access替代品,Ansible,Kubernetes,JavaScript,piwheel等
  9. 做创业公司长期价值的共建者,高榕资本完成5亿美元新基金募资
  10. 74cms 6.0.20版本文件包含漏洞复现
  11. 用参数方程绘制椭球体
  12. Automatic Metallic Surface Defect Detection and Recognition with Convolutional NeuralNetworks-论文阅读笔记
  13. el-pagination分页自定义前往第几页样式(下拉框形式)
  14. 富怡CAD计算机在哪,富怡CAD的工具介绍之一
  15. 手把手系列!大规模预训练语言模型
  16. 英雄联盟手游常见问题
  17. 微信小程序 SyntaxError: Unexpected token o in JSON at position 1 at JSON.parse (<anonymous>)
  18. 【linux】将Linux里的文件上传 到gitee仓库
  19. 下暴你的硬盘 超多游戏下载 不爆你找我! (二)
  20. 论 $*、$@、$*、$@的区别

热门文章

  1. SaltStack之salt-key管理
  2. 鍵盤彈出,頁面佈局被推上去了.....
  3. JavaScript复习笔记(1)——AJAX
  4. Ubuntu 安装任意版本Django
  5. UA OPTI570 量子力学34 Harmonic Perturbation简介
  6. 如何在Linux系统上自动执行任务
  7. 词法分析器构造工具Flex基础学习
  8. PostgreSQL源码分析
  9. jQuery时间轴特效
  10. oracle SELECT子句中避免使用 ‘ * ‘