这是为什么你不应该将k-means与其他距离函数一起使用的一个很好的例子.

k-means不会使距离最小化.它最小化了平方一维偏差(SSQ)的总和.

这在数学上等于欧氏距离的平方,所以它确实最小化欧几里德距离,作为数学副作用.它不会最小化任意其他距离,这不等于方差最小化.

在你的情况下,很高兴看到它失败的原因;我必须记住这是一个演示案例.

您可能知道,k-means(Lloyds,即)包含两个步骤:通过最小平方偏差分配,然后重新计算均值.

现在问题是,重新计算均值与绝对皮尔森相关性不一致.

让我们取两个向量,它们是-1相关的:

+1 +2 +3 +4 +5

-1 -2 -3 -4 -5

并计算平均值:

0 0 0 0 0

繁荣.它们的平均值并不完全相关.事实上,Pearson相关性甚至不再适用于此向量,因为它的方差为零……

为什么会这样?因为你把k-means误解为基于距离.它实际上是基于算术平均值的.算术平均值是最小二乘(!!)估计量 – 它最小化偏差平方和.这就是为什么平方欧几里德距离起作用的原因:它优化了与重新计算均值相同的数量.在两个步骤中优化相同的目标使得算法收敛.

而不是使用k-means,考虑使用k-medoids aka PAM,它可以在任意距离上工作.或许多其他聚类算法之一,包括DBSCAN和OPTICS.

matlab绝对均值,在K-Means算法中使用绝对皮尔逊相关作为距离(MATLAB)相关推荐

  1. kmeans改进 matlab,基于距离函数的改进k―means 算法

    摘要:聚类算法在自然科学和和社会科学中都有很普遍的应用,而K-means算法是聚类算法中经典的划分方法之一.但如果数据集内相邻的簇之间离散度相差较大,或者是属性分布区间相差较大,则算法的聚类效果十分有 ...

  2. k means算法C语言伪代码,K均值算法(K-Means)

    1. K-Means算法步骤 算法步骤 收敛性定义,畸变函数(distortion function): 伪代码: 1) 创建k个点作为K个簇的起始质心(经常随机选择) 2) 当任意一个点的蔟分配结果 ...

  3. 惯性gps组合导航matlab,Strong-tracking-filter 基于强跟踪滤波算法的惯性加GPS组合导航matlab仿真程序 238万源代码下载- www.pudn.com...

    文件名称: Strong-tracking-filter下载 收藏√  [ 5  4  3  2  1 ] 开发工具: matlab 文件大小: 82 KB 上传时间: 2013-09-01 下载次数 ...

  4. MATLAB可视化实战系列(二十八)-贪心算法求快速平方根倒数算法中的“魔术数字”【含matlab源代码】

    前言 快速平方根倒数算法(Fast InvSqrt)是一种快速计算平方根的倒数的算法,常用于向量标准化运算,在光照渲染中有重要应用.此算法最早可能是于90年代前期由SGI所发明,后来于1999年在&l ...

  5. k近邻算法中k值得选择

    k值得选择会对k近邻的结果产生重大的影响  如果选择较小的K值,就相当于用较小的邻域中的训练实例进行预测,"学习"的近似误差会减小,只有输入实例较近的训练实例才会对预测结果起作用. ...

  6. 自动泊车算法中混合A*粗路径的MATLAB实现

    这里使用Matlab的navigation toolbox实现简单的混合A*粗路径. Load the cost values of cells in the vehicle costmap of a ...

  7. 基于变化点 copula 优化算法中的贝叶斯研究(Matlab代码实现)

  8. matlab lms自适应滤波,基于LMS算法的自适应滤波收敛性的Matlab仿真

    Author :Jeffrey 白噪声经过AR模型的输出作为LMS滤波器的输入,已知:a1=1.558:a2=-0.81:白噪声方差为1.0,均值为0:u=0.002:利用Matlab实现: (1)给 ...

  9. matlab改变图像像素吗,在图像中随机更改像素值程序——matlab

    操作系统篇-hello world(免系统运行程序) || 版权声明:本文为博主原创文章,未经博主允许不得转载. 一.前言     今天起开始分享关于操作系统的相关知识,本人也是菜鸟一个,正处于学习阶 ...

最新文章

  1. Cenos7 部署asp.net core站点
  2. 剑指offer:矩形覆盖
  3. MIT python 第二课第四十分钟 取最小值的例子
  4. AIX系统相关的日常操作
  5. 深入浅出JVM-内存模型
  6. 如何制定客户留存策略_企业如何制定数字化转型策略?
  7. 梯度下降和delta法则
  8. 内镜碎石术装置行业调研报告 - 市场现状分析与发展前景预测
  9. 基于ffmpeg+SDL的加密视频播放器的开发(一)
  10. 简单控制台项目:电影购票系统
  11. 量化交易 第八课 多因子策略流程
  12. 我用python写了一套股票万金油,回报小雪下面给我吃
  13. 有才而性缓,有智而气和
  14. php上传文件和下载文件,PHP 如何上传文件和下载
  15. tomcat服务器缓存配置文件,Tomcat7服务器配置Cache-Control和Expires
  16. mysql 上传rar文件大小_js文件上传 自定义压缩文件和文件格式及大小限制
  17. Android之单元测试
  18. word图文混排复制到xhEditor图片不显示
  19. mysql 索引未命中_mysql索引命中规则
  20. DB2 错误解决方案:A system temporary table space with sufficient page size does not exist.. SQLCODE=-1585,

热门文章

  1. 树莓派 摄像头 python_Python实现树莓派摄像头持续录像并传送到主机
  2. [ oracle ] clinet安装与配置
  3. 成功销售心理学(3)
  4. Mysql 分学科拿取前三名的数据
  5. signature=b1b77b4bec74fcda8c0d93bfcce8abe5,你们要的代码我给整理出来了!!!!!
  6. 设置elementplus主题色(全局设置)
  7. 华硕计算机用户名默认密码是多少,华硕路由器(ASUS)默认登录IP地址是多少
  8. 云原生社区最新力作《深入理解 Istio》出版
  9. 基于VUE3+Layui从头搭建通用后台管理系统(前端篇)一:项目规划及初始化
  10. idea插件的安装及使用