学习笔记,仅供参考,有错必纠


Data Clustering: 50 Years Beyond K-means

根据感知到的相似性对物体进行分类的做法是许多科学的基础。将数据组织成合理的分组是理解和学习的最基本模式之一。例如,一种常见的科学分类方案将生物体分为分类等级:领域、界、门、纲等)。聚类分析是根据测量或感知的内在特征对对象进行分组的算法和方法的正式研究。聚类分析不使用先前标识符标记对象的类别标签,即类标签。类别信息的缺失将聚类分析(无监督学习)和鉴别分析(监督学习)区分开来。聚类分析的目的是简单地找到一个方便和有效的数据组织,而不是建立将未来的数据分类的规则

聚类方法的发展是一项真正的跨学科努力。分类学家、社会科学家、心理学家、生物学家、统计学家、工程师、计算机科学家、医学研究人员以及其他收集和处理真实数据的人员都对聚类方法做出了贡献。据JSTOR称,数据聚类最早出现在1954年一篇关于人类学数据的文章的标题中。最著名、最简单和最流行的聚类算法之一是K-means。它是由斯坦豪斯(1955),劳埃德(1957),鲍尔和霍尔(1965)和麦昆(1967)独立发现的!通过谷歌Scholar进行的一项搜索发现,仅2007年一年,就有2.2万个词条使用了单词聚类,1560个词条使用了单词数据聚类。在2006年和2007年CVPR、ECML、ICDM、ICML、NIPS和SDM上发表的所有论文中,有150篇涉及聚类。这些大量的文献谈到了聚类在机器学习、数据挖掘和模式识别中的重要性。

一个簇是由许多相似的对象组合在一起组成的。虽然很容易给出簇的功能定义,但是很难给出簇的操作定义。这是因为可以根据不同的目的将对象分组到簇中。数据可以揭示不同形状和大小的簇。因此,在数据中识别聚类的关键问题是指定或学习相似性度量。尽管已经发布了数千种聚类算法,但用户仍然面临着选择算法、距离度量、数据规范化、聚类数量和验证标准的两难选择。熟悉应用程序领域和簇目标肯定有助于做出明智的选择。本文将提供聚类算法的背景知识,讨论聚类算法设计中的主要挑战和关键问题,总结著名的聚类方法,并指出一些新兴的研究方向,包括利用成对约束的半监督聚类,结合多个聚类结果的集成聚类,从侧面信息中学习距离度量,同时进行特征选择和聚类。

文献学习(part74)--Data Clustering: 50 Years Beyond K-means相关推荐

  1. 文献记录(part74)--Subspace clustering via seeking neighbors with minimum reconstruction error

    学习笔记,仅供参考,有错必究 关键词:子空间聚类:稀疏表示:最小重建误差:字典学习 文章目录 Subspace clustering via seeking neighbors with minimu ...

  2. 文献学习(part18)--Subspace Clustering

    学习笔记,仅供参考,有错必究 未完待续- 文章目录 Subspace Clustering 子空间聚类问题 子空间聚类算法 代数算法 MATRIX FACTORIZATION-BASED ALGORI ...

  3. 文献学习(part15)--Subspace Clustering via Good Neighbors

    学习笔记,仅供参考,有错必纠 文章目录 Subspace Clustering via Good Neighbors Abstract INTRODUCTION RELATED WORK PROPOS ...

  4. 文献学习(part96)--Subspace Clustering by Block Diagonal Representation

    学习笔记,仅供参考,有错必纠 期刊:TPAMI-2018 作者:Canyi Lu; Jiashi Feng; Zhouchen Lin; Tao Mei; Shuicheng Yan 文章目录 Sub ...

  5. 文献记录(part89)--I-k-means-+:An iterative clustering algorithm based on an enhanced k -means

    学习笔记,仅供参考,有错必究 关键词:k均值:解决方案改进:准确的k均值:迭代改进 I-k-means-+:An iterative clustering algorithm based on an ...

  6. 【文献学习】热电偶信号调理电路

    这是在做一个高精度高温传感器配套测试系统时的文献学习笔记.仅做记录总结,方便自己之后查看汇总,言语如有不得体之处还请见谅,转载注明出处. 这篇笔记主要是记录一些文献中,热电偶温度测试系统相关的信号调理 ...

  7. 基于3D网格模型的加密域可逆信息隐藏文献学习

    --------------------------------------------- 文献学习: 题目:Separable Reversible Data Hiding Based on Int ...

  8. 深度学习编译器Data Flow和Control Flow

    深度学习编译器Data Flow和Control Flow 本文介绍了一下深度学习框架的Data Flow和Control Flow,基于TensorFlow解释了TensorFlow是如何在静态图中 ...

  9. 学计算机须知,学习计算机须知的50个专业术语

    在我们生活中已经离不开计算机了, 但是计算机是国外发明的,因此涉及到很多的英文专业语会有很多小伙伴们吧了解,那么今天爱站小编就为大家介绍学习计算机须知的50个专业术语,大家快来看看吧. •PC:个人计 ...

最新文章

  1. android studio2.3.2增加jni
  2. Python函数——.strip()
  3. 静态代理、动态代理、AOP
  4. 7.1 pdo 宝塔面板php_大商创X2.0宝塔环境保姆式完整安装教程
  5. java web不用框架_初学javaweb,远离各自框架
  6. 读写分离设计:复制延迟?其实是你用错了
  7. VMware基础架构和运营管理
  8. DB9 公头母头引脚定义及连接
  9. 2022年电工(技师)考试报名及电工(技师)复审考试
  10. 理论力学知识要点(五)
  11. 小红书种草达人类型有哪些?如何评判达人质量
  12. [读书笔记]高效15法则 谷歌、苹果都在用的深度工作法
  13. JavaCC中扩展的正规表达式
  14. 瑞吉外卖第五天(套餐的增删改和手机端登录功能的实现)
  15. c语言程序考试试题,C语言程序设计期末考试试题(含答案)
  16. 苹果ios超级签名源码包java版带分发页面支持安卓合并
  17. ora-01172 ora-01151的处理
  18. 浅析侧供给结构性改革及三去一降一补
  19. 阿里云服务器代金券如何领取?阿里云高防GPU云服务器有优惠吗?
  20. 抖音上的战斗力测试软件,抖音战斗力测试app

热门文章

  1. join操作-内联,左外联,右外联,交叉联,全联
  2. python2.7出现IOError: [Errno 5] Input/output error
  3. myeclipse去除jsp校验错误
  4. manjaro Linux调节屏幕显示亮度
  5. java + maven 实现发送短信验证码功能
  6. Spring发展历程总结
  7. 韩研究人员声称:创造出了一块“不可破坏”的芯片!
  8. 视频开发(即时通讯平台)
  9. Java-js处理textarea自动生成的制表符(空格,换行,tab等)
  10. 图解Android - Android GUI 系统 (2) - 窗口管理 (View, Canvas, Window Manager)