聚类分析

什么是聚类分析?

聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。

其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。人们总是不断地改进下意识中的聚类模式来学习如何区分各个事物和人。同时,聚类分析已经广泛的应用在许多应用中,包括模式识别,数据分析,图像处理以及市场研究。通过聚类,人们能意识到密集和稀疏的区域, 发现全局的分布模式,以及数据属性之间的有趣的相互关系。

聚类同时也在 Web 应用中起到越来越重要的作用。最被广泛使用的既是对 Web 上的文档进行分类,组织信息的发布,给用户一个有效分类的内容浏览系统(门户网站),同时可以加入时间因素,进而发现各个类内容的信息发展,最近被大家关注的主题和话题,或者分析一段时间内人们对什么样的内容比较感兴趣,这些有趣的应用都得建立在聚类的基础之上。作为一个数据挖掘的功能,聚类分析能作为独 立的工具来获得数据分布的情况,观察每个簇的特点,集中对特定的某些簇做进一步的分析,此外,聚类分析还可以作为其他算法的预处理步骤,简化计算量,提高分析效率&#

探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类相关推荐

  1. 探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

    在用户对自己需求相对明确的时候,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的信息.但搜索引擎并不能完全满足用户对信息发现的需求,那是因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求 ...

  2. 探索推荐引擎内部的秘密系列

    最近要用到协同过滤的算法来解决工作中的问题,先学习,以后再把自己的收获总结下来. 转自:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_rec ...

  3. 【转】探索推荐引擎内部的秘密

    from: http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html?ca=drs- 赵 晨婷 , 软件 ...

  4. 探索推荐引擎内部的秘密系列文章

    探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤 探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

  5. 探索推荐引擎内部的秘密

    "探索推荐引擎内部的秘密"系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用.同时在理论讲解的基础上,还会结合 Apach ...

  6. 探索推荐引擎内部的秘密 - 推荐引擎初探

    最近要用到协同过滤的算法来解决工作中的问题,先学习,以后再把自己的收获总结下来. 转自:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_rec ...

  7. 探索推荐引擎内部的秘密:深入推荐引擎相关算法 - 协同过滤

    上一篇转载的博客<探索推荐引擎内部的秘密 - 推荐引擎初探>,详细讲述了推荐引擎的原理.算法.应用,并且给出了一些优化的trick,真心不错. 这里把第二篇<探索推荐引擎内部的秘密 ...

  8. 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤

    本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法.在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法.它以其方法 ...

  9. 推荐引擎内部的秘密3

    聚类分析 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大.所以,在很多应用中,一个 ...

最新文章

  1. 任意排列、组合终极Shell脚本
  2. 关注度越来越高的行人重识别,有哪些热点?
  3. 使用dex2jar反编译APK时出现的问题
  4. linux 树莓派查看ip,树莓派 常用Linux命令
  5. PHP学习笔记-文件操作1
  6. PowerDesigner使用总结(转)
  7. oracle多次发运,Oracle EBS-SQL (OM-4):检查发运网络.sql
  8. 进程间通信(python)
  9. C#8.0: 在 LINQ 中支持异步的 IAsyncEnumerableT接口
  10. linux以下哪个属于块设备,1222.在大多数Linux发行版本中,以下哪个属于块设备( )...
  11. pdu报头内容_1OSI七层参考模型,各个报头内容
  12. 直接插入排序中的监视哨问题
  13. Android上SQLite的性能优化问题
  14. 删除mac开机启动项
  15. [图文并茂]手把手教你用`U盘启动盘`重装Windows系统
  16. 家用计算机中PCB板材质,主流的PCB板材料有哪些分类?
  17. 塔塔露也能看懂的服务器配置pytorch,TensorFlow教程
  18. C++中运行一个程序的内存分配情况及qt中的内存管理机制
  19. 一文带你读懂“亚当理论”的精髓:期货股票交易操作守则与操作技巧
  20. Unity3D游戏开发之当游戏开发遇上Excel

热门文章

  1. winlogon.exe病毒的查杀方法
  2. Python列表函数方法
  3. 模拟命令行自动输入的HTML,HTML5 命令行界面仿真和自动打字动画
  4. java 图片配上音乐_视频背景音乐识别示例
  5. 模糊pid控制的温度系统matlab源代码_变风量空调模糊 PID 控制系统的仿真研究
  6. aes sample java,python-AES加密java解密
  7. java spring上传_SpringMVC上传文件的三种方式
  8. mysql集群会备份数据吗_mysql集群即双机备份与主从复制
  9. C++中函数重载分析
  10. KahanSummation算法