聚类分析-层次聚类(Hierarchical Clustering)解析

层次聚类
层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。层次聚类可以被分为两类:自上而下和自下而上,其中常用的自下而上算法(Bottom-up algorithms),也称为hierarchical agglomerative clustering 或HAC。层次聚类常用的合并算法是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小,相似度越高。并将距离(层次聚类使用欧式距离来计算不同类别数据点间的距离)最近的两个数据点或类别进行组合,生成聚类树。在聚类树中,不同类别的原始数据点是树的最底层,树的顶层是一个聚类的根节点。

层次聚类(Hierarchical Clustering)在生物信息学中的应用
层次聚类是一种比较实用的聚类方法,应用于不同领域的数据分析算法中。在生物医学信息学领域,层次聚类方法常常用于蛋白质序列数据聚类和基因表达数据的聚类。结构相似的蛋白质,功能也相似,通过聚类将相似功能的蛋白质聚为一类,为研究蛋白质的功能提供帮助。基因表达数据聚类就是将具有相似表达谱的基因聚为一类,称为共表达基因,根据基因的共表达现象推断这些基因的生物学功能,从而对新的基因功能进行注释,对基因的生物学功能研究具有重要意义。

Figure1. Agglomerative hierarchical clustering of blood and brain samples. (Kong S, et al. 2015)

  • 每一排代表不同的转录本或者基因,列代表不同的样本或者处理。
  • 底部颜色条表示准录本表达量,红色代表上调表达,蓝色代表下调表达。

参考文献

  1. Kong S, et al. Divergent dysregulation of gene expression in murine models of fragile X syndrome and tuberous sclerosis[J]. Molecular Autism, 2014, 5(1):16-16.

聚类分析-层次聚类(Hierarchical Clustering)在生物信息学中的应用相关推荐

  1. 聚类(2)——层次聚类 Hierarchical Clustering

    聚类系列: 聚类(序)----监督学习与无监督学习 聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类 Hierarchical Clusteri ...

  2. 层次聚类-Hierarchical Clustering

    一.概述 层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树,距离越小,相似度越高.在聚类树中,不同类别的原始数据 ...

  3. 机器学习算法(十二):聚类(2)层次聚类 Hierarchical Clustering

    目录 1 层次聚类 1.1 层次聚类的原理 1.2 两个组合数据点间的距离: 2 自底向上的合并算法 2.1 AGNES算法 (AGglomerative NESting) 2.1.1 原理 2.1. ...

  4. 层次聚类(Hierarchical Clustering)——CURE算法详解及举例

    1 CURE聚类概述 绝大多数聚类算法或者擅长处理球形和相似大小的聚类.或者在存在孤立点时变得比较脆弱.CURE采用了一种新颖的层次聚类算法.该算法选择基于质心和基于代表对象方法之间的中间策略.它不同 ...

  5. 机器学习笔记(九)聚类算法Birch和层次聚类Hierarchical clustering

    本篇文章我们继续介绍另一种聚类算法--Birch模型,相对于K-means和DBSCAN,Birch的应用并没有那么广泛,不过它也有一些独特的优势,Birch算法比较适合于数据量大,类别数K也比较多的 ...

  6. 层次聚类(Hierarchical Clustering)——BIRCH算法详解及举例

    1 BIRCH概述 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)的主要动机是两个方面,一是处理大数据集,二是对 ...

  7. 机器学习(6): 层次聚类 hierarchical clustering

    假设有N个待聚类的样本,对于层次聚类来说,步骤: 1.(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度: 2.寻找各个类之间最近的两个类,把他们归为一类(这样类的总数 ...

  8. R语言ggplot2可视化:为层次聚类树状图dendrogram中的簇进行着色、在树状图dendrogram中为不同的层次聚类簇配置不同的色彩

    R语言ggplot2可视化:为层次聚类树状图dendrogram中的簇进行着色.在树状图dendrogram中为不同的层次聚类簇配置不同的色彩 #层次聚类树状图dendrogram labs = pa ...

  9. 多元统计分析——聚类分析——层次聚类

    聚类方法 适用场景 代表算法 优点 缺陷 延伸 层次聚类 小样本数据 - 可以形成类相似度层次图谱,便于直观的确定类之间的划分. 该方法可以得到较理想的分类 难以处理大量样本,计算复杂度高   基于划 ...

最新文章

  1. mysql57 修改root密码,MySQL 5.7.x修改root默认密码(CentOS下)
  2. 保定 机器人焊接加工厂_满城招聘|双休+五险+国企保定乐凯设备制造安装有限公司招聘满城1.6招聘信息...
  3. JS解析格式化Json插件,Json和XML互相转换插件
  4. funcode拼图游戏c语言程序,同求funcode平台下拼图游戏的C语言代码
  5. SSHnbsp;整合-nbsp;6nbsp;-nbsp;service_serviceImp…
  6. matlab数值计算习题解析,第3章MATLAB数值计算-习题
  7. 【编程题】【Scratch二级】2020.06 小鸡捉害虫​
  8. Gartner:云安全进入高速发展期
  9. Flutter系列之在 macOS 上安装和配置 Flutter 开发环境
  10. (6)Artemis持久化策略
  11. 从零到完成安卓项目实战【安卓端+后端】
  12. 使用gcore工具产生core文件而不杀死进程
  13. excel排版用于印刷:pdf批量转换为图片方便校验排版错误
  14. CAD引线标注文字大小怎么调整?
  15. 五百丁-word模板-推荐简历-top58 下载
  16. mysql-分库分表概述
  17. 互联网行业的发展趋势和挑战
  18. 【Transformer】Transformer 中的位置编码 -- ICLR 2021
  19. 软件系统分析与设计 | UMLet建模
  20. PHP高精度计算函数

热门文章

  1. 场景风控的商户监控,这两大数据指标掌握了吗
  2. Common Spatial Pattern(CSP)共空间模式(包含Matlab代码)
  3. CMMI组织结构和岗位保证
  4. 使用Python创建词云
  5. 打包后的apk微信分享依然失败
  6. Win10(WIN7)开启或关闭测试模式
  7. 世界末日,期待春暖花开
  8. Lua:lua调用C++
  9. 【精选】JAVA算法题(十六)
  10. 慢学英文版UNIX/Linux系统管理员手册13