https://doi.org/10.1016/j.coisb.2017.12.008

Yale university 2017年12月发布的基于机器学习中流形学习的单细胞降维降噪处理优化。

The manifold learning:

假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。

常见的MFL:PCA、MDS、diffusion mapping等,图下为不同方法的优劣简介。

本文关键词:MFL(Manifold models can also be useful for analyzing data generated from disparate dynamics or profiles as the data can be modeled with several disconnected mani- folds)、DPT(a pseudotime trajectory through the data to describe a latent axis of development or cell state transition)、DPT method(to find a major axis of variability in the data, DPT defines a distance from a source cell to all other cells over a modified transition operator that includes only non- trivial diffusion components. This produces trajec- tories of nonlinear variation across a dataset)

而本文的思路是在分析scRNAseq的数据的第二步使用到了MFL:

gene selection, 

manifold learning, 

cell organization,

Dimensionality reduction and visualization,

Density estimation and clustering。

而整体的前三步统称为pseudotime methods。

下图清晰的展示出了文章的分析思路,图也草鸡美。我觉得我还要修炼些时日再做图,分析分析思路比较拿手哈哈哈:

每个plot都会有对应的一个subtitle,理解作者在做什么足够。

其中,

主要的文章算法核心在下图:

Comparison of pseudotime methods. Pseudotime methods(four kinds of method) may generally be broken down into three stages: gene selection, manifold learning, and cell organization.

从而作者提出了一些现存方法的局限性,

A current limitation of these methods is their reliance to varying degrees on assumptions about the underlying shape of the data (数据潜在形态的假设几何对后期分型影响很大)(e.g. a tree, bifurcating trajectory, etc.)

而他们开发的DPT,也就是最后一种方法:provideing two significant advantages over other pseudotemporal techniques. First, working directly on a diffusion map does not require any greedy computational steps(层级聚类的经典算法,每一步都是贪婪模型,也就是局部最优而不是树的全局最优). Second and most importantly, because DPT operates directly on the diffusion space, it features the least coarse graining or over-fitting of data into low-dimensional assumptions(DPT的工作对象是整体的扩散空间,而不是二分支结构以及树状结构,所以可以以最小的粗粒度过拟合到低维空间).

 文章最后的验证:

三种降维分析的验证以及模拟数据点的jaccard index similarity validation in jaccard graph ,I mentioned in one piece of previous blog

文章整篇都是叙述性的算法介绍,而没有任何公示和代码stick up。就本人拙见,比较重要的机器学习思维是其中的manifold learning,pseudotime method,以及根据MFL衍生出来的降维分析方法。

在这里贴一个MFL的CSDN博文,人家讲的贼好。

https://blog.csdn.net/chl033/article/details/6107042

转载于:https://www.cnblogs.com/beckygogogo/p/9195248.html

Manifold learning-based methods for analyzing single-cell RNA-sequencing data相关推荐

  1. 深度学习文本分类文献综述(翻译自Deep Learning Based Text Classification: A Comprehensive Review)

    深度学习文本分类文献综述 摘要 介绍 1. 文本分类任务 2.文本分类中的深度模型 2.1 Feed-Forward Neural Networks 2.2 RNN-Based Models 2.3 ...

  2. (论文笔记)EEG fading data classification based on improved manifold learning with adaptive neighborhood

    EEG fading data classification based on improved manifold learning with adaptive neighborhood select ...

  3. Deep learning based multi-scale channel compression feature surface defect detection system

    基于深度学习的多尺度通道压缩特征表面缺陷检测系统 Deep learning based multi-scale channel compression feature surface defect ...

  4. 跌倒综述 Deep Learning Based Systems Developed for Fall Detection A Review

    文章目录 1.基本信息 2. 第一节 介绍 3. 第二节 跌倒检测系统文献 4.第三节 讨论和未来方向 5. 第四节 结论 6. 参考文献 1.基本信息 题目:Deep Learning Based ...

  5. 简明深度学习方法概述 Deep Learning:Methods and Application

    简明深度学习方法概述 Deep Learning:Methods and Application  人工智能  小林子  7个月前 (03-05)  2558℃  0评论 作者:@神一手golden ...

  6. Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels

    Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels Abstra ...

  7. A Survey of Zero-Shot Learning: Settings, Methods, and Applications [reading notes]

    原文链接:https://joselynzhao.top/2019/04/15/A-Survey-of-Zero-Shot-Learning_-Settings,-Methods,-and-Appli ...

  8. 论文翻译七:Adversarial Transfer Learning for Deep Learning Based Automatic Modulation Classification

    30天挑战翻译100篇论文 坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长- Adversarial Transfer Learning for Deep Learning Based ...

  9. 论文翻译:2021_语音增强模型压缩_Towards model compression for deep learning based speech enhancement...

    论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...

最新文章

  1. 解压zip_康巴汉子“型男”zip,点击解压
  2. python访问数据库日志文件_python利用inotify实现把nginx日志实时写入数据库
  3. 关于function和Object的认识
  4. sas Data步数据读取流程详解
  5. JS 动态显示 获取下拉框的多个值
  6. 朱松纯:从人工智能的角度解读《赤壁赋》兼谈“心”与“理”的平衡
  7. Java *1.13(代数:求解2 × 2线性方程组)可以使用Cramer法则解下面的2 x 2线性方程组,假定ad-bc不为0:
  8. Ubuntu18.04安装Mujoco、mujoco_py
  9. 基于FPGA的RS232异步串行口IP核设计
  10. Win10计算机默认排序,win10系统文件夹自动排列怎么取消?win10文件夹不自动排列设置方法...
  11. Java 线上问题排查思路与工具使用
  12. 关于海盗分金币问题的讨论(面试题)[]
  13. 四足机器人的六种步态特征
  14. 如何撰写高水平的学术论文
  15. 数电实验七:译码显示电路
  16. 知名互联网大厂——推荐算法工程师、专家、leader
  17. 公务员考试题汇集之逻辑推理
  18. Mac上有哪些冷门但却逆天的软件?
  19. gitlab下载单个目录,git克隆指定的目录
  20. 阿里云APA云服务助理认证 第1章: 阿里云简介

热门文章

  1. 淘宝内核月报 2017
  2. 算法笔记_096:蓝桥杯练习 算法提高 求最大值(Java)
  3. execv shell_exec系列函数(execl,execlp,execle,execv,execvp)使用
  4. solr 高并发_Solr搜索引擎 — SolrCloud介绍和环境准备
  5. extjs 按钮小箭头展开panel_汽车按钮都是英文看不懂?视频教你认清车内所有按钮,看完秒懂...
  6. mysql in 数字类型_关于sql where id in 转换成数据类型 int 时失败
  7. Python机器学习:多项式回归与模型泛化008模型泛化与岭回归
  8. antdesign 地图_React 使用recharts实现散点地图的示例代码
  9. matlab编程的步骤,如何画matlab程序的流程图?求解答
  10. python英文词频统计去除定冠词_使用Python进行英文词频统计