Manifold learning-based methods for analyzing single-cell RNA-sequencing data
https://doi.org/10.1016/j.coisb.2017.12.008
Yale university 2017年12月发布的基于机器学习中流形学习的单细胞降维降噪处理优化。
The manifold learning:
假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。它是从观测到的现象中去寻找事物的本质,找到产生数据的内在规律。
常见的MFL:PCA、MDS、diffusion mapping等,图下为不同方法的优劣简介。
本文关键词:MFL(Manifold models can also be useful for analyzing data generated from disparate dynamics or profiles as the data can be modeled with several disconnected mani- folds)、DPT(a pseudotime trajectory through the data to describe a latent axis of development or cell state transition)、DPT method(to find a major axis of variability in the data, DPT defines a distance from a source cell to all other cells over a modified transition operator that includes only non- trivial diffusion components. This produces trajec- tories of nonlinear variation across a dataset)
而本文的思路是在分析scRNAseq的数据的第二步使用到了MFL:
gene selection,
manifold learning,
cell organization,
Dimensionality reduction and visualization,
Density estimation and clustering。
而整体的前三步统称为pseudotime methods。
下图清晰的展示出了文章的分析思路,图也草鸡美。我觉得我还要修炼些时日再做图,分析分析思路比较拿手哈哈哈:
每个plot都会有对应的一个subtitle,理解作者在做什么足够。
其中,
主要的文章算法核心在下图:
Comparison of pseudotime methods. Pseudotime methods(four kinds of method) may generally be broken down into three stages: gene selection, manifold learning, and cell organization.
从而作者提出了一些现存方法的局限性,
A current limitation of these methods is their reliance to varying degrees on assumptions about the underlying shape of the data (数据潜在形态的假设几何对后期分型影响很大)(e.g. a tree, bifurcating trajectory, etc.)
而他们开发的DPT,也就是最后一种方法:provideing two significant advantages over other pseudotemporal techniques. First, working directly on a diffusion map does not require any greedy computational steps(层级聚类的经典算法,每一步都是贪婪模型,也就是局部最优而不是树的全局最优). Second and most importantly, because DPT operates directly on the diffusion space, it features the least coarse graining or over-fitting of data into low-dimensional assumptions(DPT的工作对象是整体的扩散空间,而不是二分支结构以及树状结构,所以可以以最小的粗粒度过拟合到低维空间).
文章最后的验证:
三种降维分析的验证以及模拟数据点的jaccard index similarity validation in jaccard graph ,I mentioned in one piece of previous blog
文章整篇都是叙述性的算法介绍,而没有任何公示和代码stick up。就本人拙见,比较重要的机器学习思维是其中的manifold learning,pseudotime method,以及根据MFL衍生出来的降维分析方法。
在这里贴一个MFL的CSDN博文,人家讲的贼好。
https://blog.csdn.net/chl033/article/details/6107042
转载于:https://www.cnblogs.com/beckygogogo/p/9195248.html
Manifold learning-based methods for analyzing single-cell RNA-sequencing data相关推荐
- 深度学习文本分类文献综述(翻译自Deep Learning Based Text Classification: A Comprehensive Review)
深度学习文本分类文献综述 摘要 介绍 1. 文本分类任务 2.文本分类中的深度模型 2.1 Feed-Forward Neural Networks 2.2 RNN-Based Models 2.3 ...
- (论文笔记)EEG fading data classification based on improved manifold learning with adaptive neighborhood
EEG fading data classification based on improved manifold learning with adaptive neighborhood select ...
- Deep learning based multi-scale channel compression feature surface defect detection system
基于深度学习的多尺度通道压缩特征表面缺陷检测系统 Deep learning based multi-scale channel compression feature surface defect ...
- 跌倒综述 Deep Learning Based Systems Developed for Fall Detection A Review
文章目录 1.基本信息 2. 第一节 介绍 3. 第二节 跌倒检测系统文献 4.第三节 讨论和未来方向 5. 第四节 结论 6. 参考文献 1.基本信息 题目:Deep Learning Based ...
- 简明深度学习方法概述 Deep Learning:Methods and Application
简明深度学习方法概述 Deep Learning:Methods and Application 人工智能 小林子 7个月前 (03-05) 2558℃ 0评论 作者:@神一手golden ...
- Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels
Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels Abstra ...
- A Survey of Zero-Shot Learning: Settings, Methods, and Applications [reading notes]
原文链接:https://joselynzhao.top/2019/04/15/A-Survey-of-Zero-Shot-Learning_-Settings,-Methods,-and-Appli ...
- 论文翻译七:Adversarial Transfer Learning for Deep Learning Based Automatic Modulation Classification
30天挑战翻译100篇论文 坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长- Adversarial Transfer Learning for Deep Learning Based ...
- 论文翻译:2021_语音增强模型压缩_Towards model compression for deep learning based speech enhancement...
论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...
最新文章
- 解压zip_康巴汉子“型男”zip,点击解压
- python访问数据库日志文件_python利用inotify实现把nginx日志实时写入数据库
- 关于function和Object的认识
- sas Data步数据读取流程详解
- JS 动态显示 获取下拉框的多个值
- 朱松纯:从人工智能的角度解读《赤壁赋》兼谈“心”与“理”的平衡
- Java *1.13(代数:求解2 × 2线性方程组)可以使用Cramer法则解下面的2 x 2线性方程组,假定ad-bc不为0:
- Ubuntu18.04安装Mujoco、mujoco_py
- 基于FPGA的RS232异步串行口IP核设计
- Win10计算机默认排序,win10系统文件夹自动排列怎么取消?win10文件夹不自动排列设置方法...
- Java 线上问题排查思路与工具使用
- 关于海盗分金币问题的讨论(面试题)[]
- 四足机器人的六种步态特征
- 如何撰写高水平的学术论文
- 数电实验七:译码显示电路
- 知名互联网大厂——推荐算法工程师、专家、leader
- 公务员考试题汇集之逻辑推理
- Mac上有哪些冷门但却逆天的软件?
- gitlab下载单个目录,git克隆指定的目录
- 阿里云APA云服务助理认证 第1章: 阿里云简介
热门文章
- 淘宝内核月报 2017
- 算法笔记_096:蓝桥杯练习 算法提高 求最大值(Java)
- execv shell_exec系列函数(execl,execlp,execle,execv,execvp)使用
- solr 高并发_Solr搜索引擎 — SolrCloud介绍和环境准备
- extjs 按钮小箭头展开panel_汽车按钮都是英文看不懂?视频教你认清车内所有按钮,看完秒懂...
- mysql in 数字类型_关于sql where id in 转换成数据类型 int 时失败
- Python机器学习:多项式回归与模型泛化008模型泛化与岭回归
- antdesign 地图_React 使用recharts实现散点地图的示例代码
- matlab编程的步骤,如何画matlab程序的流程图?求解答
- python英文词频统计去除定冠词_使用Python进行英文词频统计