文献来源:https://doi.org/10.1016/j.cell.2019.01.022

对文献思路进行注释,就是把书读厚的过程。

1、文章的研究背景(我们要研究什么?目前的研究困境是什么?期待的结果是什么?)

人体中所有的细胞都起源于受精卵(zygote),但是我们对于细胞分裂与分化的具体过程并不了解。因此,我们对于特定组织中特定的生理或者病理过程中细胞的动态变化了解甚少。

*我们想得到什么?

基于基因的表达以及表观遗传的信息,了解到细胞的类型以及细胞所处的生物学状态

*目前研究细胞分化的实验方法:

(1)用遗传标签标记单个细胞:如荧光报告基因,高度多样性的DNA条形码文库,可移动的转座元件,Cre介导的重组,基于CRISPR的遗传疤痕。

(2)单细胞测序

  • 目前有限的谱系追踪的文章都研究了啥?
  • 体细胞突变的发现(单核苷酸位点的突变,拷贝数目的变异,短的串联重复序列的变异),这些突变稳定的遗传到子细胞中,但是在“亲缘关系”较远的细胞中缺失。

*为什么用体细胞的mtDNA的突变而不用体细胞的核基因的突变?

体细胞的核基因突变:具有较高的错误率(high error rates),很贵只能应用于有限的规模(limited scale),以及并不能有效的捕捉细胞状态信息(cell state information)。

体细胞的mtDNA的突变:有大量可供研究的变异,小价格负担的起,线粒体DNA突变率相较于核基因而言更高,已有研究间接表明mtDNA的突变在不同组织中用于克隆追踪的可能性。

*这篇文献创新的一个地方:

在一般的单细胞测序数据的分析过程中,我们通常把线粒体基因组当做是数据的噪声(要被去除的,内源的参照),但是这篇文献中尝试把线粒体DNA用起来,去追踪细胞的分化层次关系(证明!它可以!)。

依据:

(1)在单个细胞中,线粒体DNA可以被可靠的检测到。

(2)可以稳定的遗传到子细胞中。

(3)可以被用于精确地确定遗传关系。

(4)可以和细胞状态的测量方法结合。

(5)应用于研究人类样本。

2、ATAC-seq与Chip-seq的区别是什么?

ATAC-seq(assay for transposase accessible chromatin):一种表观遗传学的研究技术。用转座酶切割特定时空点上开放的染色质区域(为何开放?因为此处有转录事件的发生?涉及到调控过程与表达过程。),获得该时空位点上活跃转录的染色质序列。【参考链接http://www.genecreate.cn/ATAC-seq/】

Chip-seq(Chromatin Immunoprecipitation):Chip是染色体免疫共沉淀技术的简称,Chip-seq则将染色体免疫共沉淀技术与第二代测序技术有机的结合起来。通过染色体免疫共沉淀捕捉到与特异性的转录因子结合的序列信息,然后将这部分序列进行测序分析,从而鉴别特定转录因子与基因组的作用特征。【参考链接https://www.cn-healthcare.com/articlewm/20200427/content-1108155.html】

根据对上述概念的梳理,那么我觉得Chip-seq与ATAC-seq之间的异同可以体现在以下方面:

相同点:都是表观遗传学的研究技术,探究转录的过程中,染色体与特定的转录因子的结合情况。

不同点:(1)ATAC-seq解决的是特定时空点上,染色质整体的开放问题。

(2)Chip-seq则针对于特定的转录因子而言,探究转录因子与基因组的结合模式,可能是不同的时空点条件下。

3、关于发育生物学的一些名词

谱系定向(lineage commitment):使用遗传手段对表达特定标记基因的祖细胞亚群进行标记,在后续时间点对其分化命运进行检测。【参考链接zhuanlan.zhihu.com/p/133861128】

细胞分化(Cellular differentiation):指同一来源的细胞逐渐产生出形态结构、功能特征各不相同的细胞类群的过程,其结果是在空间上细胞产生差异,在时间上同一细胞与其从前的状态有所不同。细胞分化的本质是基因组在时间和空间上的选择性表达,通过不同基因表达的开启或关闭,最终产生标志性蛋白质。【参考链接https://baike.baidu.com/item/%E7%BB%86%E8%83%9E%E5%88%86%E5%8C%96】

4、理解文章中用到的每一张图。

(1)这一个组图是要说明:线粒体突变在人类细胞中是稳定遗传的。


每一个细胞中有若干个线粒体。而每个线粒体中又有若干个线粒体DNA的拷贝。随着时间的积累,这些线粒体DNA会发生突变,并在谱系间传递。

补充知识点:

  • 线粒体DNA复制
  • 线粒体复制

原理验证试验:从TF1细胞以及TF1细胞子代提取mtDNA,进行ATAC-seq分析。

构建的一个谱系树,一共传了8代。每一代大概是3个星期。

A图表示ATAC文库中线粒体基因的覆盖率的平均值达3264。每一柱代表上述谱系图中的每一个细胞。颜色表示细胞同一母系来源。
B图,计算了一个Pearson相关系数为0.99996(非常显著相关),比较的对象则是重复测序的细胞样本的高显著突变出现的频率的平方根。显示出线粒体突变能够被ATAC-seq技术稳定的检测到。
C图,有三种不同颜色的峰,横坐标为碱基的质量,纵坐标为密度。即对碱基的测序质量进行了一个统计,峰值代表大多数碱基质量的集中值。蓝色线代表高测序质量的突变。
灰色的纵线代表高置信度变异分布的99%概率阈值(统计学我没怎么学明白,每一步图如何绘制,用到哪些数据,我不太明白)。

*如何理解测序质量?(包括测序质量如何被计算?测序质量的生物学意义是什么?)

这一步得到的结果是什么?我们从中选取出具有高置信度异质性的线粒体基因型用于下一步的研究。


左侧:前面已知的细胞分化的谱系图。
右侧:高显著性的mtDNA的变异的参差聚类图。这些高显著性的mtDNA的突变是上一步筛选出来的。

这独特的编号8003C>T是突变的位点及其所对应的突变的类型。

在这一步骤当中,我们从高置信度的线粒体突变中筛选出,特殊的细胞谱系唯一的突变类型。


E:使用高置信度的mtDNA的突变来重构细胞样本之间的克隆关系。层次聚类能够将所有亚系正确的归类到同一个克隆家族。
F:最近的共同祖先(MRCA)的识别。between clone细胞之间96%,within clone细胞间79%。
(其实也好理解,between clone细胞之间相比于within clone而言相隔了一代,容易区分出来很正常。)
 

*MRCA分析是什么?在谱系追踪中的价值?

MRCA:最近共有祖先。对三个进行分析以确定具有共同祖先的一对(由同一个节点延伸而来)。

一个指标,用于评估谱系重建树的精度。因为重建的过程是通过筛选得到的高置信度的mtDNA突变而实现的,所以这一步就相当于评估mtDNA能否用于重建谱系树?精确度如何?(猜测是用测试集做的,已知谱系分化关系)

解释一下专有名词的意思。如下图E中所示,Between clone指的是A,C,D细胞之间。within clone指的是B,C,D细胞之间(所以英文单词只是一个单词的区别,意思就变了)。显然C,D具有共同的祖先,但是我们就是要看使用我们上述的方法是否能够精确的判断出来。

F:推断了每一类细胞占总体的比率。Experiment代表已知的比例,inferred代表推断的值,通过两者比较,可见推断的平均偏差。
合成样本的反褶积(这个术语我没怎么听懂)。

这一步骤总体在说明,用高置信度的线粒体DNA的突变类型重建谱系发育树的可靠性(用已知的测试集在评估)。


这一环节企图将线粒体基因组的基因型与染色质状态联系起来(不太明白为什么?一个是线粒体的基因,一个是核基因上的情况?是不是说线粒体基因能够将细胞分类,而不同类型的细胞,其特定的基因的表达应该是相似的。从这一方面去想的话,实在是好间接啊)。

染色质状态是否具有可遗传性?那这些持开放状态的基因,我觉得应该是奢侈基因,不是简单的传代增殖了,而是分化的过程已经产生了。那其实这篇文章研究的就是,在细胞分化的过程中,通过线粒体DNA的突变构建谱系树。而在谱系树构建的过程中,染色体状态具有可遗传性(调查的91607个peaks中,8570个peaks具有高度的可遗传性,即与谱系的发育过程相关。这些peaks一般是奢侈基因的位点)。

接下来我们将线粒体基因型与染色质状态配对
每个克隆的信息,并确定了不同的染色质状态,遵循推断的克隆关系。我们近似于成对克隆的线粒体相关性
(图1G;星方法),
并执行了随机效应
每个染色质可及性峰的方差分解
在我们的TF1克隆中(图1H),询问染色质的“遗传”程度
特征存在于总体中。在测试的91607个峰中,8570个峰
高度遗传(>90%方差解释;图1I和
S1G)。
 

G:变异成分模型(为啥要有这个奇怪的东西的存在?)。

总的来说,这说明了ATAC seq对于mtDNA基因分型,以实现准确的克隆追踪,同时提供细胞状态信息。


(2)这一组图要说明:用单细胞基因组(Single Cell Genomics)可以检测到线粒体DNA的突变。

6种主流的单细胞转录组测序技术:CEL-seq2、Drop-seq、MARS-seq、SCRB-seq、Smart-Seq/C1、Smart-Seq2。这6种测序方法的主要区别是,Smart-Seq/C1、Smart-Seq2   是一种全长(full-length)的测序方法,而其他则只是测量部分(?)。

图源https://marlin-prod.literatumonline.com/cms/attachment/a5684cb0-1c39-4a46-be93-be5a90c678e8/gr2.jpg
展示的是这六种常用的测序方法的实验流程。

探究的是这些测序方法能够对线粒体DNA的覆盖率。

从图中我们可以发现,Smart-seq/C1、Smart-seq2这两种方法的表现普遍较好。可以在低测序深度下,得到较高的线粒体DNA的覆盖率。

从图中可以得到一些只发生在RNA上的突变类型。如1672A>G位点,在DNA上很少会发生突变,频率为0,然后在RNA水平上,突变率达到1。

DNA与RNA的突变具有一致性,但是仍然发现一些突变为RNA所特有,比如已经被实验证实的1672A>G的RNA位点的突变(可能受基因编辑影响)。但是大多数的RNA突变是非常低频的,在0.2以下(转录错误或者测序错误)。

也就是通过这一步来证明,大部分mtRNA的突变与mtDNA的突变具有一致性,所以通过对RNA的测序分析(因为我们进行的单细胞RNA测序),可以建立起mtDNA突变与表型的关系。我们测到的RNA的突变可以忠实的反映DNA的突变。


(未完成,临时改变研究方向)

2021/4/26

文献阅读 | 利用体细胞的mtDNA的突变追踪细胞的分化命运相关推荐

  1. 文献阅读:深度学习模型利用生物医学文本上下文关系进行命名实体识别

    文献阅读:利用深度学习模型在生物医学文本的上下文关系中进行命名实体识别 题目 1 背景 2 材料和方法 2.1 GRAM-CNN方法 2.1.1 嵌入方法 2.1.2 GRAM-CNN 2.1.3 C ...

  2. 利用Python, PyQt5,Selenium,百度图像识别API制作文献阅读辅助工具

    开发背景 作为一名科研狗,经常需要读一些外文文献并且做笔记,有时还需要全文翻译以备后用.这时候会遇到一些问题: PDF和CAJ文件直接复制出来的东西含有大量无用的换行符,手动删除十分麻烦: 有的文献是 ...

  3. 文献阅读-Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironment signature

    文献阅读 Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironmental signature Ab ...

  4. SMRT测序文献阅读笔记

    SMRT测序文献阅读笔记 生信start_site关注 0.0912020.12.12 10:33:24字数 4,422阅读 56 单分子实时定量测序技术(SMRT) 写这篇笔记是因为可能以后的工作中 ...

  5. 细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast

    细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast 本文和前一篇阅读的文献之间的关 ...

  6. 文献阅读-Pan-Cancer Analysis of lncRNA Regulation Supports Their Targeting of Cancer Genes in Each Tumor

    Pan-Cancer Analysis of lncRNA Regulation Supports Their Targeting of Cancer Genes in Each Tumor Cont ...

  7. 细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen

    细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen 通过合成生物学筛选ER和Mi ...

  8. 【文献阅读】Expanding the mutation and phenotype spectrum of MYH3-associated skeletal disorders

    [文献阅读]Expanding the mutation and phenotype spectrum of MYH3-associated skeletal disorders 摘要 MYH3的致病 ...

  9. 四位科研牛人介绍的文献阅读经验

     每天保持读至少2-3 篇的文献的习惯.读文献有不同的读法,但最重要的自己总结概括这篇文献到底说了什么,否则就是白读,读的时候好像什么都明白,一合上就什么都不知道,这是读文献的大忌,既浪费时间,最 ...

  10. 条件随机场(Conditional random fields,CRFs)文献阅读指南

    与最大熵模型相似,条件随机场(Conditional random fields,CRFs)是一种机器学习模型,在自然语言处理的许多领域(如词性标注.中文分词.命名实体识别等)都有比较好的应用效果.条 ...

最新文章

  1. React学习笔记3:React脚手架
  2. 第六章:密码破解系统修复
  3. 手把手教你发布自己的CocoaPods开源库
  4. 设计原则:公理系统在编程中的运用
  5. 简单电商购物程序(续1)
  6. 2016陕西省省赛 ACM Rui and her functions B 二分
  7. SharePoint 开发TimerJob 介绍
  8. 怎么改HTML表单数据,form设置的数据怎么添加到table
  9. agile/scrum 如果一切都从解放前开始
  10. VMware 修复可窃取管理员凭据的高危漏洞
  11. 在线等比数列项数生成器
  12. Halcon:立体匹配
  13. 《30天自制操作系统》学习笔记--第8天
  14. hadoop入门学习--WordCount
  15. 如何配置VS使得可以通过域名或IP访问
  16. java 继承list_Java集合—List—继承关系
  17. 2020FME博客大赛——FME在农村地籍调查项目中应用
  18. 雷卯MOSFET场效应管对应品牌料号替代
  19. 基于Nodejs+vue开发实现高校学院网站系统
  20. 文件浏览器ftp服务器,es文件浏览器查看ftp服务器

热门文章

  1. ANTELOPE WASHBASIN | ANTELOPE 洗脸盆
  2. 查看TRP开头的数据量超过1000000的表的index情况
  3. 《计算机网络》笔记摘抄汇总
  4. AUTOSAR-Fee模块
  5. NPN、PNP型三极管的常见问题
  6. Kubernetes-10 K8s集群安全机制
  7. Java项目:SpringBoot人才求职招聘网站
  8. SEO是什么?前端如何进行SEO优化
  9. 由于这台计算机上储存的远程桌面,“由于这台计算机没有远程桌面客户端访问许可证,远程会话被中断”的解决方案...
  10. Python入门——文件读写