生物信息学习的正确姿势

NGS系列文章包括NGS基础、在线绘图、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程)、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step))、批次效应处理等内容。

之前整理的一篇大综述 — Nature重磅综述 |关于RNA-seq,你想知道的都在这收到了热烈反响,阅读人数过万。

行文很长,最后精炼下来的文字近三万,适合深度阅读思考。

上次发出时,有读者留言说部分专业名词不理解。为了方便理解和对综述有个概览,特整理了下面的思维导图,对应原文,共计8个大标题,大标题下又分有小主题,各个分支介绍有每个主题的主要内容及采用方法。

内容已发布在石墨文档,链接如下

https://shimo.im/mindmaps/qQVV3r3Pqx8DVGjC/ 《RNA-seq思路图(欢迎大家备注、修改,可先创建副本,在副本文件修改)》,可复制链接后用石墨文档 App 或小程序打开

Note:想要打开全部分支、添加备注或修改信息,请先创建副本,在备份文件打开修改,原文件不支持修改

原文在深度总结了RNA-seq这些年的同时,还分享了文中一些名词的解释,编译分享如下,希望有助于进一步理解学习。

  • NGS基础 - FASTQ格式解释和质量评估

  • NGS基础 - 高通量测序原理

  • NGS基础 - 参考基因组和基因注释文件

  • NGS基础 - GTF/GFF文件格式解读和转换

  • NGS基础 - 测序原始数据下载

  • 如果不是没有钱,谁想测3个重复?

  1. Read depth Read深度:一个样本测序得到的reads数;容易和基因组测序的覆盖度 (多少基因组区域被测到了)和测序深度混淆 (单个核苷酸被测到的次数或所有核苷酸被测到的平均深度)。

  2. Short-read 短读长:测序得到的长度最大是500 bp的reads,常见的测序片段长度为100-300 bp;本文中的短读长测序片段代表测到的mRNA片段和降解了的mRNA。

  3. Long-read 长读长:测序得到的超过1000 bp的reads,本文中代表全长或近乎全长的mRNA。

  4. Direct RNA sequencing (dRNA-seq): 直接测序RNA而非cDNA的测序技术,通常用于测序全长或近全长的mRNA 。

  5. Multi-mapped reads 多重比对的reads:从转录组同源区域测序得到的reads,不能精确确认其转录本或基因组的来源。

  6. Synthetic long reads 合成long reads:通过组装多个短读长得到长读长的方法。

  7. 唯一分子标识符(UMIs):在扩增前,构建RNA-seq文库的时候加入的短序列或barcodes,理想情况下每条转录本结合一个唯一的标识符,含有此标识符的reads都来源于此转录本,定量时只计算一次。可以用来降低RNA-seq的定量偏好性,在RNA起始量低的单细胞实验中尤为适用。

  8. Read length 读长:单个测序reads的长度,short-read RNA测序得到的长度通常是50-150 bp。

  9. Sensitivity 敏感性:样本中多大比例的转录本会被测到,敏感性越高,这一比例越高。它受样本处理、文库制备、测序和计算偏好性的影响。

  10. Specificity 特异性:度量差异表达转录本被正确鉴定出的比例的方法,它受样本处理,文库制备,测序和计算偏好性的影响。

  11. Duplication rates 重复Reads比率:比对到转录组相同位置的的测序reads的比例。在RNA-seq文库中,一些转录本可能有高的重复率,因为它们在样本中表达水平高。高表达的基因的重复率很高,而低表达基因的或许有着最小的重复率。由此RNA-seq面临着一个挑战,该技术中大部分重复可能是高表达转录本带来的真实信号,而另一些则是由于扩增和测序偏好性造成的。

  12. Single-end sequencing 单端测序 (SE):只测序cDNA片段的一端,因其费用低,常用于只关注差异基因表达的项目中。(NGS基础 - 高通量测序原理)

  13. Paired-end sequencing 双端测序 (PE):cDNA片段两端分别测序,可以测序到cDNA的更多碱基,更好的识别剪接位点,常于差异基因表达分析项目。

  14. 生物学重复:对生物来源不同的样本的多次检测,比如来自三个个体的组织,用于捕获生物个体自身的变化;这个变化要么是待研究的对象,要么是噪音。相较之下,技术重复是对同样的样本做重复的操作—比如,对一个组织做三次处理。

  15. Expression matrix 表达矩阵:差异表达RNA-seq项目的核心数据文件。每一行代表一个RNA,比如基因或者转录本。每一列是一个测序的样本。矩阵中的数值是每个RNA的reads数。这些可能是对转录异构体的计数估计,并通常在后续的分析前先进行标准化转化。

  16. Spike-in control 内参:按特定浓度添加到样品中的外源核酸库。它们通常是预先合成的不同浓度的RNA,用于监测反应效率和技术方法的偏差和假阴性结果。

  17. Spatialomics 空间转录组学:能保留给定样本(通常是组织切片)中每个转录本的空间信息的转录组分析方法。

  18. Nascent RNA 新生RNA:刚刚转录出来的RNA,与已经加工并运输到细胞质的RNA相对应。

  19. Translatome 翻译组:细胞、组织或生物体中正在翻译成蛋白质的mRNA集合。

  20. Structurome 结构组:细胞、组织或生物体中RNA的二级和三级结构集合。

  21. Interactome 互作组:细胞、组织和生物体中分子相互作用的集合,包括有RNA-RNA或者RNA-蛋白质的相互作用。

  22. Differential gene expression (DGE) 差异基因:两个实验组中表达显著变化的基因。

你可能还想看

往期精品(点击图片直达文字对应教程)

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

Nature重磅综述|关于RNA-seq,你想知道的都在这(续)相关推荐

  1. Nature重磅综述 |关于RNA-seq,你想知道的都在这

    编译 |生信宝典,May 校对 |生信宝典 ▼生信学习的正确姿势(第三版) NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 ...

  2. Nature重磅综述|2022年最新生物信息学,你想知道的都在这里!

    培训背景 四大专业课程   助您发顶刊 课程一: 深度学习基因组学专题线上培训班         课程二: 机器学习单细胞分析应用专题线上培训班    课程三:单细胞空间转录组应用专题线上培训班   ...

  3. RNA-seq最强综述名词解释思维导图|关于RNA-seq,你想知道的都在这(续)

    前言 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅综述:三万字 ...

  4. Cell重磅综述:关于人类转录因子,你想知道的都在这

    ▼生物信息学习的正确姿势(第三版) NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细 ...

  5. 重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)

    原文链接: https://www.embopress.org/doi/10.15252/msb.20188746 主编评语 这篇文章最好的地方不只在于推荐了工具,提供了一套分析流程,更在于详细介绍了 ...

  6. 一文掌握RNA seq,RNA seq课程大汇总

    RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...

  7. 【75位联合作者Nature重磅】AI药神:机器学习模型有望提前五年预测白血病!

    [新智元导读]来自全球多家科研机构的75位科学家在<自然>发表了一项重磅研究:使用血液检测和机器学习技术,可以预测健康个体是否有患急性骨髓性白血病(AML)的风险.这项研究意味着我们可以提 ...

  8. 易基因|深度综述:RNA m5C修饰的生物学及在肿瘤发生和免疫治疗中的作用

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2022年4月1日,<Biomark Res>杂志发表了题为"Biological roles of RNA m5 ...

  9. “衰老标志物”重磅综述:细胞衰老、器官衰老、衰老时钟及其应用

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 随着人口老龄化程度不断加深,实现"健康老龄化(healthy aging)"已成为我国乃至世界迫切需要解决的重大社会 ...

最新文章

  1. Ubuntu 系统 下 AndroidStudio 工具 使用ctrl+z 回退上一步的方法
  2. 除了数据还是数据?2018年5大 AI (人工智能)预测
  3. Java 常用类库 之 Random 随机数类实例
  4. 算法 求和为n的连续正整数序列 C
  5. mongodb java 开源_MongoDB Java环境下的开发
  6. 服务发现框架选型,Consul还是Zookeeper还是etcd
  7. java刷卡机_JavaPOS
  8. DBA_Oracle Table Partition表分区概念汇总(概念)
  9. Opencv和C++实现canny边缘检测
  10. 社交电商带直播电商功能,可以DIY前端,可以H5和小程序一般商城常用功能齐全
  11. 生成对抗网络(GAN)原理和实现
  12. 一场全能的开发者大会,来自助力开发者成功进阶的华为云
  13. Java 注解 (Annotation)浅入深出
  14. web前端入门教程(非常详细)
  15. vmware workstation server 服务无法启动
  16. 第十三周助教心得体会
  17. linux如何使用磁盘阵列卡,Linux的RAID磁盘阵列与阵列卡
  18. 服务器配置443端口报错
  19. r星服务器无响应,gta5r星游戏服务器出现了未知错误 | 手游网游页游攻略大全
  20. linux内核ddr初始化,嵌入式Linux裸机开发(五)——SDRAM初始化

热门文章

  1. 【JSP】JSP的四种作用域
  2. 【数字逻辑设计】卡诺图
  3. 移动石头游戏中的博弈问题(洛谷P4136题题解,Java语言描述)
  4. 软件项目管理第二课—项目投标准备工作及投标函
  5. Skype for Business Server 2019 本地部署
  6. JPA与Hibernate的关系
  7. Linux 双网卡绑定
  8. LeetCode - Combinations
  9. C++:类模板与模板类
  10. 插入排序(java版)