RNA-seq最新利器——全长转录组测序

1.三代测序技术PacBio SMRT Sequencing

2005年以来,转录组测序和研究的主流是基于NGS,即所谓的二代测序技术,虽然二代测序技术极大地提高了测序通量,且能够发现novel的转录本,但是由于其先天的缺陷,测序读长只能达到几百个碱基​​(MiSeq可以达到PE300),在转录组结构分析方面,往往效果不尽理想,譬如检测新转录本、寻找可变剪切等,由于需要用算法对转录本进行组装、重构,往往有较高的假阳性。随着三代测序平台PacBio的发展,测序读长已经能够达到平均10kb以上的读长,最大长度甚至能够大于40kb,覆盖了绝大部分典型基因的长度,因此能够很好的弥补由于读长产生的限制。

目前三代测序技术以PacBio RS II SMRT Sequencing为代表,即 Single-Molecule, Real-Time(SMRT) Sequencing,实时单分子测序,测得的序列即为一条转录本序列,无需再经过组装,且能够更加准确的检测可变剪切、新转录本、基因融合等。

以下是Pacbio平台的相关参数:​

表1 Pacbio平台相关参数

​​​​2.基于​PacBio的研究策略

以下为基于Pacbio测序的转录组研究流程​,与常规转录组研究流程区别不大,依次为样品RNA提取、文库制备、测序和信息分析。Pacbio对RNA的起始量要求较高(7ug),建议至少准备3个以上的文库,以覆盖不同长度范围的转录本,且目前建库方式只能是提取PolyA的方式建库。信息分析方面,除了不能定量之外,基本可以进行二代测序的所有分析。

图1 Pacbio研究流程

Pacbio ISO-seq(The PacBio isoform sequencing )为基于Pacbio的转录组测序策略,其流程如下:

图2 Pacbio ISO-seq实验流程

测序完成后,对下机数据进行基本的处理,得到转录本(isoform)序列文件,流程如下:

图3 Pacbio数据处理

3.全长转录组研究案例

以下分享玉米全长转录组研究,​该项目发表于2016年6月, Wang, B. et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. Nat. Commun. 7:11708 doi: 10.1038/ncomms11708 (2016).

(1)研究策略​

图4 玉米全长转录组研究流程

(2)研究结果

该项目共提取6个不同组织,每个样品的RNA加上barcode序列后,混合总RNA建库,建库长度分为6个长度范围(六个文库),每个文库测7-9个cell,以下是测序reads的长度分布,以及与参考数据库的比较。​

​​图5 RNA提取和测序结果

 表2  六个文库的测序量与长度分布​

通过tofu套件对下机数据进行基本的处理后,可以得到全长转录本序列,并且由于每个组织样品有加上barcode序列,可以得到每个组织特有的Isoform。

 图6  样品特有的Isoform鉴定及可变剪切检测

项目对检测的新转录本通过PLEK做了lncRNA预测,并对预测的lncRNA进行来源分类、exon个数分类、长度分类,以及组织间的overlap分析。文章中发现玉米lncRNA有如下特点:

1)鉴定的novelRNA长度整体较长(可能是得益于Pacbio研究平台);

2)大多数lncRNA来源于基因间区;

3)大多数lncRNA为单外显子基因;

4)LncRNA表达量普遍比mRNA低。

图7 lncRNA相关分析

此外,该项目对比了Pacbio测序结果和二代测序结果得到的转录本数据,发现无论是cufflinks还是Trinity,都只能组装得到少数的全长转录本,证实三代测序能够得到更为全面的转录组序列信息。

图8 二代测序组装的转录本与三代测序结果的比较

​(3)文章结论

​1)通过Pacbio测序,能够发现大量的新转录本(57%),因而能够完善基因注释集,并且转录本平均长度显著高于原注释集;

2)Pacbio测序鉴定大量可变剪切,splice site与二代测序数据吻合度较好(90%),剪切位点(acceptor sites,donor sites)的甲基化能够影响剪切体的形成;

3)能够鉴定大量的lncRNA,长度超过原注释集的2倍;

4)鉴定大量的基因融合,且发现反式剪切是形成融合基因的主要原因,inter-chromosomal为主要融合来源。

5)Pacbio测序较二代测序能够得到更加完整的转录本信息。

RNA-seq最新利器——全长转录组测序相关推荐

  1. 凌恩生物美文分享|转录组研究利器——三代全长转录组测序(Iso-Seq)

    近年来,随着高通量测序技术的发展,转录组测序已经成为研究基因表达调控的主要手段.我们知道,很多物种的转录本非常多样和复杂,绝大多数真核生物基因不符合"一基因一转录本"的模式,这些基 ...

  2. 掌握三代全长转录组测序,看这一篇就够了!

    "三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...

  3. 2020.8.26丨全长转录组测序产品概述

    知识点梳理 全长转录组 测序发展史 测序原理 Sanger测序:毛细管电泳测序 illumina测序:制备文库.桥式PCR.可逆终止边合成边测序 SMRT测序:边合成边测序 二代拼接与组装 二代测序: ...

  4. 全长转录组测序在植物中的应用研究进展 赵陆滟,曹绍玉,龙云树,张应华,许俊强

    基因组和转录组测序是生命科学领域的基础 性工作[1].高通量测序技术正向着高通量.低成本.长读取长度的方向发展.一代[2-3] .二代[4-7]测序技术,加快了高通量测序时代的到来,也从单个基因位点的 ...

  5. Iso-Seq3|三代全长转录组分析

    ​Iso-Seq 3 大家都知道全长转录组(Full-length transcriptome)是基于PacBio和Nanopore三代测序平台,它的优势在于无需打断拼接,直接获得包含5'UTR.3' ...

  6. 一文掌握RNA seq,RNA seq课程大汇总

    RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...

  7. 表达谱(DGE)测序与转录组测序的差别

    DGE-seq和普通的transcriptomic profiling相比较有什么不同,有什么特点? DGE就是用酶将mRNA切断,只使用靠近poly A的一小段RNA去测序. #1 由于不是测定mR ...

  8. 易基因-单细胞甲基化测序单细胞转录组测序

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 易基因单细胞甲基化测序&单细胞转录组测序 高通量单细胞DNA甲基化测序简介 单细胞DNA甲基化组学研究很大程度上受制于建库技术, ...

  9. 易基因单细胞转录组测序(smart-seq2)|技术推介

    大家好,这是专注表观组学十余年,领跑多组学科研服务的易基因.今天跟大家介绍一下易基因的新产品:单细胞转录组测序(smart-seq2). 时下火热的10X Genomics公司Chromium解决方案 ...

最新文章

  1. VML 画统计 柱状、饼图、折线
  2. PTA 基础编程题目集 6-8 简单阶乘计算 C语言
  3. 英飞凌AI越野组入门教程
  4. 使用 html 标签嵌入Silverlight程序的一点小问题
  5. 【boundfield】GridView中BoundField与TemplateField的区别_boundfield
  6. IOS--工作总结--post上传文件(以流的方式上传)
  7. Python 得到主机字节序
  8. 栈和排序(贪心+思维)
  9. 使用这些HTTP标头保护您的Web应用程序
  10. 包裹遭联邦快递不正常“转运” 华为:将重新审视双方合作关系
  11. CentOS7和Ubuntu16设置静态ip的方法
  12. python高斯求和函数_选择积分方法—高斯积分
  13. matlab 模糊聚类改进,matlab模糊聚类
  14. 华为21级程序员月薪27万,你怎么看?
  15. 吃字母------线程同步与互斥的学习
  16. 口袋里只有一百块钱,也要活出十个亿的气势
  17. JAVA使用接口实现类的功能------JAVA入门基础教程
  18. 计算机音乐文爱图片,CG/贺敬轩《文爱》[FLAC/MP3-320K]
  19. java校验集装箱柜号是否正确
  20. 了解和掌握Python的函数(文末附python学习资料)

热门文章

  1. 一张图实现3D人脸建模!这是中科院博士生入选ECCV的新研究 | 开源
  2. elasticsearch多表关联查询_Mybatis【15】 Mybatis如何实现一对一的情况多表关联查询?...
  3. 创建maven项目但是总是报错
  4. setTimeOut()
  5. Sci. Adv. | 新算法识别治疗肺动脉高压的候选抗癌药物
  6. Linux(64位)下OpenBabel 2.4.1、python2.7和Ipython实战(二)
  7. redis为什么是cp_面试官:Redis怎么持久化的?如何回答持久化策略呢?
  8. python环境配置是什么意思_python环境搭建
  9. Linux7-常用文件管理命令及系统变量基础
  10. 第八届“数学、计算机与生命科学交叉研究” 青年学者云论坛(5月15日9:00-16:40)...