RNA测序研究现状与发展

  • 1
  • 2,584
  • A+
所属分类:Transcriptomics
收  藏

通常来说,某一个物种体内所有细胞里含有的DNA都应该是一模一样的,只是因为每一种细胞里所表达的RNA之间存在差异,才使这些细胞有所区别。诸如“为什么肿瘤细胞与正常细胞会不一样?”这样的重要问题都可以通过对这些不同细胞里的RNA进行研究来解决,比如转录组学(transcriptome)研究就是一个很好的方法,而这就需要用到RNA测序技术。本期的《自然 方法》(Nature Methods)杂志隆重推出了国际RNA测序基因组注释评价项目协会(RNA-seq Genome Annotation Assessment Project, RGASP)发表的两篇文章,这两篇文章向我们介绍了RNA测序领域的现状。RNA测序(RNA-seq)是最近兴起的一种基因表达研究技术,不仅可以对基因表达的情况进行整理、归类(cataloging),也可以对基因表达情况进行比较。国际RNA测序基因组注释评价项目协会(international RGASP consortium)最近发表的两篇论文报道了一场竞争程度相当激烈的、大规模的RNA测序热潮,各国的科学家们都在寻求最佳的RNA测序分析算法,而且结果也是出人意料的丰富多样。

我们往往喜欢将某一个物种的基因组比喻成该物种的“生命秘籍(book of life)”。

可为了解决基因表达问题,我们还需要另外一本秘籍。

那就是转录组,我们不妨将之比作“生命杂志(newsstand of life)”,如下图所示。

转录组重建工作,就好像是把被碎纸机粉碎的杂志又一本本地重新拼接起来。

有很多杂志(即RNA)每一期都“印刷”了很多本,其中有一些可能还有存货,还有一些留在报刊亭里,可是有一些却早就被“卖光”了。在过去,经销商们只会关注销量最好的杂志,而这种杂志每一本都非常贵,所以你可能也就买得起几本而已(喻指RNA研究技术和相关产品非常少,而且价格昂贵,科研人员只能对比较重要、热门的几种RNA进行研究)。可是现在,由于测序技术,以及相关技术的飞速发展,你可以把报刊亭里的所有杂志全都买回去,而且价格还不贵。唯一的区别就是经销商卖给你的并不是一本本的杂志,而是先把所有的杂志全都放进碎纸机里,然后把一大堆碎纸条卖给你。幸运的是,在这个虚拟的世界里,还有那么一大帮热心的社会改良家来帮忙整理碎纸条(tape-wielding dogooders,这帮人就是我们现实生活中的计算机程序开发人员),帮助我们将碎纸条还原成一本本的杂志。还有一群像RGASP这样的统计狂热分子也跑来凑热闹,他们组织了一场比赛,看看哪些人整理碎纸条的效率最高,准确率最高,能够又快又好地还原出杂志的本来面目。这个整理、拼接碎纸条的工作就是“转录子重建(transcript reconstruction)”工作,这也是Steijger等人的文章里最关注的工作。而转录子重建工作的重点内容之一就是将RNA测序得到的片段信息与该RNA来源细胞的基因组对应起来,这就是Engström等人的文章里最关注的工作。

老实说,这场比试的结果有点让人失望。尽管从事这项工作的工作人员数量很多,重建工作的准确率(通过好几种方法和多种测序指标评价)却远远不及100%。以我们人类基因组为例,目前还没有一种转录子重建方法的准确率(以平均敏感度和准确性评价)能够达到60%。在线虫和果蝇重建工作中的准确率会稍高一些,但是这两种生物的基因组要比我们人类的基因组小得多,也要简单得多。而且这3个物种都是迄今为止被研究得最充分、最深入的3个物种。有很多物种只是最近才完成基因组测序工作,并没有太多时间完善这些物种的基因组序列,因此,对这些物种而言,它们的转录子重建工作会更加困难,准确性会更低。

从理论上来说,RNA测序其实是一个非常简单的过程,只需要分离、得到RNA样本,然后用高通量测序仪对这些RNA样本进行测序,最后拼接出RNA序列就行了。那么问题究竟出在哪里呢?主要存在以下几个方面的问题:

1. 我们获得的RNA样本与我们拿来最比较的基因组可能不是同一个来源的。这一点在人类基因组研究工作中尤为突出,因为人类参照基因组就是来自好几个人的基因组序列;

2. RNA样本的制备过程可能有问题,其中包含了未经充分处理的RNA,或者其它转录子的噪音。而且测序的深度越深,这种问题就表现得越明显,这也刚好解释了为什么测序深度比较深的时候转录子重建工作的准确率会下降;

3. 测序技术本身的问题。绝大部分测序技术都会使用到PCR反应,而我们都知道,PCR反应对GC含量高的序列比较“排斥”,所以这个测序过程本身就会自然而然地“偏向”GC含量低的序列。

分辨出哪些RNA序列是真正的序列,哪些只是噪音信号是一个技术大难题,这可能也是导致众多算法所得出的结论千差万别的主要原因。如果在算法中采用了根据之前的数据建立的基因结构模型(model of gene structure),比如Augustus、mGene和Transomics(http://linux5.softberry.com/cgi-bin/berry/programs/Transomics/)等算法的表现要略好于没有使用这些模型的算法,这是因为如果使用了基因结构模型,他们还能够大概知道这些基因是个什么样子。所以要开发出更好的算法,首先就需要建立更好的基因结构模型。不过这需要在技术上有更大的发展。更低的差错率能够提高比对工作的准确性,而获得更长的测序结果,比如使用太平洋生物科技公司推出的测序仪(Pacific Bioscience),则可以让转录子重建工作更容易,甚至不需要进行转录子重建。

虽然RNA测序分析工作的难度非常大,但是我们可以肯定,这项工作无论是对于分子生物学,还是计算机科学都有非常大的促进和推动作用。实际上,本期杂志刊出的这两篇文章都已经有点过时了。基因组学与生物信息学这两大领域都是瞬息万变的新兴科研领域,也许我们今天刚刚开展的工作,写下或者看过的论文,到了明天就被淘汰了。对于协会等组织开展的涉及大量数据的工作这一点表现得尤为突出。眼光挑剔的读者们看完了整篇文章之后,还是不知道在他们的实际科研工作中究竟应该使用哪种算法时可能就会指出,这些研究的意义究竟何在?

不过这类研究工作至少能够起到以下这3点作用:

1. 这些工作提供了一份宝贵的历史材料,让后人可以了解RNA测序等工作始于何时;

2. 为目前的工作提供了一个宝贵的参照系,能够对最新的技术和进展进行检验;

3. 促进了某个项目、协会和组织的建立,推动整个研究领域向前发展。

最后这第3点尤为重要。如果你有机会接触、见证,甚至是亲自参加一次像RGASP,或者是Assemblathon(http://assemblathon.org/)这样的工作,你就会被这群科学家们的创造力、诚实和大度所折服。这些项目并没有获得太多特定的资助,他们所使用的数据可能也不会与某个特定的科学问题非常匹配,也常常会有“如果我们有这些数据该多好”之类的感慨,不过他们总是会竭尽所能地做到最好,这不是因为有人要求他们这么做,只是因为他们自己要求自己这么做。最终的结果可能不会让圈内人(甚至是圈外人)满意。Le mieux est l‘ennemi du bien(至真者,真之敌;至善者,善之敌;至美者,美之敌)这句老话同样适用于基因组学研究工作。

参考原文:

Ian Korf. Genomics: the state of the art in RNA-seq analysis. Nature Methods, 26 November 2013; doi:10.1038/nmeth.2735

Tamara Steijger, Josep F Abril, Pär G Engström, Felix Kokocinski, Tim J Hubbard, Roderic Guigó, Jennifer Harrow & Paul Bertone. Assessment of transcript reconstruction methods for RNA-seq. Nature Methods, 3 November 2013; doi:10.1038/nmeth.2714

原文来自:http://page.renren.com/601484932/channel-noteshow-920050838

转载于:https://www.cnblogs.com/wangprince2017/p/9919298.html

RNA测序研究现状与发展相关推荐

  1. Web数据挖掘的研究现状及发展

    1.Web挖掘概述 随着以数据库.数据仓库等数据仓储技术为基础的信息系统在各行各业的应用,使海量数据不断产生.随之而来的问题是如此多的数据让人难以消化,无法从表面上看出他们所蕴涵的有用信息,更不用说有 ...

  2. 多无人机集群编队国内外研究现状和发展方向

    `多无人机集群编队国内外研究现状和发展方向 - 搜狐网 https://m.sohu.com/a/403671784_99986805?trans=010004_pcwzy –编队控制技术最早是针对空 ...

  3. 单细胞RNA测序研究的实验设计指南(部分阅读)

    本篇内容只了解了数据处理与数据分析两个方面,其余方向与计算的关系不是很大,故没有学习.该篇论文的出版时间为2018,我们以流程了解为主,方法新颖性比较小. 目录 数据处理 Normalization ...

  4. 医学知识推理研究现状与发展

    摘要 知识图谱可以有效地组织和表示知识,被应用于很多高级应用中,比如智能医疗.然而,无论是人工还是自动化构建的医学知识图谱通常是不完整的,这严重限制了它们的使用性能.医学知识推理可以补全医学知识图谱, ...

  5. 【文献阅读】综述:集成式工艺规划与车间调度(IPPS)问题研究现状及发展

    作者:文笑雨 高亮 期刊:重庆大学学报 核心 时间:2021.02 (注:文中的数字代表引用的文献序号) 1.IPPS的3种主要建模方法(依据信息交互方式不同) 非线性方法交互简单,应用广泛.建立混合 ...

  6. 华数机器人码垛_冲压机器人研究现状与发展方向

    机器人是20世纪重大高科技成果之一,机器人产品已在各领域得到了初步应用,为提高世界冲压自动化水平发挥了重要作用.研究冲压机器人的应用现状,分析其发展方向将有助于更好地发展我国的冲压机器人产业. 目前冲 ...

  7. 解析激光雷达中时序融合的研究现状和发展方向

    本文转自:计算机视觉联盟 在自动驾驶领域,基于激光雷达 (LiDAR) 的3D物体检测和运动行为预测是一种普遍的方案.目前绝大部分关于激光雷达的物体检测算法都是基于单帧的.激光雷达的多帧时序数据,提供 ...

  8. 一文解析激光雷达中时序融合的研究现状和发展方向

    在自动驾驶领域,基于激光雷达(LiDAR)的 3D 物体检测和运动行为预测是一种普遍的方案.目前绝大部分关于激光雷达的物体检测算法都是基于单帧的. 激光雷达的多帧时序数据,提供了对于检测物体的多视角观 ...

  9. 3D物体检测、行为预测和运动检测全涵盖,一文解析激光雷达中时序融合的研究现状和发展方向

    近年来,时序信息融合在激光雷达中的研究和应用吸引了一些学者的注意,领域内也涌现出了一些突出的研究工作.在本文中,作者重点介绍了时序融合在 3D 物体检测,以及行为预测和运动检测方面的几篇顶会论文,进而 ...

最新文章

  1. 利用Redis进行全页面缓存的简单Demo
  2. Mysql,再见吧!select * !
  3. 太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)
  4. linux swap 内存交换分区调整
  5. Oracle调用webservice说明
  6. 2018技术卓越奖发布 阿里云数据库POLARDB获最佳创新产品奖
  7. python root什么意思_root是什么意思
  8. linux开发板 pc 通讯_从51单片机到Linux 开发板运行hello world(教程4)
  9. android最新设计规范,Android应用未来的设计规范
  10. matlab求解含两个累加公式的方程,使用fsolve 函数求解含两个参数的多个方程问题,希望有会的人帮...
  11. mysql数据库中命令行下常用命令的操作(增、删、改、查)和数据类型
  12. 情感计算在淘宝UGC的应用
  13. 折腾Java设计模式之状态模式
  14. 触摸屏调出虚拟键盘_苹果最新专利申请被曝光:“真实触感虚拟键盘”可能会用于ipad和笔记本电脑!...
  15. android电视自动关机,Android定时关机问题解决
  16. php libxml安装,关于linux 安装libxml2
  17. 如何从网页上下载内嵌的PDF文件
  18. 解决local class incompatible stream classdesc serialVersionUID = 7170114032608506842, local class seri
  19. 绿巨人(Hulk - Pure CSS)
  20. centos7安裝搜狗輸入法_centos7安装搜狗输入法

热门文章

  1. 控温仪的工作原理介绍
  2. Swift中的泛型(Generics)
  3. WebStorm最全常用快捷键
  4. C++析构函数调用时机
  5. 什么是Nagle算法
  6. GPE监控预警系统-nginx_exporter.md
  7. 宠物、计划生育、宜特居
  8. 华为IPsce以及GRE over IPSec配置练习
  9. 关于今年是计算机寒冬的网络用户看法小汇总
  10. 大数据行业:寒冬并不可怕,关键要靠内功