测多少数据量?几个G?多少reads?如何换算?

我们看看权威的ENCODE对RNA-seq的测序深度是如何评价的:
Standards, Guidelines and Best Practices for RNA-Seq V1.0 (June 2011)

The ENCODE Consortium

Sequencing depth.

The amount of sequencing needed for a given sample is determined by the goals of the experiment and the nature of the RNA sample. Experiments whose purpose is to evaluate the similarity between the transcriptional profiles of two polyA+ samples may require only modest depths of sequencing (e.g. 30M pair-end reads of length > 30NT, of which 20-25M are mappable to the genome or known transcriptome, Experiments whose purpose is discovery of novel transcribed elements and strong quantification of known transcript isoforms requires more extensive sequencing.

The ability to detect reliably low copy number transcripts/isoforms depends upon the depth of sequencing and on a sufficiently complex library. For experiments from a typical mammalian tissue or in which sensitivity of detection is important, a minimum depth of 100-200 M 2 x 76 bp or longer reads is currently recommended.

[Specialized studies in which the prevalence of different RNAs has been intentionally altered (e.g. “normalizing” using DSN) as part of sample preparation need more than the read amounts (>30M paired end reads) used for simple comparison (see above). Reasons for this include:

(1) overamplification of inserts as a result of an additional round of PCR after DSN and

(2) much more broad coverage given the nature of A(-) and low abundance transcripts.

权威的话转换如下:

根据研究目的决定测序深度:

目的1:通过抓取polyA尾巴建库(只测那些带有polyA尾巴的基因,大多是蛋白编码基因),

寻找样品间基因转录谱的相似性,只需要30M reads,长度大于30nt即可,双端测序,其中20-25M能够回帖到已知转录组上。

目的2:要发现新的转录本,对已知isoform(同一基因由于不同的可变剪接方式形成多种isoform,勉强译为亚型)进行定量分析,

兼顾低表达量的转录本或isoform,就需要100-200M read,长度大于76bp,双端测序。

lncRNA-seq属于这一类型。

注:ENCODE测的是人和小鼠,其他物种不包括在此推荐范围内。

另外,miRNA测序,只需要10M read,每条read长50bp,单端测序。

ChIP-seq,需要20M read,每条read长50bp,单端测序。

销售只说多少G,不说reads数,如何把reads数换算成G呢?

这跟测序长度有关:

PE150或2*150,即 双端测序,每条read长度150bp。

150bp X 2端 X read数 = 数据量

例如,测50M read,150bp X 2端 X 50M read = 15000M = 15G

注:对于双端测序,一个RNA片段,即fragment,也叫read,会测出来2条序列。

SE50或1*50,即 单端测序,每条read长度50bp。

50bp X 1端 X read数 = 数据量

例如,测20M read,50bp X 1端 X 20M read = 1000M = 1G

再絮叨一句:这里的G是碱基数(Gbase,Gb),跟你看到的文件大小(gigabyte,GB)不是一回事哦~

测序公司给你的文件通常是压缩的fastq格式,里面有read ID号,有碱基,有每个碱基的质量。

经验多了看到文件大小就直到数据量够不够,跑一个FastQC或RSeQC就知道了。

详解测多少数据量,几个G,多少reads,如何换算相关推荐

  1. 大数据架构详解_【数据如何驱动增长】(3)大数据背景下的数仓建设 amp; 数据分层架构设计...

    背景 了解数据仓库.数据流架构的搭建原理对于合格的数据分析师或者数据科学家来说是一项必不可少的能力.它不仅能够帮助分析人员更高效的开展分析任务,帮助公司或者业务线搭建一套高效的数据处理架构,更是能够从 ...

  2. group convolution (分组卷积)的计算量详解、卷积计算量特征图大小,池化特征图大小、深度通道deep-wise 卷积

    group convolution (分组卷积)的计算量详解.卷积计算量特征图大小,池化特征图大小.深度通道deep-wise 卷积 提示:最近忙着各种提前批的笔试面试,所以没太多空刷题了都,先复盘一 ...

  3. 稳扎稳打Silverlight(17) - 2.0数据之详解DataGrid, 绑定数据到ListBox

    [索引页] [源码下载] 稳扎稳打Silverlight(17) - 2.0数据之详解DataGrid, 详解ListBox 作者:webabcd 介绍 Silverlight 2.0 详解DataG ...

  4. python归一化处理_详解python实现数据归一化处理的方式:(0,1)标准化

    在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系"压缩"到(0,1)的范 ...

  5. mysql c接口返回自增id_详解mysql插入数据后返回自增ID的七种方法

    引言 mysql 和 oracle 插入的时候有一个很大的区别是: oracle 支持序列做 id: mysql 本身有一个列可以做自增长字段. mysql 在插入一条数据后,如何能获得到这个自增 i ...

  6. mysql 新增返回主键自增id_详解mysql插入数据后返回自增ID的七种方法

    引言 mysql 和 oracle 插入的时候有一个很大的区别是: oracle 支持序列做 id: mysql 本身有一个列可以做自增长字段. mysql 在插入一条数据后,如何能获得到这个自增 i ...

  7. mysql影响行数解析_详解MySQL的数据行和行溢出机制

    一.行 有哪些格式? 你可以像下面这样看一下你的mysql行格式设置. 其实mysql的数据行有两种格式,一种就是图中的 compact格式,还有一种是redundant格式. compact是一种紧 ...

  8. 5G QoS控制原理专题详解-SM策略数据的源头

    相关文章会在公众号同步更新.公众号:5G通信大家学 持续更新的相关5G内容都是直接根据3GPP整理,保证更新内容的准确性,避免通过二手,甚至多手的资料,以讹传讹误导各位同学.如果大家阅读时发现问题,随 ...

  9. 测多少数据量?几个G?多少reads?如何换算?

    关键词: lncRNA表达量低,所以要看lncRNA的表达量变化,就要比普通RNA-seq多测一些. 要兼顾SNP和低表达量的lncRNA,要测得更深一些~ 到底需要测多少数据量呢? 我们看看权威的E ...

最新文章

  1. 2020届秋招个人总结
  2. 看有道难题比赛有恶心感 ,付源码挑战,博客园目前纯速度最快。
  3. C++学习手记四:继承和多态
  4. nodejs---常用npm命令
  5. 如何删除一个VDP服务器
  6. GDI绘图基本步骤总结(经典)
  7. c语言的链表怎么写,写一个C语言的链表记录一下
  8. nginx下目录浏览及其验证功能、版本隐藏等配置记录
  9. 在英特尔® 凌动™ 处理器上将 OpenGL* 游戏移植到 Android* (第二部分)
  10. ArcGIS Server 开发系列(二)--Web ADF 编程
  11. Java菜鸟教程怎么用_菜鸟教程 Java 学习笔记 (基础教程)
  12. Python 随机抽奖
  13. html怎么设置border-radius,CSS border-radius 能做什么?
  14. 分形--朱利亚集合图形1
  15. 达梦数据库安装及连接
  16. 《SQL145题》正式发布!
  17. Clion源码编辑器的学习与实践
  18. misc.imresize
  19. 从零开始学python的第16天
  20. 联萌十一大决战之如日中天 C. Cinderella(灰姑娘新编)

热门文章

  1. npm打包报错ERROR in ./src/main/webapp/app/core解决方法
  2. 基于二级C语言的一些经典小程序
  3. 新手必看,关于ARM的22个常用概念
  4. WHALE 会员指南(第 1 部分)
  5. java订餐系统_Java——吃货联盟订餐系统
  6. 微博舆情 之 特定话题情感分析
  7. 37 篇! Facebook 今年被 CVPR 收录的论文都说了啥?
  8. 数据安全前言技术研究联邦学习
  9. BUUCTF-2020寒假刷题记录
  10. Pattern与Matcher