测序数据量:

常见的测序量概念有 M 和 G ,for example  10M  和 10G

解释:

M 常用于描述reads 的数量。 例如 10M 就是 10 *10^6 条reads

G 常用于描述这一批次测序共有的碱基数量。 例如 10G 就是10*10^9个碱基

M 和 G 之间的关系

比如说对于3G测序量的理解:

3G指有 5*10^9 个碱基,假如采取illumia的PE150测序,即150bp双端测序,算有多少M测序量的公式为 3*10^9 / 150 / 2 =10 M

测序深度

测序深度 = 测序得到的碱基总个数 / 参考基因组大小

比如说对于30G测序量的人类基因组测序深度是多少?(人类参考基因组3G)

测序深度 = 30*10^9 / 3*10^9 =10X

测序覆盖度

测序获得的序列占整个基因组的比例

测序深度 覆盖率 SNP检出率 研究目的
6-10X 90%-99% 70%-90% 群体结构,群体选择分析等等
30X 99.9%-100% 95%-99% 个体基因组信息
50X 99.9%-100% >99% BSA、癌细胞样本测序、关心突变频率的研究类型

测序数据量,测序深度和测序覆盖度相关推荐

  1. AI实战:深度学习必须使用大量数据?数据量对深度学习的重要性可能超乎你的想象!

    前言 最近,几个CV相关的项目陆续暴露出识别准确率不高的问题,导致客户反应强烈.其实在项目初期时我就指出过,只有千级的训练数据是无法训练出一个准确率高的模型的. 在此写一篇博文记录一下. 正文 < ...

  2. 三代测序数据纠错的方法、装置和计算机可读存储介质与流程

    三代测序数据纠错的方法.装置和计算机可读存储介质与流程 文档序号:15616049发布日期:2018-10-09 21:24 导航: X技术> 最新专利>计算;推算;计数设备的制造及其应用 ...

  3. iMeta | 青岛华大范广益组基于共标签测序数据的高质量宏基因组组装工具MetaTrass...

    点击蓝字 关注我们 MetaTrass:基于共标签测序数据的人类肠道微生物高质量宏基因组组装工具 https://doi.org/10.1002/imt2.46 RESEARCH ARTICLE ●2 ...

  4. 一种PacBio测序数据组装得到的基因组序列的纠错方法

    技术领域 本发明涉及生物信息技术领域,更具体的说,它涉及一种PacBio测序数据组装得到的基因组序列的纠错方法. 背景技术 PacBio是一家测序仪公司,提供第三代测序技术测序平台,他们的测序仪产生的 ...

  5. 单细胞测序数据的降维方法及细胞亚型鉴定聚类方法总结

    图1.细胞亚型的鉴定及分析(Stegle et al. NATURE REVIEWS | GENETICS, 2015) 随着单细胞测序技术的发展,每个研究或实验中测定的细胞数量在显著增加.现在很多单 ...

  6. 单细胞测序数据的降维方法及细胞亚型的鉴定聚类方法总结

    图1.细胞亚型的鉴定及分析(Stegle et al. NATURE REVIEWS | GENETICS, 2015) 随着单细胞测序技术的发展,每个研究或实验中测定的细胞数量在显著增加.现在很多单 ...

  7. 基于 PacBio 测序数据的纠错算法评测与剪切位点识别研究

    基于 PacBio 测序数据的纠错算法评测与剪切位点识别研究 摘 要 高通量测序技术的产生和发展催生了许多大规模基因测序项目, 如国际千人基 因组计划. 英国 UK10K 计划以及中国的百万人群基因组 ...

  8. 16款测序平台性能大PK,华大表现不俗!基于人类和细菌基因组DNA水平的多平台测序数据研究成果发布...

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析  ...

  9. 16款测序平台性能大PK!基于人类和细菌基因组DNA水平的多平台测序数据研究成果发布

    DNA是生命遗传信息的载体,获取DNA序列信息对于基础科研和临床诊断都至关重要.自1977年第一代测序技术问世以来,经过四十余年的探索,DNA测序技术取得了重大进展.随着对测序成本降低的需求,以高通量 ...

  10. 第二、三代基因组测序数据混合拼接软件综述

    第二.三代基因组测序数据混合拼接软件综述 王 昊1,陈 挺2*  (1.清华大学 计算机科学与技术系,北京 10084: 2.清华大学 计算机系.清华大学人工智能研究院,北京 10084)    摘要 ...

最新文章

  1. HTML的标签描述20
  2. 潍坊科技学院计算机学院刘君,2019年山东省高校大学生计算机科技创新大会暨第十一届山东省大学生科技节计算机学会六项赛事研讨会在潍坊科技学院举行...
  3. Linux下Rsync+Inotify-tools实现数据实时同步
  4. 优秀Python学习资源收集汇总(强烈推荐)
  5. 【蓝桥杯Java_C组·从零开始卷】第二节、ifswitch(超级详细,适合入门强化学习,理论与实战双保险(2021年12月30日上午9点直播·视频发布B站)
  6. 【深入浅出MyBatis系列十一】缓存源码分析
  7. ZOJ - 3593 One Person Game(扩展欧几里得)
  8. 【算法笔记】重刷PAT 题解合集
  9. python 函数参数注解_python-如何使用函数注释来验证函数调用类...
  10. 草稿-git的使用-for windows -1006
  11. 小试牛刀:文本处理工具之grep、egrep详解
  12. [国嵌攻略][125][总线设备驱动模型]
  13. libz.dylib的研究 libz.1.2.5.tbd
  14. #6282. 数列分块入门 6
  15. python读文件每一行-Python文件内容按行读取到列表中
  16. 数据改写-数据科学导论
  17. 【TP】TP如何向模板中的js传变量
  18. flash倒计时制作
  19. 电脑调试UC浏览器,或者本机浏览器
  20. VUE element-ui之form表单自定义验证11位手机号码(封装验证规则)

热门文章

  1. 搭建一个属于自己的服务器,并实现内网穿透(外网访问本地服务器功能)
  2. windows应用下面卸载不干净如何解决!
  3. TTime::FormatL 详解
  4. SQL Server的3种恢复模式(Simple,Full,Bulk-logged)
  5. android 模拟器 评测,安卓模拟器哪个更好?四款主流安卓模拟器测评
  6. 李云龙二次元风格化!
  7. 事后诸葛亮分析(小小大佬带飞队)
  8. 山寨google, 新做了1个网站 googler.cc ,做的很山寨 喜欢的朋友可以去看看哈
  9. 【BIT云计算大作业】基于Spark的K近邻(KNN)查询以及K-mer计数
  10. 为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比