欢迎关注”生信修炼手册”!

计算测序深度是数据分析中的一个常规操作,常用的工具有以下几种

1. samtools depth

命令如下

samtools depth input.bam > sample.depth

2. samtools mpileup

命令如下

samtools mpileup -A  -Q 0 chrY.bam | cut -f1,2,4 > sample.depth

3. bdetools genomecov

命令如下

bedtools  genomecov -ibam input.bam -d > sample.depth

尽管方法不同,但是输出结果的格式是相同的,示意如下

第一列是染色体名称,第二列是染色体上的坐标,第三列是对应的测序深度。原本以为计算测序深度就是这么轻松的一件事,但是在比较不同方法的输出结果时,却发现部分区域samtools计算的结果和bedtools的结果对应不上,结果如下

第三列为samtools软件计算出来的结果,第四列为bedtools软件计算出来的结果,可以看到,samtools的结果比bedtools少了很多。

为了确定这段区域真实的测序深度,将bam文件导入IGV软件之中进行查看,对应区域的结果如下

从reads来看,确实应该是10和16条,那么samtools计算出来的结果又是什么, 总不可能是samtools的bug吧,作为一个应用这个广泛的软件,不可能有如此低级的错误。

从结果来看,samtools在计算depth的过程中对reads进行了过滤,那么它过滤的原则是什么呢?通过查看bam文件中第二列的flag我找到了规律,143-150bp的reads有以下10条

第二列的flag含义如下

0x91    145 PAIRED,REVERSE,READ2
0x163   355 PAIRED,PROPER_PAIR,MREVERSE,READ1,SECONDARY
0x63    99  PAIRED,PROPER_PAIR,MREVERSE,READ1

可以看到,其中有一个SECONDARY比对,对应数字355,这样的reads有4条,去除这4条之后,就是samtools计算的最终结果了。

作为SAM文件的官方操作工具,samtools内置了对flag的过滤, 而bedtools默认没有进行这样的过滤,只是简单统计了该区域比对上的reads数目。

在使用IGV展示测序深度时,可以用igvtools先计算出tdf文件再导入IGV中,这样比直接导入bam文件快很多。在tdf文件中,其测序深度和bedtools软件的计算结果是一致的,也是只统计了read数目,没有做过滤。

·end·

—如果喜欢,快分享给你的朋友们吧—

原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

更多精彩

  • KEGG数据库,除了pathway你还知道哪些

  • 全网最完整的circos中文教程

  • DNA甲基化数据分析专题

  • 突变检测数据分析专题

  • mRNA数据分析专题

  • lncRNA数据分析专题

  • circRNA数据分析专题

  • miRNA数据分析专题

  • 单细胞转录组数据分析专题

  • chip_seq数据分析专题

  • Hi-C数据分析专题

  • HLA数据分析专题

  • TCGA肿瘤数据分析专题

  • 基因组组装数据分析专题

  • CNV数据分析专题

  • GWAS数据分析专题

  • 2018年推文合集

  • 2019年推文合集

写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

一个只分享干货的

生信公众号

测序深度的计算,你真的掌握了吗相关推荐

  1. 从深度学习计算过程来分析深度学习工作站\服务器的硬件配置

    柯洁和AlphaGo的故事已经结束,输赢显得并不重要,这个天才少年曾落泪哽咽:它太完美我看不到希望.搭载谷歌无人驾驶技术的车辆已经完成200万英里的测试,如今它打算要载人了,无人驾驶真的已经不远.在苹 ...

  2. 了解测序深度用什么软件

    测序深度可以使用许多不同的软件进行计算,其中一些常用的有: FastQC: 检查测序数据质量的开源软件. SAMtools: 一组用于操作SAM/BAM文件的工具,可以用来统计测序深度. BedToo ...

  3. 如何从系统层面优化深度学习计算?

    编者按:在图像.语音识别.自然语言处理.强化学习等许多技术领域中,深度学习已经被证明是非常有效的,并且在某些问题上已经达到甚至超越了人类的水平.然而,深度学习对于计算能力有着很大的依赖,除了改变模型和 ...

  4. 手把手教你从系统层面优化深度学习计算

    来源: 微软研究院AI头条 本文约5643字,建议阅读10分钟. 在图像.语音识别.自然语言处理.强化学习等许多技术领域中,深度学习是非常有效的,并且某些问题已经达到甚至超越了人类的水平.除了改变模型 ...

  5. 【深度学习】基于Pytorch进行深度神经网络计算(一)

    [深度学习]基于Pytorch进行深度神经网络计算(一) 文章目录 1 层和块 2 自定义块 3 顺序块 4 在正向传播函数中执行代码 5 嵌套块 6 参数管理(不重要) 7 参数初始化(重要) 8 ...

  6. 【深度学习】基于Pytorch进行深度神经网络计算(二)

    [深度学习]基于Pytorch进行深度神经网络计算(二) 文章目录 1 延后初始化 2 Pytorch自定义层2.1 不带参数的层2.2 带参数的层 3 基于Pytorch存取文件 4 torch.n ...

  7. 广告深度学习计算:异构硬件加速实践

    丨目录: - 前沿 1. 算力需求与供给 1.1 算力需求:模型复杂度 1.2 算力供给:异构硬件计算能力 1.3 问题与优化方法 2. 算法-系统-硬件协同性能优化 2.1 算法优化 2.2 系统优 ...

  8. 普中科技开发板使用说明书_百度大脑加持,米尔科技FZ3深度学习计算卡评测

    如果你要问我现在电子产业什么最热,那无疑是AI,而基于大数据训练的深度学习技术可以说是目前AI应用的最广,最成功的产品形态了,覆盖我们生活的方方面面,诸如购物.看病.新闻编辑等,在这高深技术的背后少不 ...

  9. zynq无法识别sd卡_百度米尔携手推出FZ3深度学习计算卡!

    前言:百度大脑是百度 AI 核心技术引擎,包括视觉.语音.自然语言处理.知识图谱.深度学习等AI核心技术和AI开放平台. 基于 Xilinx Zynq UltraScale+ MPSoC 的 Edge ...

  10. 二叉树叶子结点,非叶子节点以及深度的计算

    二叉树叶子结点的计算 //统计叶子结点的数目 int LeafNum(BiTree T) {if (!T) {return 0;} else if (!T->lchild && ...

最新文章

  1. Azkaban的Web Server源码探究系列7: ExecutorManager的初始化
  2. 用户名字符串和密码字符串登录验证
  3. Windows平台自动登录telnet批处理文件
  4. 短视频抢了直播饭碗,花椒、映客们逆袭抖音、快手无门
  5. Mapreduce中的分区Partitioner
  6. Axure RP 9基础教程(3)——添加图标元件
  7. EXCEL_20211117_filter平替
  8. Excel潜能系列——Excel游戏 2048
  9. python怎么实现分数形式_python实现将将输入的可约分数化简为不可约分数
  10. ValueError: only one element tensors can be converted to Python scalars
  11. 基于深度学习机器学习的中文期刊分类
  12. TestCenter测试管理工具功能详解十五(T)
  13. 跳过wifi认证直接上网
  14. 数据结构 | 合并两个长度分别为m和n的有序表,最坏情况下需要比较m+n-1次
  15. 浏览器英文快捷翻译工具~~有道词典
  16. 使用Axure RP实现页面跳转、弹窗显示、单选按钮、下拉框以及图片插入
  17. 31.3 Java进阶之lambda方法引用
  18. Wifi wpa_supplicant 到驱动的联系
  19. 计算机读心术的原理,读心术是什么原理,是真的吗
  20. jira字段配置(域配置)_到期日、时间跟踪等根据需要自行配置

热门文章

  1. tcpdump输出内容分析
  2. SpringBoot之整合thymeleaf渲染Web页面
  3. Netlimiter 3.0 注册码
  4. 顺序匹配网络:基于检索的聊天机器人中多回合响应选择的新架构
  5. 我的编程之路上的点滴记录【一】
  6. 计算机单片机考试作弊检讨书,考试作弊检讨书(精选5篇)
  7. 圣诞礼物|2020年送这些礼物你就能拥有一个程序员男朋友
  8. leecode试题 178. 分数排名
  9. python 二项分布
  10. 银河麒麟安装docker-compose体验