原始 BAM 文件和 sort 之后 BAM 文件的行数,是一样的。
SEQanswers:BAM is compressed. Sorting helps to give a better compression ratio because similar sequences are grouped together.

bam转回fq时报错: github查找同问题结果1 2 3

 *****WARNING: Query 17 is marked as paired, but its mate does not occur next to it in your BAM file.  Skipping.
*****WARNING: Query 13 is marked as paired, but its mate does not occur next to it in your BAM file.  Skipping.
*****WARNING: Query 223 is marked as paired, but its mate does not occur next to it in your BAM file.  Skipping.

sort -n 后 warning行数变少1,333,109,095变为11,212,985
???:

nohup samtools sort -n S1_T_SRR1273943.bam -o ./S1_T_SRR1273943.sortedByName.bam >log.S1.bam.sortbyname 2>&1 &nohup bedtools bamtofastq  -i S1_T_SRR1273943.sortedByName.bam -fq S1_T_1.fq -fq2 S1_T_2.fq > log_S1_sortedbyname 2>&1 &

用sortbam得到的fq后续分析继续报错

reads: 0 |ERROR: The mate1 read name did not match the mate2 read name. Resynchr onization support needs to be implemented.

?暂时解决方法,提取序列之后可以按照read name排序,然后提取。为何对于排序后的用bedtools bamtofastq得到的结果会后续报错,而samtools fastq暂时没有

samtools sort -n  bam -o sorted.bam| samtools fastq -1 read_1.fq -2 read_2.fq -s singleton.fq -

samtools fastq

一般而言BAM文件都是按照位置信息排序,想要找到配对的reads,要么是根据read的编号进行排序(这个方法要求额外的内存和存储空间),或者就是在提取的时候记录当前的read的ID,再找到另一端ID后释放内存空间。

BAM中reads名称和fq中reads名称差异,mate1 read name----mate2 read name?

bam文件处理 转fq相关推荐

  1. bam文件转fq.gz文件

    bam转fq过程 1.fq文件格式 2.bam文件格式 3.转换思路 3.1 软件bedtools自带功能 3.2 自己写代码 3.3 代码示例 4.参考资料 1.fq文件格式   fastq格式是一 ...

  2. 如何高效地从BAM文件中提取fastq

    在一年前,我写过一篇文章,叫做如何从BAM文件中提取fastq,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过samtools的子命令实现了数据提取,实现功能之后也没有再去思考如何提 ...

  3. bam获取序列_如何从BAM文件中提取fastq

    虽然高通量测序分析最常用的操作是将fastq比对到参考基因组得到BAM文件,但偶尔我们也需要提取BAM文件中特定区域中fastq.最开始我认为这是一个非常简单的操作,因为samtools其实已经提供了 ...

  4. bam获取序列_如何高效地从BAM文件中提取fastq

    在一年前,我写过一篇文章,叫做如何从BAM文件中提取fastq,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过samtools的子命令实现了数据提取,实现功能之后也没有再去思考如何提 ...

  5. linux怎么查看一个bam文件,生信分析过程中这些常见文件的格式以及查看方式你都知道吗?...

    原标题:生信分析过程中这些常见文件的格式以及查看方式你都知道吗? 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据 fastq 之外,还需要准备基因组文件 fasta 格式和基因注释文件 ...

  6. Samtools应用指南-处理Sam与Bam文件

    安装 去官网下载想要的版本 tar jxvf samtools-1.9.tar.bz2 cd samtools-1.9 ./configure --prefix=全路径/samtools-1.9 ma ...

  7. samtools 检测bam文件的完整度

    检测bam文件的完整度 samtools view T_recal.bam|head samtools view T_recal.bam|tail for i in *.bam ;do (samtoo ...

  8. linux bam文件格式介绍,Sam和bam文件说明

    SAM文件 SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息. SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割 ...

  9. bam文件读取_bam格式文件处理大全(一)

    sam文件是短序列比对生成的文件,是二代测序中最核心的文件.在RNAseq,变异检测等分析中,都需要首先生成sam文件格式.bam文件是sam格式的二进制格式,转换为二进制之后,可以减小文件的存储.掌 ...

最新文章

  1. easyui 报表合并单元格
  2. 关于CSS属性display:none和visible:hidden的区别
  3. linux安装磁盘分区设置,Linux安装与磁盘分区.doc
  4. Vestigium-Google CodeJam 2020资格回合问题1解决方案
  5. ubuntu下安装模拟环境carla
  6. RocketMQ写入数据报错RemotingTooMuchRequestException: sendDefaultImpl call timeout
  7. mac安装mysql mysql命令找不到_Mac系统下安装mysql数据库和使用phpMyAdmin可视化
  8. docker使用阿里云仓库上传与下拉images
  9. 最新黑马程序员全套视频-.net视频,大家赶紧来下载吧,看图片水印上的QQ加我索取视频教程
  10. hadoop put命令的格式_hadoop Shell命令详解
  11. LaTeX编写IEEE会议论文字体报错、且参考文献中会议/期刊的名字没有斜体的问题解决
  12. win10 自带wi-fi热点速度太慢怎么办_win10wifi热点速度极慢如何解决
  13. java8 treemap 排序_java中TreeMap排序的示例代码
  14. 计算机网络课程论文:《浅谈交换机、路由器》
  15. 香橙派python编程_香橙派4B Python3.7安装OpenCV
  16. 【BLE MESH】PB-ADV入网详解
  17. iOS 单元测试- 入门学习2
  18. 衡水中学2021年的高考成绩查询,2021年全国百强高中排名,它拥有90%一本升学率,超衡水中学成第一...
  19. 单片机c语言北航,【下载资料】《51单片机学习笔记》北航版
  20. excel的使用技巧大全

热门文章

  1. 汇编语言的C状态寄存器,汇编指令-状态寄存器、cmp、test、jz等指令详细说明
  2. word excel转换成html格式的文件,将PPTWORDEXCEL转换成html格式
  3. P1035 [NOIP2002 普及组] 级数求和
  4. 北大自考计算机与应用,北大自考计算机应用技术上机考试
  5. 如何在Mac上的Pages文稿中升高和降低字符和文本?
  6. ISDN线路编码介绍
  7. 知识的边界----读书笔记
  8. 计算机可以辅助英语写作吗,计算机辅助下的英语写作教学_问答库
  9. 服务器如何搭建FTP
  10. 【网络信息安全】身份认证