bam文件处理 转fq
原始 BAM 文件和 sort 之后 BAM 文件的行数,是一样的。
SEQanswers:BAM is compressed. Sorting helps to give a better compression ratio because similar sequences are grouped together.
bam转回fq时报错: github查找同问题结果1 2 3
*****WARNING: Query 17 is marked as paired, but its mate does not occur next to it in your BAM file. Skipping.
*****WARNING: Query 13 is marked as paired, but its mate does not occur next to it in your BAM file. Skipping.
*****WARNING: Query 223 is marked as paired, but its mate does not occur next to it in your BAM file. Skipping.
sort -n 后 warning行数变少1,333,109,095变为11,212,985
???:
nohup samtools sort -n S1_T_SRR1273943.bam -o ./S1_T_SRR1273943.sortedByName.bam >log.S1.bam.sortbyname 2>&1 &nohup bedtools bamtofastq -i S1_T_SRR1273943.sortedByName.bam -fq S1_T_1.fq -fq2 S1_T_2.fq > log_S1_sortedbyname 2>&1 &
用sortbam得到的fq后续分析继续报错
reads: 0 |ERROR: The mate1 read name did not match the mate2 read name. Resynchr onization support needs to be implemented.
?暂时解决方法,提取序列之后可以按照read name排序,然后提取。为何对于排序后的用bedtools bamtofastq得到的结果会后续报错,而samtools fastq暂时没有
samtools sort -n bam -o sorted.bam| samtools fastq -1 read_1.fq -2 read_2.fq -s singleton.fq -
samtools fastq
一般而言BAM文件都是按照位置信息排序,想要找到配对的reads,要么是根据read的编号进行排序(这个方法要求额外的内存和存储空间),或者就是在提取的时候记录当前的read的ID,再找到另一端ID后释放内存空间。
BAM中reads名称和fq中reads名称差异,mate1 read name----mate2 read name?
bam文件处理 转fq相关推荐
- bam文件转fq.gz文件
bam转fq过程 1.fq文件格式 2.bam文件格式 3.转换思路 3.1 软件bedtools自带功能 3.2 自己写代码 3.3 代码示例 4.参考资料 1.fq文件格式 fastq格式是一 ...
- 如何高效地从BAM文件中提取fastq
在一年前,我写过一篇文章,叫做如何从BAM文件中提取fastq,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过samtools的子命令实现了数据提取,实现功能之后也没有再去思考如何提 ...
- bam获取序列_如何从BAM文件中提取fastq
虽然高通量测序分析最常用的操作是将fastq比对到参考基因组得到BAM文件,但偶尔我们也需要提取BAM文件中特定区域中fastq.最开始我认为这是一个非常简单的操作,因为samtools其实已经提供了 ...
- bam获取序列_如何高效地从BAM文件中提取fastq
在一年前,我写过一篇文章,叫做如何从BAM文件中提取fastq,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过samtools的子命令实现了数据提取,实现功能之后也没有再去思考如何提 ...
- linux怎么查看一个bam文件,生信分析过程中这些常见文件的格式以及查看方式你都知道吗?...
原标题:生信分析过程中这些常见文件的格式以及查看方式你都知道吗? 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据 fastq 之外,还需要准备基因组文件 fasta 格式和基因注释文件 ...
- Samtools应用指南-处理Sam与Bam文件
安装 去官网下载想要的版本 tar jxvf samtools-1.9.tar.bz2 cd samtools-1.9 ./configure --prefix=全路径/samtools-1.9 ma ...
- samtools 检测bam文件的完整度
检测bam文件的完整度 samtools view T_recal.bam|head samtools view T_recal.bam|tail for i in *.bam ;do (samtoo ...
- linux bam文件格式介绍,Sam和bam文件说明
SAM文件 SAM(Sequence Alignment/Map)格式是一种通用的比对格式,用来存储reads到参考序列的比对信息. SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割 ...
- bam文件读取_bam格式文件处理大全(一)
sam文件是短序列比对生成的文件,是二代测序中最核心的文件.在RNAseq,变异检测等分析中,都需要首先生成sam文件格式.bam文件是sam格式的二进制格式,转换为二进制之后,可以减小文件的存储.掌 ...
最新文章
- easyui 报表合并单元格
- 关于CSS属性display:none和visible:hidden的区别
- linux安装磁盘分区设置,Linux安装与磁盘分区.doc
- Vestigium-Google CodeJam 2020资格回合问题1解决方案
- ubuntu下安装模拟环境carla
- RocketMQ写入数据报错RemotingTooMuchRequestException: sendDefaultImpl call timeout
- mac安装mysql mysql命令找不到_Mac系统下安装mysql数据库和使用phpMyAdmin可视化
- docker使用阿里云仓库上传与下拉images
- 最新黑马程序员全套视频-.net视频,大家赶紧来下载吧,看图片水印上的QQ加我索取视频教程
- hadoop put命令的格式_hadoop Shell命令详解
- LaTeX编写IEEE会议论文字体报错、且参考文献中会议/期刊的名字没有斜体的问题解决
- win10 自带wi-fi热点速度太慢怎么办_win10wifi热点速度极慢如何解决
- java8 treemap 排序_java中TreeMap排序的示例代码
- 计算机网络课程论文:《浅谈交换机、路由器》
- 香橙派python编程_香橙派4B Python3.7安装OpenCV
- 【BLE MESH】PB-ADV入网详解
- iOS 单元测试- 入门学习2
- 衡水中学2021年的高考成绩查询,2021年全国百强高中排名,它拥有90%一本升学率,超衡水中学成第一...
- 单片机c语言北航,【下载资料】《51单片机学习笔记》北航版
- excel的使用技巧大全