linux fastQC 操作命令,Linux shell合并fastq测序数据/批量fastqc小脚本|merge|multiqc
合并fastq测序数据
不同泳道的同一个样品测序数据经过质量检查QC后是可以合并的。本例中文件命名情况如下:
示例文件名:83b_S156_L004_R1_001.fastq.gz,其中83b_S156是样品名,L004是泳道,R1是正向序列。
这时候只需要用这个小脚本即可:
ls *R1* | cut -d _ -f 1,2 | sort | uniq \
| while read id; do \
cat $id*R1*.fastq.gz > ../merged/$id.R1_001.fastq.gz;
echo "Sample" $id "Merged";
done
注释
我这里只是取了R1的样品进行merge,所以ls只选取文件名中含有R1的文件;
cut是将文件名以-d后的参数_进行分割,然后选取第1和第2个项(根据实际情况来)作为id;
然后sort进行排序,uniq来去除重复;
最后用循环来合并所有的数据。
批量fastqc
这个就不用说了,就一行:
ls *fastq.gz | while read id ; do nohup fastqc $id & done
但是如果文件数量过多,且内存不足的话可能会出现错误,这时候运行目录下会出现形如hs_err_pid50531.log的文件。
这种时候就需要限制运行的线程数量了:
ls *fastq.gz | xargs fastqc -P 32
其中-P参数表示线程限制,这里是32线程,最好综合考虑内存和CPU的情况。
stringtie进行定量
ls *Aligned.sortedByCoord.out.bam | xargs -I bamfile -P 32 sh -c 'FILENAME=bamfile; stringtie -p 64 -G /ssd/gencode.v37.chr_patch_hapl_scaff.annotation.gtf -o /ssd/cleandata/EVA_Part2/${FILENAME::-69}.gtf bamfile'
This article is under CC BY-NC-SA 4.0 license.
Please quote the original link:https://www.liujason.com/article/1163.html
linux fastQC 操作命令,Linux shell合并fastq测序数据/批量fastqc小脚本|merge|multiqc相关推荐
- linux fastQC 操作命令,[Bio-Info]fq文件解析统计工具:FastQC在linux下初应用
FastQC用于解析统计.fastq文件.下面来简述它在linux中如何启动,以及可能碰到的问题. 效果 从官网下载fastqc $ wget https://www.bioinformatics.b ...
- fastq质量值_微生物组16S rRNA数据分析小结:从fastq测序数据到OTU table
推荐阅读 1.ggplot2绘制曼哈顿图示例2.phyloseq | 用 R 分析微生物组数据及可视化3.R语言PCA分析教程 | Principal Component Methods in R4. ...
- 弗雷塞斯 从生物学到生物信息学到机器学习 转录组入门(3):了解fastq测序数据...
sra文件转换为fastq格式 1 fastq-dump -h --split-3 也就是说如果SRA文件中只有一个文件,那么这个参数就会被忽略.如果原文件中有两个文件,那么它就会把成对的文件按*_1 ...
- linux进程操作命令,linux常用进程命令
1.ps 进程情况查询指令. 指令格式#ps [[选项]] 常用选项: -a,闪现全部用户进程. -e,闪现进程环境变量. -l,给出长列表. -r,只闪现正在工作的进程. -S,添加CPU时间和页面 ...
- linux 基本操作命令1
14的路 Linux基本操作命令 Linux基本操作命令 首先介绍一个名词"控制台(console)",它就是我们通常见到的使用字符操作界面的人机接口,例如dos.我们说控制台命令 ...
- NGS数据分析实践:05. 测序数据的基本质控 [1] - FastQC
NGS数据分析实践:05. 测序数据的基本质控 [1] - FastQC 前言 1. FastQC 1.1 帮助信息及运行代码 1.2 报告解读 1.3 小结 文接上篇:NGS数据分析实践:04. 准 ...
- tcga数据下载_给你tcga数据库过万病人的原始测序数据你可以做什么
最近有两年前的学生过来寻求合作,让我想想给我tcga数据库过万病人的原始测序数据,我可以做什么方法学的创新.我想把这个问题抛给粉丝: 假设给你tcga数据库过万病人的原始测序数据你可以做什么??? 大 ...
- linux fastQC 操作命令,linux-ubuntu下fastQC的安裝及使用
1.fastqc是在Java環境下運行的:所以在安裝fastqc之前,Linux下要有相應的Java運行環境(JRE).且java的版本應該在1.8.0版以上 2.java的安裝:下載最新版本的Jav ...
- 《Linux命令行与shell脚本大全》笔记
初识Linux Shell 什么是Linux Linux可划分为以下四部分: Linux内核 GNU工具 图形化桌面环境 应用软件 深入探究Linux内核 内核主要负责以下四种功能: 系统内存管理 软 ...
最新文章
- CloudCompare基础教程(1)-介绍
- Spring MVC静态资源处理(转)
- linux mailx 发邮件
- mysql象限和投影_Camera类之orthographic-摄像机投影模式(第100篇随笔)
- java socket聊天工具_java+socket 简易聊天工具
- springMVC 前后台日期格式传值解决方式之一(共二) @DateTimeFormat的使用和配置...
- Centos7.x下Nginx安装及SSL配置与常用命令
- C语言操作符(又称运算符)(2)
- MySQL高级之explain详解
- 玩转Web之servlet(四)---B/S是如何使用http协议完成通信过程的
- 项目QQ音乐开发记录
- 一次性存入多少钱就可以有资格跟银行商谈利息了?
- 软工大二下半年第十五周学习进度
- 4.nslookup
- R语言查看包安装路径
- weblogic安装及部署
- LANDrop局域网文件传输神器
- 最新版微信小程序如何引入iconfont阿里矢量图库解决方案
- 非线性最小二乘法曲线拟合
- 最新《java互联网架构师全套课程》附带代码资料(完整)