合并fastq测序数据

不同泳道的同一个样品测序数据经过质量检查QC后是可以合并的。本例中文件命名情况如下:

示例文件名:83b_S156_L004_R1_001.fastq.gz,其中83b_S156是样品名,L004是泳道,R1是正向序列。

这时候只需要用这个小脚本即可:

ls *R1* | cut -d _ -f 1,2 | sort | uniq \

| while read id; do \

cat $id*R1*.fastq.gz > ../merged/$id.R1_001.fastq.gz;

echo "Sample" $id "Merged";

done

注释

我这里只是取了R1的样品进行merge,所以ls只选取文件名中含有R1的文件;

cut是将文件名以-d后的参数_进行分割,然后选取第1和第2个项(根据实际情况来)作为id;

然后sort进行排序,uniq来去除重复;

最后用循环来合并所有的数据。

批量fastqc

这个就不用说了,就一行:

ls *fastq.gz | while read id ; do nohup fastqc $id & done

但是如果文件数量过多,且内存不足的话可能会出现错误,这时候运行目录下会出现形如hs_err_pid50531.log的文件。

这种时候就需要限制运行的线程数量了:

ls *fastq.gz | xargs fastqc -P 32

其中-P参数表示线程限制,这里是32线程,最好综合考虑内存和CPU的情况。

stringtie进行定量

ls *Aligned.sortedByCoord.out.bam | xargs -I bamfile -P 32 sh -c 'FILENAME=bamfile; stringtie -p 64 -G /ssd/gencode.v37.chr_patch_hapl_scaff.annotation.gtf -o /ssd/cleandata/EVA_Part2/${FILENAME::-69}.gtf bamfile'

This article is under CC BY-NC-SA 4.0 license.

Please quote the original link:https://www.liujason.com/article/1163.html

linux fastQC 操作命令,Linux shell合并fastq测序数据/批量fastqc小脚本|merge|multiqc相关推荐

  1. linux fastQC 操作命令,[Bio-Info]fq文件解析统计工具:FastQC在linux下初应用

    FastQC用于解析统计.fastq文件.下面来简述它在linux中如何启动,以及可能碰到的问题. 效果 从官网下载fastqc $ wget https://www.bioinformatics.b ...

  2. fastq质量值_微生物组16S rRNA数据分析小结:从fastq测序数据到OTU table

    推荐阅读 1.ggplot2绘制曼哈顿图示例2.phyloseq | 用 R 分析微生物组数据及可视化3.R语言PCA分析教程 | Principal Component Methods in R4. ...

  3. 弗雷塞斯 从生物学到生物信息学到机器学习 转录组入门(3):了解fastq测序数据...

    sra文件转换为fastq格式 1 fastq-dump -h --split-3 也就是说如果SRA文件中只有一个文件,那么这个参数就会被忽略.如果原文件中有两个文件,那么它就会把成对的文件按*_1 ...

  4. linux进程操作命令,linux常用进程命令

    1.ps 进程情况查询指令. 指令格式#ps [[选项]] 常用选项: -a,闪现全部用户进程. -e,闪现进程环境变量. -l,给出长列表. -r,只闪现正在工作的进程. -S,添加CPU时间和页面 ...

  5. linux 基本操作命令1

    14的路 Linux基本操作命令 Linux基本操作命令 首先介绍一个名词"控制台(console)",它就是我们通常见到的使用字符操作界面的人机接口,例如dos.我们说控制台命令 ...

  6. NGS数据分析实践:05. 测序数据的基本质控 [1] - FastQC

    NGS数据分析实践:05. 测序数据的基本质控 [1] - FastQC 前言 1. FastQC 1.1 帮助信息及运行代码 1.2 报告解读 1.3 小结 文接上篇:NGS数据分析实践:04. 准 ...

  7. tcga数据下载_给你tcga数据库过万病人的原始测序数据你可以做什么

    最近有两年前的学生过来寻求合作,让我想想给我tcga数据库过万病人的原始测序数据,我可以做什么方法学的创新.我想把这个问题抛给粉丝: 假设给你tcga数据库过万病人的原始测序数据你可以做什么??? 大 ...

  8. linux fastQC 操作命令,linux-ubuntu下fastQC的安裝及使用

    1.fastqc是在Java環境下運行的:所以在安裝fastqc之前,Linux下要有相應的Java運行環境(JRE).且java的版本應該在1.8.0版以上 2.java的安裝:下載最新版本的Jav ...

  9. 《Linux命令行与shell脚本大全》笔记

    初识Linux Shell 什么是Linux Linux可划分为以下四部分: Linux内核 GNU工具 图形化桌面环境 应用软件 深入探究Linux内核 内核主要负责以下四种功能: 系统内存管理 软 ...

最新文章

  1. CloudCompare基础教程(1)-介绍
  2. Spring MVC静态资源处理(转)
  3. linux mailx 发邮件
  4. mysql象限和投影_Camera类之orthographic-摄像机投影模式(第100篇随笔)
  5. java socket聊天工具_java+socket 简易聊天工具
  6. springMVC 前后台日期格式传值解决方式之一(共二) @DateTimeFormat的使用和配置...
  7. Centos7.x下Nginx安装及SSL配置与常用命令
  8. C语言操作符(又称运算符)(2)
  9. MySQL高级之explain详解
  10. 玩转Web之servlet(四)---B/S是如何使用http协议完成通信过程的
  11. 项目QQ音乐开发记录
  12. 一次性存入多少钱就可以有资格跟银行商谈利息了?
  13. 软工大二下半年第十五周学习进度
  14. 4.nslookup
  15. R语言查看包安装路径
  16. weblogic安装及部署
  17. LANDrop局域网文件传输神器
  18. 最新版微信小程序如何引入iconfont阿里矢量图库解决方案
  19. 非线性最小二乘法曲线拟合
  20. 最新《java互联网架构师全套课程》附带代码资料(完整)

热门文章

  1. C/C++动态内存申请与释放
  2. Hibernate tools的hbm2ddl和hbm2java
  3. AUC / uAUC
  4. Orcad Capture CIS
  5. 卧槽,泪目了!二哥被读者的深情告白了感动哭了!!!!
  6. 5G消息来了,它会干掉微信还是变成另一个飞信?
  7. 【修理】电脑维修 显卡错误(错误代码:43)
  8. 【自然语言处理】BERT GPT
  9. iOS 3DTouch的小细节
  10. 电脑开机不能进入系统--死机