samtools + bcftools
samtools + bcftools处理 一个donor 的800多个细胞
# conda activate ngs/public/home/djs/software/tools_NCBI/sratoolkit.2.10.9-ubuntu64/bin/prefetch-orig.2.10.9 --option-file /public/home/djs/huiyu/20220613_scRNA_VAF/SRR_Acc_List.txt -X 1000G -p -r yes -c -O /public/home/djs/huiyu/20220613_scRNA_VAF/ -t httpls |while read id ;do echo "~/software/tools_NCBI/sratoolkit.2.10.9-ubuntu64/bin/fasterq-dump --split-3 ./$id/${id}.sra" >> fasterq_dump.sh; done
ParaFly -c fasterq_dump.sh -CPU 10 >out.log 2>err.logmkdir {QC_1,QC_2,clean_data}ls |grep ".fastq" | while read id ;do (fastqc -o ./QC_1 $id &);donecd QC_1
mkdir multiqc
multiqc ./ -o ./multiqccd ../
ls |grep "1.fastq" > 1.txt
ls |grep "2.fastq" > 2.txt
paste 1.txt 2.txt > trim.txt
cat trim.txt |while read id;do a=($id) && ~/software/TrimGalore-master/trim_galore -q 25 --phred33 --stringency 3 -o ./clean_data --paired ${a[0]} ${a[1]}; donecd clean_data/
ls |grep "report" |while read id ;do rm $id ;done
ls |grep "val.*fq" | while read id ;do (fastqc -o ../QC_2 $id &);done
cd ../QC_2/
mkdir multiqc
multiqc ./ -o ./multiqccd ../clean_data
ls |grep "val_1.fq" > 1.txt
ls |grep "val_2.fq" > 2.txt
paste 1.txt 2.txt > map.txt
cat map.txt |while read id;do a=($id) && echo "/public/home/djs/software/bwa-0.7.17/bwa mem /public/home/djs/software/bwa-0.7.17/index_bwa/human_38/human_ref ${a[0]} ${a[1]} > ${a[0]}.sam";done >> mapping.sh
nohup ParaFly -c mapping.sh -CPU 20 >out.log 2>err.log &# sam_to_bam && sort && indexls |grep "fq.sam" |while read id ;do echo "samtools view -u ${id} | samtools sort - > ${id}.sort.bam && samtools index ${id}.sort.bam" ;done > sam_to_bam.shnohup ParaFly -c sam_to_bam.sh -CPU 20 >out.log 2>err.log &# samtools mpileup && bcftools calling
ls |grep "sort.bam" | grep -v "bai" |while read id ;do echo "samtools mpileup -uf /public/home/djs/software/STAR-2.7.7a/genome_raw/GRCh38.primary_assembly.genome.fa ${id} >> ${id}.bcf && bcftools view -v snps ${id}.bcf > ${id}.vcf && java -Xmx8g -jar /public/home/djs/software/snpEff/snpEff.jar -c /public/home/djs/software/snpEff/snpEff.config GRCh38 ${id}.vcf >> ${id}.ann.vcf";done > snv_calling.sh
nohup ParaFly -c snv_calling.sh -CPU 20 >>out.log 2>>err.log &
samtools + bcftools相关推荐
- Bcftools的下载与安装
写在前面 第一次写这玩意,文笔啥的大家见谅!主要是对自己的学习过程记录一下,话不多说上正菜.bcftools是在处理数据时经常用到的辅助软件. 下载过程: wget https://github.co ...
- 安装bcftools
以为conda是万能的 就是bcftools 老说我缺lib 又没有root权限安装不了于是 然后就卸了 conda remove -- force bcftools (防止那些依赖的软件也被卸掉) ...
- install tabix/bgzip
bgzip – Block compression/decompression utility tabix – Generic indexer for TAB-delimited genome pos ...
- HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.com/pkgs/main/linux-64/tqdm-4.64.0-py39h06
项目场景: 使用SAMtools/BCFtools做下游分析,BCFtools是一个用来识别变异和处理VCF和BCF文件的集成工具包,通常它会被集成在SAMtools里面. 问题描述 使用:conda ...
- 肿瘤免疫新抗原鉴定(一)OptiType安装与运行
OptiType(v1.3.3) Precision HLA typing from next-generation sequencing data (一)需要安装的依赖软件或库 1. Python ...
- Linux yest2图形安装ftp,(伪)从零开始学转录组:软件安装
生信技能树的转录组学习开班了, 第一个任务是安装软件, 于是我花了一个下午时间和Linux斗智斗勇. 系统准备 windows10: Unbuntu on windows10. 至于如何win10上开 ...
- 如何用软件模拟NGS数据
如何用软件模拟NGS数据 为了评价一个工具的性能,通常我们都需要先模拟一批数据.这样相当于有了参考答案,才能检查工具的实际表现情况.因此对于我们而言,面对一个新的功能,可以先用模拟的数据测试下不同工具 ...
- 全基因组完整数据实战
一个人全基因组完整数据分析脚本 人全基因组分析一直是整个测序行业最重要的内容之一,随着各种测序仪性能的快速提升,人全基因组测序价格越来越便宜,周期越来越低,可以预见,即将有越来越多的人全基因组被测序出 ...
- htslib/sam.h库使用说明
介绍 samtools用来处理SAM/BAM文件,包括htslib,samtools,bcftools,pysam是python语言对samtools的封装,有着完整的说明文档.但是如果要用C/C++ ...
最新文章
- MySQL数据表的优化
- 使用JSON.parse(),JSON.stringify()实现对对象的深拷贝
- dat文本导入mysql_mysql学习笔记(九) 增删改查的优化
- centos7虚拟机安装mysql_Linux CentOS7 虚拟机安装mysql教程
- Q122:PBRT-V3,提高Monte Carlo积分计算效率的方法——Russian Roulette和Splitting(13.7章节)
- vsftpd不支持目录软链接的解决办法
- 2022-2027年中国电动汽车充电站及充电桩行业市场深度分析及投资战略规划报告
- Mac OSX 下破解软件的一般方法及过程、 mark一下
- 杭州电子科技大学计算机研究生很好考吗,杭州电子科技大学考研难吗?一般要什么水平才可以进入?...
- android版本内存卡,版本等级繁多 教你如何挑选手机内存卡
- TypeError: empty() received an invalid combination of arguments 报错
- 肇事逃逸人会受到什么处罚
- Python生成彩色字符画
- Tree03-TreeAndTreeMethod
- echarts自定义X轴、Y轴间距
- 吃饱没事做之——爬楼梯题复杂化
- Let the Flames Begin(约瑟夫环)
- Windows安装IDEA详细步骤
- 程序员快速阅读,绝对不是神话
- Vue自定义域过滤器和管道符