生信软件的下载与使用方法总结
目录
- 质控
- FastQC
- Multiqc
- 比对
- STAR
- Samtools
- 生成表达矩阵
- FeatureCounts
- 一般都可以通过 conda install 安装,如果不行,再考虑其他方法
质控
FastQC
#安装
#从conda直接安装
conda isntall fastqc
#如果实在没办法,方法二,从官网下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip
unzip fastqc*.zip -d .
cd FastQC
chmod 755 fastqc
fastqc -h#使用
fastqc [-o output dir] [-f fastq|bam|sam] [-t threads] seqfile1 seqfile2 ... seqfileN
FastQC下载地址
Multiqc
#安装
conda install -c bioconda -c conda-forge multiqc#使用
multiqc .
比对
STAR
#安装
conda insall STAR
which STAR #看一下安装成功了没#使用
#先建立索引
STAR --runThreadN 4 --runMode genomeGenerate --genomeDir . --genomeFastaFiles GRCh38.fa --sjdbGTFfile GRCh38.gtf
#对GRCh38建立索引,约需内存32G,4线程下约需要1.5h#比对
STAR --runMode alignReads --runThreadN 4 --readFilesIn seq_1.fastq.gz seq_2.fastq.gz --outFileNamePrefix ../alignment_result/ID. --genomeDir ../ref --readFilesCommand zcat
#3514个单细胞,10线程36小时,内存约32G
Samtools
#安装
conda install -c bioconda samtools#.sam转换成.bam
samtools view -@ 10 -S SRR0011223344.sam -b > SRR0011223344.bam#.bam排序,默认按照染色体位置
samtools sort SRR0011223344.bam -o SRR0011223344.sorted.bam#索引
samtools index SRR0011223344.sorted.bam
报错踩坑
Parse Error
Truncated File.
- 文件里混入了一些莫名其妙的东西,有可能是Standard error 和 Stardard output 的问题。应该检查一下具体的代码时怎么跑的,pipeline是怎么样的,比较直接的办法就是不要贪图简便,把转换和sort的步骤分开跑。
生成表达矩阵
FeatureCounts
#安装
wget -c https://sourceforge.net/projects/subread/files/subread-2.0.0/subread-2.0.0-Linux-x86_64.tar.gz
tar -zxvf subread-2.0.0-Linux-x86_64.tar.gz
#统计conts
../app/subread-2.0.0-Linux-x86_64/bin/featureCounts -T 6 -t exon -g gene_id -a ../ref/GRCh38_ERCC.gtf -o CountsRaw.txt *.sorted.bam 1>FeatureCounts.log 2>&1
生信软件的下载与使用方法总结相关推荐
- 生信软件c语言,科学网—[转载]没有docker我真的不想动这样的生信软件 - 张成岗的博文...
没有docker我真的不想动这样的生信软件 2020-03-26阅读 2620 C语言源代码需要编译的软件 最开始开发者都是C语言流派, 所以标准的源代码安装三部曲即可,即使 configure+ma ...
- 生信软件5 - RIdeogram包绘制染色体密度图
该R包在全基因组测序WGS中可以通过用于描述突变位点在染色体上的分布,在转录组测序RNA-Seq中可用于描述差异表达基因在染色体上的分布,在WGBS中可用于描述DNA甲基化在染色体上的分布等. R包软 ...
- C#,生信软件实践(01)——DNA序列数据库FASTA文件合并工具的源代码
1 生物信息学简介 生物信息学(BioInformatics)是研究生物信息的采集.处理.存储.传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的 ...
- 生信软件2 - 下游比对数据的统计工具 picard
下游比对数据的统计工具 picard Picard是一组命令行工具,用于处理高通量排序数据和格式,如sam/ bam/ cran和vcf文件. 安装 在Linux系统目录下执行以下命令下载软件 wge ...
- 生信软件 | FastQC(质量控制,查看测序质量)
生信软件 | FastQC 介绍 高通量测序数据的高级质控工具 输入FastQ,SAM,BAM文件,输出对测序数据评估的网页报告 安装 conda install fastqc 这里需要安装Conda ...
- 生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
使用wisecondorX可进行拷贝数变异CNV的分析,作者在论文中对比了多种软件的使用效果,可自行根据自己的项目需要,判断是否使用. wisecondrX安装 # conda安装 conda ins ...
- Windows10安装Linux子系统Ubuntu 20.04LTS,轻松使用生信软件,效率秒杀虚拟机
很多优秀的生物信息学软件,如QIIME.QIIME 2.LEfSe等没有Windows版,而使用VirutalBox虚拟机不仅效率低,而且挂载外部硬盘和使用中也经常遇到各种问题,配置和使用详见 - 扩 ...
- Windows10/11安装Linux子系统Ubuntu 20.04LTS,轻松使用生信软件,效率秒杀虚拟机
很多优秀的生物信息学软件,如QIIME.QIIME 2.LEfSe等没有Windows版,而使用VirutalBox虚拟机不仅效率低,而且挂载外部硬盘和使用中也经常遇到各种问题,配置和使用详见 - 扩 ...
- C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码
1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...
- Conda及常用生信软件安装
1 Conda安装 1.1 Conda介绍 Conda是一种开源的软件包和环境管理软件,用于安装和转换不同版本的软件包及环境.其专为Python设计,可用于Mac.Linux和Windows系统. C ...
最新文章
- 10.matlab中sort , min/max以及ceil 函数
- 基于三层BP神经网络的人脸识别
- php-fpm定义成集群资源时报错解决方法
- 用Jsp来实现文件下载功能的几种方式
- Facebook的「下一代 AI 计算平台」长什么样子?
- 在iOS 中使用sleep方法 让程序暂停几秒钟
- 直播|实时音视频抗弱网技术揭秘
- 老赖整治升级,不还钱直接扣微信钱包!
- 2021上半年短视频及电商生态研究报告
- oracle的sql优化
- swagger入门和实践(含docker部署swagger)
- 金万维异速联客户端 盛装入驻苹果应用商店
- 安川机器人如何注释化指令_安川机器人指令案例汇总
- python求一个数的因子_0是素数吗(python求一个数的因子)
- c语言 计算华氏温度
- 最稳定的工作,是你认可的那份
- 网页 php,怎么用php写一个网页
- 2023年五面蚂蚁、三面拼多多、字节跳动最终拿offer入职拼多多
- linux下wifi设备的实现逻辑
- sudo与su的区别
热门文章
- u盘推荐知乎_求推荐好用的u盘?
- ZTE10机顶盒中心服务器,中兴机顶盒现场配置工具ZTE_STB_Tools_V1.1.0_T07.01最新版
- FileZilla Server目录乱码问题的解决
- autojs 复制到粘贴板_JS复制到剪贴板示例代码
- php kindeditor,在PHP使用kindeditor
- 云端软件关闭的原因是什么?
- 脚本病毒---实验十二:脚本病毒
- 第二届上汽零束SOA平台开发者大会揭幕,智能汽车生态加速落地
- 阅读ArrayList源码的一些记录
- 【阅读笔记】Implementation of tactical maneuvers with maneuver libraries