捋一下测序后生信分析内容及其常用软件
捋一下测序后生信分析内容及其常用软件
当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤。质控过滤软件如fastqc、multiQC、trimmomatic等。
得到基因组的clean reads后,无非两件事,一是denovo组装,构建参考序列;二是重测序,分析变异及后续基因表达定量、功能等下游分析。
1. 基因组组装
物种从头测序的黄金时代已经过去,该测完的、容易测的大多数已经测完了。
一个物种的基因组组装分析结果及其所用软件往往包含以下内容:
组装->注释->比较基因组分析->后面可能会加点功能分析或者搭建类似JBrowse基因组浏览器。
- 组装软件:SOAPdenovo,ALLPATH-LG等等;
- 注释软件:Fgenesh、GeneWise、Augustus、RepeatModel、RepeatMasker等等。
2. 基因组重测序
有了参考序列的情况下,将原始reads比对回基因组,即重测序分析,可以说现在的绝大部分生信分析都是针对重测序,只是应用到其他各个不同领域,我们也可以说,这就是后基因组时代。分析常常包括:
比对->变异检测(SNP、InDel、CNV、SV等)->群体分析(PI、LD、Fst等)->后续一些功能方面的分析。
- 比对:BWA、Bowtie2、SOAP、Samtools等。比对完生成sam/bam文件,有人说你对bam文件格式的熟悉程度就是你做重测序项目经验的体现。
- 变异检测:常用GATK来进行SNP、InDel等变异检测,这一步叫做call变异,最后生成一个vcf格式文件。再用vcftools/bcftools等软件过滤掉质量低的不可靠的变异位点。用SnpEff软件对变异位点进行注释,及这些变异对基因功能产生什么影响。
3. 转录组测序
以上测的是基因组序列,如果是转录组,也是分为有参考基因组和无参考基因组两种情况来分析。
(组装->)比对->表达量->差异->功能等分析。当然也会有一些RNA结构的分析,如可变剪接、融合基因等等。
如果是无参考基因组,需要denovo拼接。软件如Trinity组装得到转录本序列,然后用软件如bowtie2比对到转录本序列得到sam文件,根据比对结果用软件如RSEM进行表达定量分析。
如果有参考基因组,直接使用 HISAT2或STAR等软件将测序结果比对到基因组上,结合基因注释就可以计算出每个基因的表达。
后续就是差异基因分析,常用软件DESeq2和edgeR,最后最一些功能方面的分析。
其他如WES、CHIPseq、ATACseq、lncRNA、甲基化测序、scRNAseq等等其实都是类似的,区别就是前期的样本处理和建库流程不同,目的就是得到不同时空条件下的目标序列,然后再进行测序,当然使用的后处理软件也会有所不同。
Ref:https://www.zhihu.com/question/23566982/answer/131147960
捋一下测序后生信分析内容及其常用软件相关推荐
- DNA甲基化测序数据的分析流程及相关软件总结
目前检测DNA甲基化的方法众多,主要可以分为以下几类(如表1所示): 图片来源(凡时财等,中国科学: 生命科学,2015) <更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信 ...
- 图形化开放式生信分析系统开发 - 9 Illumina测序仪测序数据自动拆分
前文链接: 图形化开放式生信分析系统开发 - 1 需求分析及技术实现 图形化开放式生信分析系统开发 - 2 样本信息处理 图形化开放式生信分析系统开发 - 3 生信分析流程的进化 图形化开放式生信分析 ...
- RNAseq生信分析流程简介
文章目录 RNAseq简介 RNAseq分析流程 1. 实验设计 1.1 目标RNA提取策略和文库类型选择 1.2 测序深度或文库大小 1.3 实验重复 2. RNAseq信息分析 2.1 质控 和 ...
- 这是入门生信,学习生信分析思路和数据可视化的首选?
封面来源:https://www.zhihu.com/question/304747766 常规转录组是我们最常接触到的一种高通量测序数据类型,其实验方法成熟,花费较低,是大部分CNS必备的技术,以后 ...
- 在B站学习大名鼎鼎的StatQuest 系列统计和生信分析视频(中文字幕)- 也见证助理教授到创业者的华丽转身...
生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...
- 生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式.在分析的过程中还会有众多中间文件的生成,如bed.bed12. ...
- 生信分析过程中这些常见文件(fastq/bed/gtf/sam/bam/wig)的格式以及查看方式你都知道吗?
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式.在分析的过程中还会有众多中间文件的生成,如bed.bed12. ...
- RNA-seq生信分析流程
RNA-seq生信分析流程 RNA-seq是近些年发展起来的针对转录组的测序技术,其能够获得mRNA.smallRNA以及各种非编码RNA的序列. 在不同细胞或者在相同细胞的不同发育阶段细胞中这些RN ...
- linux怎么查看一个bam文件,生信分析过程中这些常见文件的格式以及查看方式你都知道吗?...
原标题:生信分析过程中这些常见文件的格式以及查看方式你都知道吗? 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据 fastq 之外,还需要准备基因组文件 fasta 格式和基因注释文件 ...
最新文章
- 1112. Stucked Keyboard (20)
- 非升即走的博士们日后该怎么办?院长给出这5点建议
- element select 不回显_Jsoup中Element对象的使用
- Skyscrapers (hard version) CodeForces - 1313C2(单调栈)
- ADO.NET,浅显
- SQL中使用视图的优点和缺点是什么
- GitHub标星6000+!Python带你实践机器学习圣经PRML
- 生产数据库更新忙,没有超时
- 设计模式学习笔记(目录篇)
- 30. Substring with Concatenation of All Words
- Qt与云服务器项目,qt 云服务器
- VM安装MAC虚拟机
- Openstack平台neutron模块之网络基础概念
- Android快捷开关实现 Wifi开关、蓝牙开关、GPS开关、同步开关、亮度设置开关
- 以太坊主动数据同步简析
- 王牌竞速服务器维护,《王牌竞速》更新公告
- vue中image 的:src 与 src
- [效率提升]webstorm配置Prettier:代码自动格式,格式化时清除空行,修改使用代码模板
- 广东计算机二级考试大纲,全国计算机等级考试大纲(一级WINDOWS)
- masonry Unable to simultaneously satisfy constraints. Probably at least one of the c