捋一下测序后生信分析内容及其常用软件

当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤。质控过滤软件如fastqc、multiQC、trimmomatic等。

得到基因组的clean reads后,无非两件事,一是denovo组装,构建参考序列;二是重测序,分析变异及后续基因表达定量、功能等下游分析。

1. 基因组组装

物种从头测序的黄金时代已经过去,该测完的、容易测的大多数已经测完了。

一个物种的基因组组装分析结果及其所用软件往往包含以下内容:

组装->注释->比较基因组分析->后面可能会加点功能分析或者搭建类似JBrowse基因组浏览器。

  • 组装软件:SOAPdenovo,ALLPATH-LG等等;
  • 注释软件:Fgenesh、GeneWise、Augustus、RepeatModel、RepeatMasker等等。

2. 基因组重测序

有了参考序列的情况下,将原始reads比对回基因组,即重测序分析,可以说现在的绝大部分生信分析都是针对重测序,只是应用到其他各个不同领域,我们也可以说,这就是后基因组时代。分析常常包括:

比对->变异检测(SNP、InDel、CNV、SV等)->群体分析(PI、LD、Fst等)->后续一些功能方面的分析。

  • 比对:BWA、Bowtie2、SOAP、Samtools等。比对完生成sam/bam文件,有人说你对bam文件格式的熟悉程度就是你做重测序项目经验的体现。
  • 变异检测:常用GATK来进行SNP、InDel等变异检测,这一步叫做call变异,最后生成一个vcf格式文件。再用vcftools/bcftools等软件过滤掉质量低的不可靠的变异位点。用SnpEff软件对变异位点进行注释,及这些变异对基因功能产生什么影响。

3. 转录组测序

以上测的是基因组序列,如果是转录组,也是分为有参考基因组和无参考基因组两种情况来分析。

(组装->)比对->表达量->差异->功能等分析。当然也会有一些RNA结构的分析,如可变剪接、融合基因等等。

  • 如果是无参考基因组,需要denovo拼接。软件如Trinity组装得到转录本序列,然后用软件如bowtie2比对到转录本序列得到sam文件,根据比对结果用软件如RSEM进行表达定量分析。

  • 如果有参考基因组,直接使用 HISAT2或STAR等软件将测序结果比对到基因组上,结合基因注释就可以计算出每个基因的表达。

后续就是差异基因分析,常用软件DESeq2和edgeR,最后最一些功能方面的分析。

其他如WES、CHIPseq、ATACseq、lncRNA、甲基化测序、scRNAseq等等其实都是类似的,区别就是前期的样本处理和建库流程不同,目的就是得到不同时空条件下的目标序列,然后再进行测序,当然使用的后处理软件也会有所不同。

Ref:https://www.zhihu.com/question/23566982/answer/131147960

捋一下测序后生信分析内容及其常用软件相关推荐

  1. DNA甲基化测序数据的分析流程及相关软件总结

    目前检测DNA甲基化的方法众多,主要可以分为以下几类(如表1所示): 图片来源(凡时财等,中国科学: 生命科学,2015) <更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信 ...

  2. 图形化开放式生信分析系统开发 - 9 Illumina测序仪测序数据自动拆分

    前文链接: 图形化开放式生信分析系统开发 - 1 需求分析及技术实现 图形化开放式生信分析系统开发 - 2 样本信息处理 图形化开放式生信分析系统开发 - 3 生信分析流程的进化 图形化开放式生信分析 ...

  3. RNAseq生信分析流程简介

    文章目录 RNAseq简介 RNAseq分析流程 1. 实验设计 1.1 目标RNA提取策略和文库类型选择 1.2 测序深度或文库大小 1.3 实验重复 2. RNAseq信息分析 2.1 质控 和 ...

  4. 这是入门生信,学习生信分析思路和数据可视化的首选?

    封面来源:https://www.zhihu.com/question/304747766 常规转录组是我们最常接触到的一种高通量测序数据类型,其实验方法成熟,花费较低,是大部分CNS必备的技术,以后 ...

  5. 在B站学习大名鼎鼎的StatQuest 系列统计和生信分析视频(中文字幕)- 也见证助理教授到创业者的华丽转身...

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...

  6. 生信分析过程中这些常见文件的格式以及查看方式你都知道吗?

    生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式.在分析的过程中还会有众多中间文件的生成,如bed.bed12. ...

  7. 生信分析过程中这些常见文件(fastq/bed/gtf/sam/bam/wig)的格式以及查看方式你都知道吗?

    生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式.在分析的过程中还会有众多中间文件的生成,如bed.bed12. ...

  8. RNA-seq生信分析流程

    RNA-seq生信分析流程 RNA-seq是近些年发展起来的针对转录组的测序技术,其能够获得mRNA.smallRNA以及各种非编码RNA的序列. 在不同细胞或者在相同细胞的不同发育阶段细胞中这些RN ...

  9. linux怎么查看一个bam文件,生信分析过程中这些常见文件的格式以及查看方式你都知道吗?...

    原标题:生信分析过程中这些常见文件的格式以及查看方式你都知道吗? 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据 fastq 之外,还需要准备基因组文件 fasta 格式和基因注释文件 ...

最新文章

  1. 1112. Stucked Keyboard (20)
  2. 非升即走的博士们日后该怎么办?院长给出这5点建议
  3. element select 不回显_Jsoup中Element对象的使用
  4. Skyscrapers (hard version) CodeForces - 1313C2(单调栈)
  5. ADO.NET,浅显
  6. SQL中使用视图的优点和缺点是什么
  7. GitHub标星6000+!Python带你实践机器学习圣经PRML
  8. 生产数据库更新忙,没有超时
  9. 设计模式学习笔记(目录篇)
  10. 30. Substring with Concatenation of All Words
  11. Qt与云服务器项目,qt 云服务器
  12. VM安装MAC虚拟机
  13. Openstack平台neutron模块之网络基础概念
  14. Android快捷开关实现 Wifi开关、蓝牙开关、GPS开关、同步开关、亮度设置开关
  15. 以太坊主动数据同步简析
  16. 王牌竞速服务器维护,《王牌竞速》更新公告
  17. vue中image 的:src 与 src
  18. [效率提升]webstorm配置Prettier:代码自动格式,格式化时清除空行,修改使用代码模板
  19. 广东计算机二级考试大纲,全国计算机等级考试大纲(一级WINDOWS)
  20. masonry Unable to simultaneously satisfy constraints. Probably at least one of the c

热门文章

  1. SLAM中大场景下室内外区域的地图管理方法
  2. 48本3D视觉领域学习书籍,请自取
  3. Ceres非线性优库入门介绍
  4. java 反射调用静态方法
  5. Tensorflow杂记
  6. command对象提供的3个execute方法是_21个极大提高开发效率的VS Code快捷键
  7. 一个小团队使用的知识管理方案与工具
  8. Linux7-常用文件管理命令及系统变量基础
  9. iMeta:高颜值高被引绘图网站imageGP在线发表(视频简介+实操教程)
  10. CheckM——国家微生物科学数据中心云工具