Indel (Insertion and Deletion)分析简介

InDel 简介
InDel 是指基因组中小片段的插入或缺失序列,其长度在 1-50bp 之间。原因在于Illumina测序的reads(读长)大小为100bp左右,包括单端测序(single-end, 100bp),双端测序(paired-end,2 x 100bp)两种。因此在序列比对SNP calling时,能够检测到的可靠的Indel大多小于100bp,通常最大在50bp左右。 Small InDel 变异一般比SNP 变异少,同样反映了样品与参考基因组之间的差异,编码区的 InDel 会引起移码突变,导致基因功能的变化。

原始数据可以由不同的平台产生:如Illumina (NovaSeq),PacBio (CCS)等。此外,常用的InDel 检测分析软件:GATK ,samtools,TASSEL。
运用不同的variant caller或者training model进行indel分析,如DeepVariant (CCS model),DeepVariant (Illumina model),DeepVariant (haplotypesorted CCS model),GATK HaplotypeCaller (no filter),GATK HaplotypeCaller (hard filter)

用GATK对RNA-seq做数据做 INDEL分析流程:

  1. 用STAR软件将数据比对到参考基因组(mapping to the reference)。
  2. 用picard的markduplicates命令进行data cleanup。
  3. 用GATK的SplitNCigarReads包处理cigar里含有N的reads。
  4. 碱基质量分数重校准(Base Quality Recalibration),就是利用机器学习的方式调整原始碱基的质量分数。
  5. Variant Calling,Filtering和Annotation。

Indel (Insertion and Deletion)分析简介相关推荐

  1. 全基因组数据CNV分析简介

    欢迎关注"生信修炼手册"! 除了利用aCGH和snp芯片来检测CNV之外,也可以通过NGS数据来分析CNV, 比如全基因组和全外显子测序.针对全基因组CNV的检测,还针对开发了一种 ...

  2. 【lifelines中文wiki】生存分析简介

    [lifelines中文wiki]生存分析简介 英文原版连接 应用领域 生存分析最初是用来预测个人的寿命的.当遇到"这群人会活多长?"这类问题的时候,保险精算师.健康专家就会采用生 ...

  3. 《计算传播学导论》读书笔记——第二章文本分析简介

    <计算传播学导论>读书笔记--第二章文本分析简介 第一节 文本分析研究现状 常用文本挖掘技术 第二节 文本分析与传播学研究 (一)为什么文本挖掘技术逐渐受到传播学者的关注 (二)不同文本分 ...

  4. 《计算传播学导论》读书笔记:第二章 文本分析简介

    目录 第二章 文本分析简介 第一节 文本分析研究现状 第二节 文本分析与传播学研究 一.为什么文本挖掘技术逐渐受到传播学者的关注? 二.不同的文本分析研究对传播学的理论贡献 第三节 文本分析的基本步骤 ...

  5. ML:机器学习模型的稳定性分析简介、常见的解决方法之详细攻略

    ML:机器学习模型的稳定性分析简介.常见的解决方法之详细攻略 目录 ML:机器学习模型的稳定性分析简介.常见的解决方法 1.增强稳健性的通用方法 2.提高模型稳定性-适合泛线性模型(如逻辑回归)-幅度 ...

  6. 深度学习与视频分析简介

    文章大纲 视频分析简介 视频理解 方法与技术 技术优势 重要技术罗列 目标检测 帧差法 使用深度学习进行视频分析 视频分析中的目标检测 架构 系统逻辑架构 典型应用场景 5G 工序检测 工业质量控制 ...

  7. 【舆情分析(1)】 舆情分析简介及百度AI开放接口搞定中文分词

    1. 舆情分析简介 1) 基本概念 舆情 -- 是"舆论情况"的简称,是指在一定的社会空间内,围绕中介性社会事件的发生.发展和变化,作为主体的民众对作为客体的社会管理者.企业.个人 ...

  8. 拷贝数变异(Copy number variation, CNV)分析简介

    拷贝数变异(Copy number variation, CNV)分析简介 拷贝数变异简介(CNV) CNV,即拷贝数变异(Copy number variation, CNV),是由基因组发生重排而 ...

  9. Brinson分析简介

    导语:收益归因是一个比较基础.同时相当重要的策略分析工具,本教程旨在帮助大家利用BigQuant人工智能量化投资平台自带的Brinson进策略进行绩效归因分析. 分析框架 Brinson的框架可以用来 ...

最新文章

  1. Java基础。public,private,static变量!以及一个实例化的小例子 以及方法
  2. maven pom.xml 报错
  3. 云计算模型 - 1. 概述
  4. 文字输入限制_输入框设计,设计样式及设计要点
  5. AAAI 2019 | 借鉴传染病学原理探索医学图像CNN可解释性
  6. n个一位数字的数组中选取任意数目的数字,构成的3的最大倍数是多少?
  7. linux wenj 立即生效_【新书连载】测试工程师核心开发技术(3)—远程登录Linux系统...
  8. html发送qq邮件消息,Python3实现发送QQ邮件功能(html)_python
  9. Spring Boot异常处理
  10. 用css+jquery实现视频永远占满全屏效果
  11. 转:程序员这口饭-职业规划解决方案
  12. html如何格式化时间,js 日期时间的格式化
  13. Go的安装使用(一)
  14. html消除自带边距,CSS3中清除外边距、内边距margin,padding使用方法
  15. java规则计算_亲属计算规则算法--java实现(关键算法摘要)
  16. 【Qt】警告Missing reference in range-for with non trivial type
  17. 59% 的程序员曾担心自己猝死!
  18. [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像
  19. 土方量方lisp_时隔3年,再做双倍超立方数的题目,这次用Lisp
  20. 如何将mp4转换成gif?教你一招实现视频转gif高清转换

热门文章

  1. Spring Boot cache backed guava/caffeine
  2. 深拷⻉浅拷⻉的区别?如何实现一个深拷贝?
  3. markdown画图之一:流程图(flowchart)
  4. 逆反西游无法读取服务器信息,逆反西游
  5. i3 8100安装服务器系统,i38100安装win7纯净版的图文教程
  6. 简单的python程序实现99乘法口诀表
  7. Microdata Wordpress,WORDPRESS使用微数据
  8. 闪烁LED灯Verilog
  9. 1000瓶有毒的水,用多少只老鼠可以试出有毒的那瓶
  10. 华为6个月试用期经历