Indel (Insertion and Deletion)分析简介
Indel (Insertion and Deletion)分析简介
InDel 简介
InDel 是指基因组中小片段的插入或缺失序列,其长度在 1-50bp 之间。原因在于Illumina测序的reads(读长)大小为100bp左右,包括单端测序(single-end, 100bp),双端测序(paired-end,2 x 100bp)两种。因此在序列比对SNP calling时,能够检测到的可靠的Indel大多小于100bp,通常最大在50bp左右。 Small InDel 变异一般比SNP 变异少,同样反映了样品与参考基因组之间的差异,编码区的 InDel 会引起移码突变,导致基因功能的变化。
原始数据可以由不同的平台产生:如Illumina (NovaSeq),PacBio (CCS)等。此外,常用的InDel 检测分析软件:GATK ,samtools,TASSEL。
运用不同的variant caller或者training model进行indel分析,如DeepVariant (CCS model),DeepVariant (Illumina model),DeepVariant (haplotypesorted CCS model),GATK HaplotypeCaller (no filter),GATK HaplotypeCaller (hard filter)
用GATK对RNA-seq做数据做 INDEL分析流程:
- 用STAR软件将数据比对到参考基因组(mapping to the reference)。
- 用picard的markduplicates命令进行data cleanup。
- 用GATK的SplitNCigarReads包处理cigar里含有N的reads。
- 碱基质量分数重校准(Base Quality Recalibration),就是利用机器学习的方式调整原始碱基的质量分数。
- Variant Calling,Filtering和Annotation。
Indel (Insertion and Deletion)分析简介相关推荐
- 全基因组数据CNV分析简介
欢迎关注"生信修炼手册"! 除了利用aCGH和snp芯片来检测CNV之外,也可以通过NGS数据来分析CNV, 比如全基因组和全外显子测序.针对全基因组CNV的检测,还针对开发了一种 ...
- 【lifelines中文wiki】生存分析简介
[lifelines中文wiki]生存分析简介 英文原版连接 应用领域 生存分析最初是用来预测个人的寿命的.当遇到"这群人会活多长?"这类问题的时候,保险精算师.健康专家就会采用生 ...
- 《计算传播学导论》读书笔记——第二章文本分析简介
<计算传播学导论>读书笔记--第二章文本分析简介 第一节 文本分析研究现状 常用文本挖掘技术 第二节 文本分析与传播学研究 (一)为什么文本挖掘技术逐渐受到传播学者的关注 (二)不同文本分 ...
- 《计算传播学导论》读书笔记:第二章 文本分析简介
目录 第二章 文本分析简介 第一节 文本分析研究现状 第二节 文本分析与传播学研究 一.为什么文本挖掘技术逐渐受到传播学者的关注? 二.不同的文本分析研究对传播学的理论贡献 第三节 文本分析的基本步骤 ...
- ML:机器学习模型的稳定性分析简介、常见的解决方法之详细攻略
ML:机器学习模型的稳定性分析简介.常见的解决方法之详细攻略 目录 ML:机器学习模型的稳定性分析简介.常见的解决方法 1.增强稳健性的通用方法 2.提高模型稳定性-适合泛线性模型(如逻辑回归)-幅度 ...
- 深度学习与视频分析简介
文章大纲 视频分析简介 视频理解 方法与技术 技术优势 重要技术罗列 目标检测 帧差法 使用深度学习进行视频分析 视频分析中的目标检测 架构 系统逻辑架构 典型应用场景 5G 工序检测 工业质量控制 ...
- 【舆情分析(1)】 舆情分析简介及百度AI开放接口搞定中文分词
1. 舆情分析简介 1) 基本概念 舆情 -- 是"舆论情况"的简称,是指在一定的社会空间内,围绕中介性社会事件的发生.发展和变化,作为主体的民众对作为客体的社会管理者.企业.个人 ...
- 拷贝数变异(Copy number variation, CNV)分析简介
拷贝数变异(Copy number variation, CNV)分析简介 拷贝数变异简介(CNV) CNV,即拷贝数变异(Copy number variation, CNV),是由基因组发生重排而 ...
- Brinson分析简介
导语:收益归因是一个比较基础.同时相当重要的策略分析工具,本教程旨在帮助大家利用BigQuant人工智能量化投资平台自带的Brinson进策略进行绩效归因分析. 分析框架 Brinson的框架可以用来 ...
最新文章
- Java基础。public,private,static变量!以及一个实例化的小例子 以及方法
- maven pom.xml 报错
- 云计算模型 - 1. 概述
- 文字输入限制_输入框设计,设计样式及设计要点
- AAAI 2019 | 借鉴传染病学原理探索医学图像CNN可解释性
- n个一位数字的数组中选取任意数目的数字,构成的3的最大倍数是多少?
- linux wenj 立即生效_【新书连载】测试工程师核心开发技术(3)—远程登录Linux系统...
- html发送qq邮件消息,Python3实现发送QQ邮件功能(html)_python
- Spring Boot异常处理
- 用css+jquery实现视频永远占满全屏效果
- 转:程序员这口饭-职业规划解决方案
- html如何格式化时间,js 日期时间的格式化
- Go的安装使用(一)
- html消除自带边距,CSS3中清除外边距、内边距margin,padding使用方法
- java规则计算_亲属计算规则算法--java实现(关键算法摘要)
- 【Qt】警告Missing reference in range-for with non trivial type
- 59% 的程序员曾担心自己猝死!
- [Python图像识别] 四十七.Keras深度学习构建CNN识别阿拉伯手写文字图像
- 土方量方lisp_时隔3年,再做双倍超立方数的题目,这次用Lisp
- 如何将mp4转换成gif?教你一招实现视频转gif高清转换