使用Eagle2进行单倍型分析
欢迎关注”生信修炼手册”!
Eagle2是一款单倍型分析软件,相比shapeit, 其运行速度提高了20倍左右,准确率也增加了10%,官网如下
https://data.broadinstitute.org/alkesgroup/Eagle/
对应的文章发表在nature genetics上,链接如下
https://www.nature.com/articles/ng.3679
核心算法图示如下
对于reference haplotype, 通过PBWT转换之后构建前缀树,树枝的宽度代表了单倍型的频率,频率越高,树枝越宽。对于study样本的分型结果,将可能的单倍型映射到前缀树中,结合HMM模型来预测对应的单倍型。
和shapiet2等软件进行比较,结果如下所示
从图a可以看出,Eagle2的运行时间最快,而且非常恒定,并不会随着reference panel中单倍型的增多而加大运行时间, shapeit2的运行时间和panel size则基本是一个线性关系。
从图b可以看出,panel size的增加有助于降低错误率,而不同软件之间的比较可以发现,Eagle2的错误率最低。利用1000G和HRC两个reference panel进行比较,可以得出相同的结论,结果如下
HRC的单倍型比1000G多很多,利用HRC进行phasing的错误率显著降低。study样本的对运行时间和准确率的影响如下
可以看到,样本越多,运行时间越久,错误率越低。相比shapeit2, Eagle2的运行速度更快,错误率更低。
该软件的基本用法如下
eagle \
--vcfRef HRC.r1-1.GRCh37.chr20.shapeit3.mac5.aa.genotypes.bcf \
--vcfTarget sample.chr1.vcf.gz \
--geneticMapFile genetic_map_chr1_b37.txt
--outPrefix chr1.phased \
要求输入的study样本和reference panel的格式为VCF/BCF, 而且需要tabix的索引,如果是plink格式,可以通过plink2转换成VCF, 官方推荐使用bcftools进行VCF和BCF的格式转换和建立索引操作。
鉴于Eagle2运行速度和准确率的优势,基因型填充的web服务会使用该软件来进行phasing, 以保证运行速度和用户体验。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
使用Eagle2进行单倍型分析相关推荐
- 使用shapeit进行单倍型分析
欢迎关注"生信修炼手册"! shapeit是一款单倍型分析工具,运算速度快,准确率高,是impute2官方推荐的pre-phasing工具,官网如下 http://mathgen. ...
- Haploview做单倍型分析
自个数据用Haploview做单倍型分析 转载他人的 http://www.dxy.cn/bbs/topic/16025305 Haploview http://www.broadinstitu ...
- geneHapR做基因单倍型分析
教你5分钟学会做基因单倍型分析 关键词: 基因单倍型.单倍型网络图.地理分布.连锁不平衡.主效位点 怎么做单倍型分析 一.什么是单倍型? 在单倍型分析前,首先需要明白什么是单倍型.什么是基因单倍型? ...
- 单倍型分析网络图绘制软件 network下载
1.搜索Fluxus Technology Ltd 网站 2.进入该网站 点选"FREE PHYLOGENETIC NETWORK SOFTWARE"按钮,找到喜欢的network ...
- 不会linux也没关系,点击鼠标即可完成的LDSC分析来了
欢迎关注"生信修炼手册"! LDSC分析基于已有的GWAS结果,即gwas summary数据,可以评估性状的遗传力,分析两个性状间的遗传相似度.相比GREML, 其运算速度快,更 ...
- 想要进行gene prioritization分析,请看这里!
欢迎关注"生信修炼手册"! 通过GWAS分析可以识别到与性状关联的SNP位点,然而从生物学角度出发,我们更想了解的是哪些基因或者通路导致了这些位点与性状的关联现象.为了解决这一问题 ...
- GWAS中的Gene-Gene Interactions如何分析?看这里
欢迎关注"生信修炼手册"! 在遗传学中,当两个基因相互作用然后导致对应性状的出现,说明两个基因间存在相互作用.在之前的文章中,介绍了很多的基因相互作用模型,列表如下 互补作用 积加 ...
- 使用MatrixEQTL进行cis/trans-eQTL分析
欢迎关注"生信修炼手册"! Matrix是一款经典的eQTL分析软件,可以支持cis和trans-eQTL的分析,官网如下 http://www.bios.unc.edu/rese ...
- 基因型与表型的交互作用如何分析,多元回归来搞定
欢迎关注"生信修炼手册"! 回归分析最为关联分析中最长使用的一种手段,除了可以进行协变量的校正,还可以分析各种因素间的交互作用,比如SNP与表型,SNP与环境之间的交互.具体是如何 ...
最新文章
- MSI文件制作全过程
- rinetd 做端口转发
- java和python的比较-Python和Java就业前景对比
- 关于华为x2中的外置SDCard的使用
- 文本编辑器实现文本打印的功能
- 整理就知识,你会在里面发现新的东西
- 有什么好的Java自学教程视频,适合初学者
- Linux同一网段使用不同网卡的方法
- android界面的滑动切换功能
- ACL20 | 让笨重的BERT问答匹配模型变快!
- 带你入门SpringCloud统一配置 | SpringCloud Config
- 25岁该有多少存款?数据分析带你揭露打工人的工资真相
- c语言strTrimed函数用法介绍,c语言对字符串实现高效trim函数
- Delphi XE开发 Android 开机自动启动
- 无法进入一个空框_DeNoise AI无法从Photoshop作为插件启动?
- java数字转读音_java 数字转汉语读音的程序
- java web聊天室私聊map_javaweb聊天小项目
- Unity3D 串口连接
- Java面试题合集(1)
- PAT 1072 开学寄语 C语言实现