欢迎关注”生信修炼手册”!

shapeit是一款单倍型分析工具,运算速度快,准确率高,是impute2官方推荐的pre-phasing工具,官网如下

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html

对应的文献发表在nature method上,链接如下

https://www.nature.com/articles/nmeth.1785

通过隐马可夫模型来分析单倍型,简化的模型示意如下

从上到下依次有5个子图,用1到5来表示,需要分成3个部分来看。在1图中,表示的是8个位点构成的8种单倍型,每行表示一个单倍型,每一列代表一个位点,2图中用图状结构来表示上述的单倍型,每个节点表示一个SNP位点,依次用Z1到Z8表示,从1到8的完整路径代表一个单倍型。观察图1可以发现,前4个位点只有3种组成,后4个位点也是同样的,通过4号位点和5号位点的不同连线可以表示所有的单倍型,每条边上的数字代表对应的频数。

图5表示的是某个样本的分型结果,分别用0,1,2表示不同的状态,0表示没有突变,1表示杂合突变,2表示纯合突变,根据分型结果拆分成单倍型的时候,杂合突变对应2个allel,  根据这个分型结果可以得到图4中对应的单倍型构成,图4中ref allel用空白方框表示,alt allel用黑色方框表示,对于前5个位点,存在了2个杂合突变,所以有4种路径,后3个位点也是4种。

图3表示的是该软件的隐马可夫模型,将真实的单倍型当做是隐藏序列,将根据分型结果预测的单倍型当做是观察序列,通过建模之后来分析隐藏序列的组成,就得到了真实的单倍型分析结果。

在文献中,将该软件与其他类似的工具进行了比较,结果示意如下

采用了3个不同的数据集,比较了运行时间和错误率,shapeit错误率最低,运行速度最快。

该软件的基本用法如下

shapeit \
--input-bed gwas.bed gwas.bim gwas.fam \
--input-map genetic_map.txt \
--output-max gwas.phased.haps gwas.phased.sample
--thread 8

需要指定的参数分成了以下3个部分

1. input  unphased genotypes

支持以下3种格式

  1. ped/map

  2. bed/bim/fam

  3. gen/sample

  4. vcf

前两种为plink软件的格式,是GWAS分析最常见的文件格式,第三种格式是WTCCC默认的文件格式 第四种是最常见的VCF格式。

不同类型的输入文件对应的用法如下

shapeit \
--input-ped gwas.ped gwas.map \
-M genetic_map.txt \
--missing-code N \
-O gwas.phasedshapeit \
--input-bed gwas.bed gwas.bim gwas.fam \
-M genetic_map.txt \
-O gwas.phasedshapeit \
--input-gen gwas \
-M genetic_map.txt \
-O gwas.phasedshapeit \
--input-vcf gwas.vcf \
-M genetic_map.txt \
-O gwas.phased

对于gen/sample文件格式,可以通过gtool这个软件来进行格式转换,

2. genetic map

参考基因组对应的连锁图谱,可以提高单倍型分析的准确性,官方提供了hapmap项目的连锁图谱供下载,链接如下

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#formats

这个是一个可选参数,没有的情况下软件会根据线性模型来进行估算。

3. output phased haplotypes

默认用后缀为haps和sample的两个文件来描述单倍型, haps文件的内容如下所示

每列之间用空格分隔,第一列为snp位点所在的染色体名称,第二列为snp id,第三列为染色体的位置,第四列为不同样本中该位点的分型结果,0代表ref allle, 1代表alt allel, 每两列对应一个样本。

后缀为sample的文件内容如下所示

用来描述样本的信息,同样的空格分隔,前两行内容固定,后续每一行代表一个样本,以上只是该文件最基本内容的展示,还可以有更多的列,用来描述样本的表型信息。

在impute2中,phased reference panel会用hap/legend/sample3个文件来表示,通过下列代表可以进行格式转换

shapeit \
-convert \
--input-haps gwas.phased \
--output-ref gwas.phased.hap gwas.phased.leg gwas.phased.sam

不同格式的详细解释参考以下链接

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#formats

事先对需要填充的样本进行phasing, 可以有效提高填充的运行效率,如果后续使用impute2进行基因型填充,推荐使用shapeit对需要填充的样本进行单倍型分析。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

使用shapeit进行单倍型分析相关推荐

  1. Haploview做单倍型分析

    自个数据用Haploview做单倍型分析 转载他人的  http://www.dxy.cn/bbs/topic/16025305 Haploview   http://www.broadinstitu ...

  2. geneHapR做基因单倍型分析

    教你5分钟学会做基因单倍型分析 关键词: 基因单倍型.单倍型网络图.地理分布.连锁不平衡.主效位点 怎么做单倍型分析 一.什么是单倍型? 在单倍型分析前,首先需要明白什么是单倍型.什么是基因单倍型? ...

  3. 使用Eagle2进行单倍型分析

    欢迎关注"生信修炼手册"! Eagle2是一款单倍型分析软件,相比shapeit, 其运行速度提高了20倍左右,准确率也增加了10%,官网如下 https://data.broad ...

  4. 单倍型分析网络图绘制软件 network下载

    1.搜索Fluxus Technology Ltd 网站 2.进入该网站 点选"FREE PHYLOGENETIC NETWORK SOFTWARE"按钮,找到喜欢的network ...

  5. 不会linux也没关系,点击鼠标即可完成的LDSC分析来了

    欢迎关注"生信修炼手册"! LDSC分析基于已有的GWAS结果,即gwas summary数据,可以评估性状的遗传力,分析两个性状间的遗传相似度.相比GREML, 其运算速度快,更 ...

  6. 想要进行gene prioritization分析,请看这里!

    欢迎关注"生信修炼手册"! 通过GWAS分析可以识别到与性状关联的SNP位点,然而从生物学角度出发,我们更想了解的是哪些基因或者通路导致了这些位点与性状的关联现象.为了解决这一问题 ...

  7. GWAS中的Gene-Gene Interactions如何分析?看这里

    欢迎关注"生信修炼手册"! 在遗传学中,当两个基因相互作用然后导致对应性状的出现,说明两个基因间存在相互作用.在之前的文章中,介绍了很多的基因相互作用模型,列表如下 互补作用 积加 ...

  8. 使用MatrixEQTL进行cis/trans-eQTL分析

    欢迎关注"生信修炼手册"! Matrix是一款经典的eQTL分析软件,可以支持cis和trans-eQTL的分析,官网如下 http://www.bios.unc.edu/rese ...

  9. 基因型与表型的交互作用如何分析,多元回归来搞定

    欢迎关注"生信修炼手册"! 回归分析最为关联分析中最长使用的一种手段,除了可以进行协变量的校正,还可以分析各种因素间的交互作用,比如SNP与表型,SNP与环境之间的交互.具体是如何 ...

最新文章

  1. IBM Thinkpad T43-44U 升级到 2G 内存后少了 66M
  2. 基于Confluent.Kafka实现的Kafka客户端操作类使用详解
  3. 将jar文件做成exe可运行文件
  4. 编程软件python怎样开始学-编程零基础应当如何开始学习 Python?
  5. 51nod1008 N的阶乘 mod P(水题)
  6. Python中的负索引是什么?
  7. java语言和www技术 阶段性测试一_2018春季【贵州电大】[JAVA语言与WWW技术(省)]04任务阶段性测验(答案)...
  8. ASP.NET开发资源
  9. VCSA 6.X(VMware vCenter Server Appliance)空间不足问题处理
  10. 关于内核态和用户态切换开销的测试
  11. MongoDB联合查询 -摘自网络
  12. Layui动态修改列名
  13. MySQL数据库基本操作-DDL
  14. QT的QScrollArea使用详解
  15. 在线评判系统java代码_sojV1.0 Online Judge System 在线评判系统是一个 联合开发网 - pudn.com...
  16. 主板开启网络唤醒_电脑网络唤醒如何关闭?华硕路由网络唤醒?#TIL#网络唤醒(WOL)除了设置主板,还需要操作系...
  17. 【音乐系列】吉他学习入门基本知识
  18. 程序员的自我修养阅读笔记
  19. 任天堂 Wii 模拟器 Dolphin 已原生支持苹果 M1 Mac 电脑
  20. video.js 视频截图、录制、自定义全屏,hls、flv、mp4视频播放

热门文章

  1. 什么是事件冒泡机制?
  2. CentOS网络时钟同步协议-- NTP, PTP
  3. 【顺序表】顺序表定位
  4. Linux工具学习之【gcc/g++】
  5. MATLAB处理EXCEL文件
  6. 关于BRDF公式理解的笔记
  7. Anaconda 安装与 使用
  8. DVWA靶场通关教程
  9. 【源码阅读技巧一】查看类关系图,接口实现关系图(idea版本)Diagrams关系图
  10. 缓解环境噪声对音频质量干扰