这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。

1. 模拟数据

ped数据:

$ cat a.ped
FAMILY1     ID1       0       0       0       -9      CC     CC     AA     GG     AG     GG     GG     GC
FAMILY1     ID2       0       0       0       -9      CC     GC     AG     GG     GG     AA     AG     CC
FAMILY1     ID3       0       0       0       -9      GG     CC     AG     GG     GG     GA     AG     GC
FAMILY1     ID4       0       0       0       -9      GG     CC     GG     GG     GG     AA     GG     GG
FAMILY1     ID5       0       0       0       -9      GG     CC     GG     GG     GG     AA     AG     GC
FAMILY1     ID6       0       0       0       -9      GG     CC     GG     GG     GG     AA     AA     CC
FAMILY1     ID7       0       0       0       -9      GG     CC     GG     AG     AA     AA     GG     CC
FAMILY1     ID9       0       0       0       -9      GG     CC     GG     AG     AA     AA     GG     CC

map数据:

$ cat a.map
1       snp1    0       55910
1       snp2    0       85204
1       snp3    0       122948
1       snp4    0       203750
1       snp5    0       312707
1       snp6    0       356863
1       snp7    0       400518
1       snp8    0       487423

2. 计算样本的杂合度--het

$ plink --file a --het

结果查看:

$ cat plink.hetFID  IID       O(HOM)       E(HOM)        N(NM)            FFAMILY1  ID1            6         5.32            8       0.2536FAMILY1  ID2            5         5.32            8      -0.1195FAMILY1  ID3            4         5.32            8      -0.4927FAMILY1  ID4            8         5.32            8            1FAMILY1  ID5            6         5.32            8       0.2536FAMILY1  ID6            8         5.32            8            1FAMILY1  ID7            7         5.32            8       0.6268FAMILY1  ID9            7         5.32            8       0.6268

这里:

  • FID,家系ID
  • IID,个体ID
  • O(HOM):观察到的纯合个数
  • E(HOM):期望的纯合个数
  • N(NM):没有缺失的SNP个数
  • F:计算的值

其中F的计算方法:
F=O−EN−EF = \frac{O-E}{N-E}F=N−EO−E​

  • O: O(HOM)
  • E: E(HOM)
  • N: N(NM)

可以这样认为,F值越小(包括负值),杂合度越高,F值越高,纯合度越高!

Excel对比
将ped文件,copy到Excel中,手动计算纯合和杂合的个数,进行统计:

3. 计算SNP位点杂合度

这里,使用参数--hardy,可以给出位点的纯合和杂合个数:

$ plink --file a --hardy

结果:

$ cat plink.hweCHR  SNP     TEST   A1   A2                 GENO   O(HET)   E(HET)            P1 snp1  ALL(NP)    C    G                2/0/6        0    0.375      0.015381 snp2  ALL(NP)    G    C                0/1/7    0.125   0.1172            11 snp3  ALL(NP)    A    G                1/2/5     0.25    0.375       0.38461 snp4  ALL(NP)    A    G                0/2/6     0.25   0.2188            11 snp5  ALL(NP)    A    G                2/1/5    0.125   0.4297      0.076921 snp6  ALL(NP)    G    A                1/1/6    0.125   0.3047          0.21 snp7  ALL(NP)    A    G                1/3/4    0.375   0.4297            11 snp8  ALL(NP)    G    C                1/3/4    0.375   0.4297            1
  • GENO,2/0/6,第一个是次等位基因纯合个数,第二个是杂合个数,第三个是主等位基因纯合个数
  • O(HET),是杂合所在的比值

对比Excel结果:

4. 计算SNP位点的基因频率

$ plink --file a --freq

结果查看:

$ cat plink.frqCHR  SNP   A1   A2          MAF  NCHROBS1 snp1    C    G         0.25       161 snp2    G    C       0.0625       161 snp3    A    G         0.25       161 snp4    A    G        0.125       161 snp5    A    G       0.3125       161 snp6    G    A       0.1875       161 snp7    A    G       0.3125       161 snp8    G    C       0.3125       16

plink软件初体验3--计算样本杂合度和SNP位点杂合度相关推荐

  1. plink软件初体验2--常用参数

    plink软件是GWAS分析中常用的软件,它也是一个数据格式,plink里面有很多非常强大的功能,运算速度很快,是我日常分析中常用的软件之一. 之前写了一系列的GWAS教程,点击这里查看,这里继续进行 ...

  2. 学用软件:laTex软件初体验

    文章目录 一.安装LaTeX软件 1.自助法 2.打包法 二.使用LaTeX软件 1.建立第一个文档

  3. 不可以涩涩!AI续写软件初体验;迁移学习路线图;谷歌新闻非官方搜索API;CS295『因果推理』2021课程资料;前沿论文 | ShowMeAI资讯日报

  4. linux 拷机软件,拷机软件跑起来,OS X平台下OpenGL初体验

    拷机软件跑起来,OS X平台下OpenGL初体验 2012-11-12 18:55:03 作者:tina Tag:Mac 热度:745℃ 苹果自成一套的体系可以尽情展示自家的技术水准,但是也会给一些程 ...

  5. Flink大数据实时计算系列-案例初体验:HotPages

    Flink大数据实时计算系列-案例初体验:HotPages 目录 HotPages代码 输入日志 运行结果 HotPages代码 /*** Copyright (c) 2018-2028 尚硅谷 Al ...

  6. Synopsys初体验——软件安装篇

    Synopsys初体验--软件安装篇 前言 一.虚拟机VMware的安装与使用 1.软件安装 2.创建自己的虚拟机 二.Synopsys系列软件的安装 前言 时光飞逝,转眼间已经是将要毕业的人了.之前 ...

  7. 我的Citavi初体验,比mendeley更好使的软件

    Citavi初体验 参考文献引用格式: 在citation选项卡里,可以浏览自己想要的格式,也可以自定义格式. 中文文献import: 中文文献导入后,如果是直接导入的本地pdf文件,可能无法识别所有 ...

  8. Linux下plink软件使用方法,#软件工具#解密GWAS的利器--Plink 使用解析

    GWAS全基因组关联分析,近年来一直为研究的热点,不管是研究复杂疾病或是遗传育种,均有广泛的用途.但是GWAS的数据动辄上千的样本数据,如何对这庞大的数据进行分析?这里我们介绍一个强大的工具--PLI ...

  9. oracle数据库dblink创建语句_3场直播丨达梦DM8数据库安装部署初体验、新基建下的国产数据库应用和发展趋势、Oracle外部表创建与使用...

    1. 循序渐进-达梦DM8数据库安装部署初体验-07/16 简介: 本讲座主要介绍达梦DM8数据库软件安装与数据库创建. 2019年5月,DM8发布. 基于新技术发展的思考和市场的需求,坚持实用性.通 ...

  10. 3场直播丨达梦DM8数据库安装部署初体验、新基建下的国产数据库应用和发展趋势、Oracle外部表创建与使用...

    1. 循序渐进-达梦DM8数据库安装部署初体验-07/16 简介: 本讲座主要介绍达梦DM8数据库软件安装与数据库创建. 2019年5月,DM8发布. 基于新技术发展的思考和市场的需求,坚持实用性.通 ...

最新文章

  1. 百度eCharts体验
  2. ASP.NET Menu控件子菜单弹出导致页面出现滚动条问题
  3. TikTok时代细分需求 牛逼亚马逊运营团队打造新爆款
  4. Keil 运行.bat脚本文件
  5. matplotlib 横坐标只显示整数_matplotlib初学:这样画折线图和添加标注、箭头
  6. Linux01-Linux文本编辑器vim编辑器深入详解22
  7. openfoam安装中出现allmake error_如何更新OpenFOAM的版本?
  8. 腾讯:我火了,新浪:你没有!
  9. div常用效果方法-transform
  10. [Android] 图片JNI(C++\Java)高斯模糊 多线程
  11. OpenDDS系列(1) —— OpenDDS 简介
  12. 飘逸的python - 使用图像匹配SIFT算法进行LOGO检测
  13. 各类符号汇总:希腊、数学等
  14. 网易云音乐接口大全(亲测可用)
  15. DDR3各个频率详解
  16. 笨笨图片批量下载器[C# | WinForm | 正则表达式 | HttpWebRequest]
  17. unity发射弓箭轨迹的实现
  18. 3年开发了5个私人项目:自动化办公、网站、机器人、小程序...免费开源,拿走不谢~
  19. 解决Sublime出现中文乱码的情况
  20. Canal~1:canal原理

热门文章

  1. 【狂神说Java】Spring Boot笔记
  2. 永恒python+6_永恒中心 – Eternal Center
  3. DDR的Controller、Channel、Chip、Rank、Bank、Row、Column、Sided
  4. openGL中向量的加减乘除运算
  5. 开展软件测试的目标和目的究竟是什么?
  6. python计算股票趋势_量化交易之股票选股因子——走势线性回归
  7. 一篇博客收能收录计算机网络?
  8. 推荐算法之Thompson(汤普森)采样
  9. 基于Python制作实现的推箱子小游戏
  10. GAN原理,优缺点、应用总结