plink软件初体验3--计算样本杂合度和SNP位点杂合度
这里,模拟一个plink文件的数据,8个样本,8个SNP位点,通过手动Excel计算样本杂合度和位点杂合度,比较plink计算杂合度的方法。
1. 模拟数据
ped数据:
$ cat a.ped
FAMILY1 ID1 0 0 0 -9 CC CC AA GG AG GG GG GC
FAMILY1 ID2 0 0 0 -9 CC GC AG GG GG AA AG CC
FAMILY1 ID3 0 0 0 -9 GG CC AG GG GG GA AG GC
FAMILY1 ID4 0 0 0 -9 GG CC GG GG GG AA GG GG
FAMILY1 ID5 0 0 0 -9 GG CC GG GG GG AA AG GC
FAMILY1 ID6 0 0 0 -9 GG CC GG GG GG AA AA CC
FAMILY1 ID7 0 0 0 -9 GG CC GG AG AA AA GG CC
FAMILY1 ID9 0 0 0 -9 GG CC GG AG AA AA GG CC
map数据:
$ cat a.map
1 snp1 0 55910
1 snp2 0 85204
1 snp3 0 122948
1 snp4 0 203750
1 snp5 0 312707
1 snp6 0 356863
1 snp7 0 400518
1 snp8 0 487423
2. 计算样本的杂合度--het
$ plink --file a --het
结果查看:
$ cat plink.hetFID IID O(HOM) E(HOM) N(NM) FFAMILY1 ID1 6 5.32 8 0.2536FAMILY1 ID2 5 5.32 8 -0.1195FAMILY1 ID3 4 5.32 8 -0.4927FAMILY1 ID4 8 5.32 8 1FAMILY1 ID5 6 5.32 8 0.2536FAMILY1 ID6 8 5.32 8 1FAMILY1 ID7 7 5.32 8 0.6268FAMILY1 ID9 7 5.32 8 0.6268
这里:
- FID,家系ID
- IID,个体ID
- O(HOM):观察到的纯合个数
- E(HOM):期望的纯合个数
- N(NM):没有缺失的SNP个数
- F:计算的值
其中F的计算方法:
F=O−EN−EF = \frac{O-E}{N-E}F=N−EO−E
- O: O(HOM)
- E: E(HOM)
- N: N(NM)
可以这样认为,F值越小(包括负值),杂合度越高,F值越高,纯合度越高!
Excel对比
将ped文件,copy到Excel中,手动计算纯合和杂合的个数,进行统计:
3. 计算SNP位点杂合度
这里,使用参数--hardy
,可以给出位点的纯合和杂合个数:
$ plink --file a --hardy
结果:
$ cat plink.hweCHR SNP TEST A1 A2 GENO O(HET) E(HET) P1 snp1 ALL(NP) C G 2/0/6 0 0.375 0.015381 snp2 ALL(NP) G C 0/1/7 0.125 0.1172 11 snp3 ALL(NP) A G 1/2/5 0.25 0.375 0.38461 snp4 ALL(NP) A G 0/2/6 0.25 0.2188 11 snp5 ALL(NP) A G 2/1/5 0.125 0.4297 0.076921 snp6 ALL(NP) G A 1/1/6 0.125 0.3047 0.21 snp7 ALL(NP) A G 1/3/4 0.375 0.4297 11 snp8 ALL(NP) G C 1/3/4 0.375 0.4297 1
- GENO,
2/0/6
,第一个是次等位基因纯合个数,第二个是杂合个数,第三个是主等位基因纯合个数 - O(HET),是杂合所在的比值
对比Excel结果:
4. 计算SNP位点的基因频率
$ plink --file a --freq
结果查看:
$ cat plink.frqCHR SNP A1 A2 MAF NCHROBS1 snp1 C G 0.25 161 snp2 G C 0.0625 161 snp3 A G 0.25 161 snp4 A G 0.125 161 snp5 A G 0.3125 161 snp6 G A 0.1875 161 snp7 A G 0.3125 161 snp8 G C 0.3125 16
plink软件初体验3--计算样本杂合度和SNP位点杂合度相关推荐
- plink软件初体验2--常用参数
plink软件是GWAS分析中常用的软件,它也是一个数据格式,plink里面有很多非常强大的功能,运算速度很快,是我日常分析中常用的软件之一. 之前写了一系列的GWAS教程,点击这里查看,这里继续进行 ...
- 学用软件:laTex软件初体验
文章目录 一.安装LaTeX软件 1.自助法 2.打包法 二.使用LaTeX软件 1.建立第一个文档
- 不可以涩涩!AI续写软件初体验;迁移学习路线图;谷歌新闻非官方搜索API;CS295『因果推理』2021课程资料;前沿论文 | ShowMeAI资讯日报
- linux 拷机软件,拷机软件跑起来,OS X平台下OpenGL初体验
拷机软件跑起来,OS X平台下OpenGL初体验 2012-11-12 18:55:03 作者:tina Tag:Mac 热度:745℃ 苹果自成一套的体系可以尽情展示自家的技术水准,但是也会给一些程 ...
- Flink大数据实时计算系列-案例初体验:HotPages
Flink大数据实时计算系列-案例初体验:HotPages 目录 HotPages代码 输入日志 运行结果 HotPages代码 /*** Copyright (c) 2018-2028 尚硅谷 Al ...
- Synopsys初体验——软件安装篇
Synopsys初体验--软件安装篇 前言 一.虚拟机VMware的安装与使用 1.软件安装 2.创建自己的虚拟机 二.Synopsys系列软件的安装 前言 时光飞逝,转眼间已经是将要毕业的人了.之前 ...
- 我的Citavi初体验,比mendeley更好使的软件
Citavi初体验 参考文献引用格式: 在citation选项卡里,可以浏览自己想要的格式,也可以自定义格式. 中文文献import: 中文文献导入后,如果是直接导入的本地pdf文件,可能无法识别所有 ...
- Linux下plink软件使用方法,#软件工具#解密GWAS的利器--Plink 使用解析
GWAS全基因组关联分析,近年来一直为研究的热点,不管是研究复杂疾病或是遗传育种,均有广泛的用途.但是GWAS的数据动辄上千的样本数据,如何对这庞大的数据进行分析?这里我们介绍一个强大的工具--PLI ...
- oracle数据库dblink创建语句_3场直播丨达梦DM8数据库安装部署初体验、新基建下的国产数据库应用和发展趋势、Oracle外部表创建与使用...
1. 循序渐进-达梦DM8数据库安装部署初体验-07/16 简介: 本讲座主要介绍达梦DM8数据库软件安装与数据库创建. 2019年5月,DM8发布. 基于新技术发展的思考和市场的需求,坚持实用性.通 ...
- 3场直播丨达梦DM8数据库安装部署初体验、新基建下的国产数据库应用和发展趋势、Oracle外部表创建与使用...
1. 循序渐进-达梦DM8数据库安装部署初体验-07/16 简介: 本讲座主要介绍达梦DM8数据库软件安装与数据库创建. 2019年5月,DM8发布. 基于新技术发展的思考和市场的需求,坚持实用性.通 ...
最新文章
- 百度eCharts体验
- ASP.NET Menu控件子菜单弹出导致页面出现滚动条问题
- TikTok时代细分需求 牛逼亚马逊运营团队打造新爆款
- Keil 运行.bat脚本文件
- matplotlib 横坐标只显示整数_matplotlib初学:这样画折线图和添加标注、箭头
- Linux01-Linux文本编辑器vim编辑器深入详解22
- openfoam安装中出现allmake error_如何更新OpenFOAM的版本?
- 腾讯:我火了,新浪:你没有!
- div常用效果方法-transform
- [Android] 图片JNI(C++\Java)高斯模糊 多线程
- OpenDDS系列(1) —— OpenDDS 简介
- 飘逸的python - 使用图像匹配SIFT算法进行LOGO检测
- 各类符号汇总:希腊、数学等
- 网易云音乐接口大全(亲测可用)
- DDR3各个频率详解
- 笨笨图片批量下载器[C# | WinForm | 正则表达式 | HttpWebRequest]
- unity发射弓箭轨迹的实现
- 3年开发了5个私人项目:自动化办公、网站、机器人、小程序...免费开源,拿走不谢~
- 解决Sublime出现中文乱码的情况
- Canal~1:canal原理