我们进行GWAS分析,必须得有数据,那么什么样的数据,什么样的数据格式才能保证GWAS正常分析呢。今天主要给大家分享一下进行GWAS分析常用到的几种数据格式。

(一)*.bim/*.fam/*.bed格式为一组

其中bim文件则是存储每个遗传变异(通常是SNP)的相关信息,最后的fam存储的是样本信息,bed是存储基因型信息的。

*.bim文件, 总共6列

第一列:Chr  染色体编号

第二列:SNP  标记名称

第三列:GD  遗传距离(摩尔根),一般情况写0即可

第四列:BPP  物理距离(单位:bp)

第五列:Allele 1 一般情况下为次要等位基因

第六列:Allele 2 一般情况下为主要等位基因

*.fam文件,总共6列

第一列:FID  Family ID

第二列:IID  Within-family ID (不能是'0')

第三列:PID  Within-family ID of father ('0' if father isn't in dataset)

第四列:MID  Within-family ID of mother ('0' if mother isn't in dataset)

第五列:性别('1' = male, '2' = female, '0' = unknown)

第六列:表型('1' = control, '2' = case, '-9'/'0'/non-numeric = missing data if case/control)

*.bed文件

BED文件结构主要是二进制文件(not readable for humans),存储了群体的基因型数据。

(二)*.ped/*.map格式为一组

*ped文件, 总计6+2*n列(n:总SNP数目)

第一列:FID  Family ID

第二列:IID  Within-family ID (不能是'0')

第三列:PID  Within-family ID of father ('0' if father isn't in dataset)

第四列:MID  Within-family ID of mother ('0' if mother isn't in dataset)

第五列:性别

第六列:表型

第七列-最后一列:每个样本对应所有标记的基因型

*.map文件,总计四列

第一列:Chr  染色体编号

第二列:SNP  标记名称

第三列:GD  遗传距离(摩尔根),一般情况写0即可

第四列:BPP  物理距离(单位:bp)

另外,GWAS分析中常见到的数据格式还包括*.tfam/*.tped, *vcf,*hapmap, *.gen/*.sample格式,对于大部分格式,我们使用plink软件都可以将其互相转换,同时针对不同的模型和不同软件,基因型文件,表型文件,协变量文件可能会有些许差别,在今后分析过程中遇到具体情况会给大家再具体介绍。

GWAS分析-常用文件格式相关推荐

  1. TWAS分析与GWAS分析有什么不同

    TWAS分析与GWAS分析有什么不同 TWAS (Transcriptome-Wide Association Study) 和 GWAS (Genome-Wide Association Study ...

  2. GWAS分析中0-1-2的编码问题

    昨天一个小伙伴给我写了封信,问我了几个GWAS的问题,我就回信说,答案可以写一下公众号了. 这不,就来了. 邓老师,您好,看了好多博文,学到好多,最近看一些GWAS原理相关的内容,有些疑惑.想请教一下 ...

  3. python绘制基因结构图_使用Python绘制GWAS分析中的曼哈顿图和QQ图

    [前言]其实这篇文章是为了简单介绍一下geneview的用法,它是一个Python高级库,建立在matplotlib的基础之上,专门用于基因组数据的可视化,目的是为了使创建高大上(精致)的基因组数据图 ...

  4. GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?

    系列部分: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE? GWAS分析中SNP解释 ...

  5. 3D人脸重建和人脸分析常用的数据集汇总

    作者:Tom Hardy Date: 2019-12-31 来源:3D人脸重建和人脸分析常用的数据集汇总

  6. 常用文件格式转换大全: PDF转Word,WORD转PDF转换器,DOCX转DOC转换

    为什么80%的码农都做不了架构师?>>>    常用文件格式转换大全: Diywz - PDF转Word,WORD转PDF转换器,DOCX转DOC转换器  常用的文件格式互转工具,实 ...

  7. GWAS:mtag (Multi-Trait Analysis of GWAS) 分析

    mtag (Multi-Trait Analysis of GWAS)作用:通过对多个表型相似的GWAS summary结果进行联合分析,发现更多的表型相关基因座. 以抑郁症状.神经质和主观幸福感这三 ...

  8. 计算机常用后缀名汇总,常用文件格式大全(二)

    系统城的小编在常用文件格式大全(一)中为大家整理了以字母a开头的一些常用的文件格式,下面继续为大家整理一些以字母b和c开头的文件格式介绍,希望能够给大家带来帮助! bmp文件格式 bmp是一种与硬件设 ...

  9. 气相色谱仪分析常用的色谱定量方法有哪些?

    文章转载自:http://www.jinghe17.com/上海荆和分析仪器有限公司:气相色谱仪 便携气相色谱仪实际工作中要分析的样品往往是复杂基体中的多组分混合物,对含有未知组分的样品,必须将其分离 ...

最新文章

  1. thymeleaf引用图片_SpringBoot访问静态资源(图片、html)以及整合thymeleaf 注意点
  2. 企业IT运维管理的发展有章可寻
  3. JavaScript面向对象--封装
  4. Jzoj4755 快速荷叶叶变换
  5. Apache Curator之分布式锁原理(二)
  6. “云原生全家桶“KubeSphere 如何让企业从容迈进云原生时代?
  7. Git配置信息相关命令
  8. 数学建模安装matlab,数学建模神器——Matlab下载安装教程
  9. 百度云文字识别OCR【表格】
  10. 《先知·逸乐》| 《先知·自由》
  11. RedHat 8 dnf源配置
  12. 啥?Grafana 还能为日志添加告警?
  13. 多个txt合并成一个txt(简单易操作)
  14. ps切片成html形式怎么用,PS教程:Photoshop切片工具把效果图转成网页格式 PS入门综合 - PS学习网...
  15. conda环境(生信环境搭建)
  16. 第十二节 SprnigBoot使用定时任务
  17. java 建议使用_不建议使用构造函数Date(...)。 这是什么意思? (Java)
  18. semantic navigation 目标驱动的视觉语义导航(二)
  19. DTS 宣布华硕 ROG Phone 将支持 DTS:X Ultra 技术
  20. c语言 原子操作,原子操作

热门文章

  1. Visual Studio 与Visual C++ 有什么区别
  2. 检测图片是否含有二维码
  3. Java如何获取微信二维码内的信息
  4. PM、PD、UE与UI:互联网公司产品部门的四大角色
  5. 前端特殊空格ASCII码为160,转为32的空格
  6. OpenJDK8 编译与调试
  7. python十六进制转为二进制_Python从二进制字符串转换为十六进制
  8. 计算机应用基础课程有必要学吗,计算机应用基础课程教学心得.doc
  9. 图片分类器部署到Core ML
  10. Redis 读写分离