小编寄语

一直以来,GWAS和GS一直是分家的,各搞各的,交叉很少。两者都是基于统计分析,GWAS重点在于找到显著性的SNP位点,找到关联性状的基因。GS的重点在于计算个体的育种值,进行排名选择。

基因组选择基于BLUP的方法(GBLUP,SSGBLUP)省略了SNP效应的估算,直接计算育种值(BLUP),随着基因组选择在育种中广泛的实施,GS和GWAS的结合变得更有意义:

  • GWAS得到的显著性位点受限于群体的结构以及效应大小,于是基于少数位点的MAS(分子标记辅助育种)也应用受限。
  • GWAS分析中,需要个体都要有基因型信息,而实际育种中,有大量仅有系谱关系的表型数据,这些数据可以通过一步法(single-step)应用到基因组选择中,但是GWAS分析一直是个难点。
  • GWAS分析中,虽然可以通过PCA或者群体结构作为固定因子矫正模型,但是动物育种中有很多成熟的模型,比如母体效应,永久环境效应,可以放到随机效应中。
  • 如果可以在一步法中,应用GWAS,将特定群体的位点挖掘出来,用于特定群体的MAS,实践意义非常大。

blupf90软件在2014年就提出了SSGWAS,但是只能计算SNP的效应值,没有办法计算SNP的P-value,下面这篇文章介绍他们的团队对软件进行了升级,使得preGSf90模块可以计算SNP的P-value。这样,就可以在动物育种中使用了,特别是有大量系谱信息和一部分基因型信息以及大量表型信息的育种群体,基于GS和SSGWAS的MAS在特定群体的选择更具前景!

1. 文献

https://gsejournal.biomedcentral.com/track/pdf/10.1186/s12711-019-0469-3

2. 摘要

背景

一步法(SSGBLUP)在基因组育种中广泛应用,SSGWAS在此框架下一致没有显著性检验,我们的目的在于开发SSGWAS的显著性检验(p-value),并且在实际数据中进行了测试。

Single-step genomic best linear unbiased prediction (SSGBLUP) is a comprehensive method for
genomic prediction. Point estimates of marker efects from SSGBLUP are often used for genome-wide association
studies (GWAS) without a formal framework of hypothesis testing. Our objective was to implement p-values for singlemarker GWAS studies within the single-step GWAS (SSGWAS) framework by deriving computational algorithms and
procedures, and by applying these to a large beef cattle population

方法

P-values were obtained based on the prediction error (co)variances for single nucleotide polymorphisms
(SNPs), which were obtained from the prediction error (co)variances of genomic predictions based on the inverse of
the coefcient matrix and formulas to estimate SNP efects.

结果

Computation of p-values took a negligible time for a dataset with almost 2 million animals in the pedigree
and 1424 genotyped sires, and no infation of statistics was observed. The SNPs that passed the Bonferroni threshold
of 10−5.9 were the same as those that explained the highest proportion of additive genetic variance, but even at the
same signifcance levels and efects, some of them explained less genetic variance due to lower allele frequency

结论

The use of a p-value for SSGWAS is a very general and efcient strategy to identify quantitative trait
loci (QTL). It can be used for complex datasets such as those used in animal breeding, where only a proportion of the
pedigreed animals are genotyped.

3. EMMAX VS SSGWAS

EMMAX框架:

  • 依赖于单标记作为固定因子回归分析的混合线性模型框架,代表软件EMMAX,需要所有个体都有基因型和表型,这在动物育中不现实
  • 一些性状是限性性状,无法直接利用,需要调整值,比如公牛产奶量,使用De-regression value,使用其进行GWAS分析,丧失信息,不准确,特别是测序个体中包括公牛和它的后代,会重复计算(double-counting)
  • 单个SNP回归分析时,如果都要估算方差组分,使用的REML会很慢

SSGWAS框架:

  • 将估算方差组分和考虑群体结构同时进行(SSGBLUP方法),使用系谱数据和基因型数据,表型数据。
  • 使用SSGBLUP可以同时计算育种值和SNP效应值,而且有文献已经证明GBLUP和单位点GWAS(EMMAX)是等价的,
  • SSGWAS框架可以将测序个体和非测序个体合并一起进行分析,这应用价值非常大

4. SSGWAS算法框架

第一步:构建H矩阵

第二步:构建混合线性方程组

第三步:计算系数矩阵稀疏逆矩阵

第四步:求解方程组

第五步:计算育种值

第六步:计算SNP效应值

第七步:计算标准误

第八步:计算SNP的P-value

5. 结果

6. 软件操作

使用blupf90家族中的preGSf90程序,计算p-value时使用的参数是OPTION snp_p_value。软件下载:
http://nce.ads.uga.edu/html/projects/programs/Linux/64bit/

GWAS和GS的结合:Single Step GWAS的应用相关推荐

  1. R Packages for GWAS and GS

    rrBLUP(rrBLUPMethod6: re-parametrization of RR-BLUP to allow a fixed residual variance) BLR(功能加强BGLR ...

  2. GWAS分析中0-1-2的编码问题

    昨天一个小伙伴给我写了封信,问我了几个GWAS的问题,我就回信说,答案可以写一下公众号了. 这不,就来了. 邓老师,您好,看了好多博文,学到好多,最近看一些GWAS原理相关的内容,有些疑惑.想请教一下 ...

  3. 【生信】全基因组关联分析(GWAS)原理

    [生信]全基因组关联分析(GWAS)原理 文章的文字/图片/代码部分/全部来源网络或学术论文,文章会持续修缮更新,仅供大家学习使用. 目录 [生信]全基因组关联分析(GWAS) 1.前提知识介绍 1. ...

  4. 全基因组关联分析(GWAS)

    全基因组关联分析是一种在人类或动植物全基因组中寻找变异序列的方法,全英文名为Genome-wide association study,缩写名为GWAS. 2005年,Science杂志报道了第一篇G ...

  5. 使用TASSEL学习GWAS笔记(1/6):读取plink基因型数据和表型数据

    今天整理一下TASSEL操作GWAS的笔记. 笔记计划分为六篇: 第一篇:读取plink基因型数据和表型数据 第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控 第三篇:基因型数据可 ...

  6. GWAS中最少需要的SNP标记个数计算方法

    GWAS和GS分析中,都有一个假定:假定至少有一个SNP标记与所控制性状的QTL(基因)处于连锁不平衡状态(LD),那怎么满足这个条件呢,就需要覆盖全基因组的标记,需要计算群体LD的衰减距离,进而计算 ...

  7. GWAS分析中SNP解释百分比PVE | 第四篇,MLM模型中如何手动计算PVE?

    系列部分: GWAS分析中SNP解释百分比PVE | 第一篇,SNP解释百分比之和为何大于1? GWAS分析中SNP解释百分比PVE | 第二篇,GLM模型中如何计算PVE? GWAS分析中SNP解释 ...

  8. gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著?

    之前的GWAS分析中,我查看结果时有过这个疑问,随着不断的学习理解,我已经知道了为什么,这里将我思考的结果分享一下. 1. 错误的理解 某一个SNP,效应值(Effect)越大,就越显著??? 「事实 ...

  9. GWAS研究和多基因评分

    2.GWAS研究和多基因评分 GWAS的一般思想是扫描样本中所有测量到的单核苷酸多态性(SNPs)与结果的关联,使用可能的环境混杂进行严格的控制和多重测试.除了测量到的SNPs,GWAS还使用典型的填 ...

最新文章

  1. 美博士环保聚焦“限漆令”出台之后的涂料行业
  2. DevExpress TreeList 调优_绑定数据源方式, 放弃原来的AppendNode加载数据的方式
  3. MATLAB从入门到精通-控制系统动态特性的计算以及阶跃响应波德图等
  4. IP地址中的网络地址和主机地址分别是什么意思?怎么计算的呢?
  5. while用法_语法||由一句译文聊聊while的用法
  6. oracle学习--循环语句
  7. redis的常用命令及实例讲解
  8. 用.NET解索尼相机ARW格式照片
  9. Matlab矩阵查找
  10. ubuntu修改ssh服务的端口号
  11. pytest+allure测试框架搭建
  12. 互联网日报 | 7月15日 星期四 | B站赠送所有用户1天大会员;饿了么投入3亿用于今夏骑手保障;小米智能工厂二期开工...
  13. C++ opengl 绘制三角形带
  14. android adb调试驱动,安卓手机上的调试工具adb驱动要怎么安装 手机安装adb驱动怎么做 - 驱动管家...
  15. 爬虫使用分享:风云2号卫星气象照片
  16. dejavu歌曲识别介绍
  17. 【剖析 | SOFARPC 框架】之SOFARPC 连接管理与心跳剖析
  18. CnOpenData中国各区县工商注册企业分年份数量统计(含新增,注销企业数量)
  19. Windows下PySpark的配置
  20. 【经验分享】桥接网络无法联网、开发板挂载根文件系统问题解决

热门文章

  1. PHP检测字数,PHP获取word文档字数的问题
  2. RLC并联谐振电路分析
  3. 韩国研发人工智能武器 遭30国专家联名抵制:和你绝交!
  4. 农银e管家怎么显示服务器不对,农银e管家电脑版
  5. 设计模式(二)(C++)
  6. oracle11g典型安装出错,oracle11g 安装错误汇总
  7. 云宏大讲坛 | 饭局排桌子,排出了分布式资源调度高级规则
  8. 计算机启动时蓝屏后自动重起,电脑蓝屏_处理电脑开机蓝屏自动重启
  9. 程序黑框中出现:(路径)用作为当前目录的以上路径启动了 CMD.EXE。 UNC 路径不受支持,默认值设为 Windows 目录。
  10. 安装Ubuntu的时候屏幕太小看不到下一步,点不到继续按钮