前言

之前的GS专栏中,我们介绍了基因组选择中的理论,实践代码,数据过滤,模型介绍等。在基因组选择中,BLUP的方法应用范围最广,BLUP是混合线性模型中随机因子的效应值,因此想要了解基因组选择,混合线性模型是基础。

因此下面几篇博文中我们将系统介绍混合线性模型的基本知识,包括模型定义,公式推导,似然函数书写,方差组分估算等内容。并通过使用编程语言(RPythonJulia)实现相关操作。

理论学习和编程语言一起学习,不亦乐乎?

1. 混合模型假定

y=Xb+Zu+ey = Xb + Zu +ey=Xb+Zu+e

解释

  • y为观测值向量
  • b为固定因子效应值向量(BLUE)
  • X为固定因子关系矩阵
  • u为随机因子效应值向量(BLUP)
  • Z为随机因子关系矩阵
  • e为残差向量

假定

  • E(u) = 0 # 即BLUP值的平均值为0
  • Var(u) = G # 即BLUP值的方差为G
  • E(e)= 0 # 残差平均值为0
  • Var(e) = R # 残差方差为R
  • Cov(u,e)= 0 # 残差和BLUP相互独立,协方差为0

可以写为:
[ue]∼N([00],[G(σg)00R(σγ)])\begin{bmatrix} u\\e \end{bmatrix} \sim N (\begin{bmatrix}0\\0\end{bmatrix},\begin{bmatrix} G(\sigma_g) &0\\ 0 &R(\sigma_{\gamma})\end{bmatrix})[ue​]∼N([00​],[G(σg​)0​0R(σγ​)​])

上面的意思是u和e的平均值为0,方差为G和R,协方差为0

推断
E(y)=E(Xb+Zu+e)=E(Xb)+0+0=E(Xb)=XbE(y) = E(Xb + Zu + e) = E(Xb) + 0 + 0 = E(Xb) = Xb E(y)=E(Xb+Zu+e)=E(Xb)+0+0=E(Xb)=Xb

Var(y)=Var(Xb+Zu+e)=Var(Zu)+Var(e)=ZVar(u)Z′+R=ZGZ′+RVar(y) = Var(Xb + Zu + e) = Var(Zu) + Var(e) = ZVar(u)Z' + R = ZGZ' + R Var(y)=Var(Xb+Zu+e)=Var(Zu)+Var(e)=ZVar(u)Z′+R=ZGZ′+R

2. 固定,随机和混合模型

2.1 固定模型

所有效应都是固定效应,对应的就是没有随机效应,称为固定模型

y=Xb+ey = Xb + e y=Xb+e

E(y)=XbE(y) = XbE(y)=Xb
Var(y)=Var(Xb+e)=Var(e)=RVar(y) = Var(Xb + e ) = Var(e) = RVar(y)=Var(Xb+e)=Var(e)=R

2.2 随机模型

所有效应都是随机效应,对应的就是没有固定效应,称为随机模型

y=1μ+Zu+ey = 1\mu + Zu +e y=1μ+Zu+e

E(y)=1μE(y) = 1\muE(y)=1μ
Var(u)=GVar(u) = G Var(u)=G
Var(e)=RVar(e) = R Var(e)=R
Var(y)=ZGZ′+RVar(y) = ZGZ' + R Var(y)=ZGZ′+R

2.3 混合模型

既有固定因子,又有随机因子,称为混合模型

y=Xb+Zu+ey = Xb + Zu + e y=Xb+Zu+e

E(y)=XbE(y) = XbE(y)=Xb
Var(u)=GVar(u) = GVar(u)=G
Var(e)=RVar(e) = RVar(e)=R
Var(y)=ZGZ′+RVar(y) = ZGZ' + R Var(y)=ZGZ′+R

3. 向量计算方差公式推导

如果a是向量,y = ax, 如果var(x) = V, 那么var(y) = var(ax) = aVar(x)a’ = aVa’, 下面是具体描述

假定:
y=a′xy = a'xy=a′x
Y=AXY = AXY=AX
X是随机向量,并且Var(X)=VVar(X) = VVar(X)=V,那么:
Var(y)=a′Var(x)a=a′VaVar(y) = a'Var(x)a = a'VaVar(y)=a′Var(x)a=a′Va
Var(Y)=AVar(x)A′=AVA′Var(Y) = AVar(x)A' = AVA'Var(Y)=AVar(x)A′=AVA′

4. 混合线性模型为何适合分析动植物育种数据

模型假定优势: 一般线性模型 VS 混合线性模型:

  • 一般线性模型要求数据是独立的,混合线性模型不要求,可以定义随机因子的关系矩阵A, G, H来分析相关数据
  • 一般线性模型要求数据是齐次的,混合线性模型不要求,可以定义不同水平独立残差分布,或者残差关系矩阵

动植物育种数据特点:

  • 个体间有亲缘关系,无论是IBD,还是IBS,可以通过A矩阵,G矩阵,H矩阵定义
  • 不同地点,不同场,不同年,方差分布通常不是齐次的
  • 数据经常有缺失或者数据不平衡

这些特点,使用混合线性模型非常适合分析动植物育种数据。依据混合线性模型的BLUP值进行排名,是最好的,无偏的,最佳预测的值。

5. 参考文献

张勤. 动物遗传育种中的计算方法[M]. 科学出版社, 2007.
吴密霞. 线性混合效应模型引论[M]. 科学出版社, 2013.

混合线性模型笔记1:模型假定相关推荐

  1. R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化

    最近我们被客户要求撰写关于混合线性模型的研究报告,包括一些图形和统计输出. 混合模型在统计学领域已经存在了很长时间.例如,标准的方差分析方法可以被看作是混合模型的特殊情况.最近,混合模型有多种应用和扩 ...

  2. 混合线性模型学习笔记1

    1. 课程来源: https://02429.compute.dtu.dk/Frontpage 需要安装的R包 install.packages(c('lmerTest', 'lsmeans', 'c ...

  3. 混合线性模型+mixed linear model+GEEs+GLMM+LMM

    混合线性模型+mixed linear model+GEEs+GLMM+LMM 线性回归 广义线性回归 混合线性模型/线性混合模型 的区别是什么? spss中遇见线性混合模型 价值,意义,目的是什么? ...

  4. R语言对数线性模型loglm函数_使用R语言进行混合线性模型(mixed linear model) 分析代码及详解...

    1.混合线性模型简介 混合线性模型,又名多层线性模型(Hierarchical linear model).它比较适合处理嵌套设计(nested)的实验和调查研究数据.此外,它还特别适合处理带有被试内 ...

  5. 一般线性模型和混合线性模型_线性混合模型如何工作

    一般线性模型和混合线性模型 生命科学的数学统计和机器学习 (Mathematical Statistics and Machine Learning for Life Sciences) This i ...

  6. 非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二

    前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...

  7. 一般线性模型和线性回归模型_您的线性回归模型指南

    一般线性模型和线性回归模型 Interpretability is one of the biggest challenges in machine learning. A model has mor ...

  8. 关于R语言中混合线性模型summary()结果中交互作用beta值的含义

    本文以2*2的实验设计为例,利用lmerTest包在R中进行混合线性模型分析,采用sum的因子编码方式,简单介绍一下在summary的结果中,交互作用的beta值的含义. 数据准备: library( ...

  9. 基于HBIC准则的混合PPCA的有效模型选择

    基于HBIC准则的混合PPCA的有效模型选择 1 引言 2 Mixtures of probabilistic PCA(MPCA) 2.1 EM 算法 3 模型选择方法 3.1 two-stage m ...

  10. 基于R的混合线性模型的实现

    作者:张光耀,硕士研究生,现就读于中科院心理所, GitHub 主页: https://github.com/usplos 前言 为什么要用混合线性模型:比如测量了不同收入水平的人群的收入和幸福感,但 ...

最新文章

  1. 收藏 | 多目标跟踪(MOT)入门
  2. redis源码之字符串压缩
  3. Kafka学习 之 理解Kafka集群(二)
  4. SAP UI5应用的footer区域绘制原理和入口
  5. [(转)hystar整理]Entity Framework 教程
  6. 019,Intelidea右键新建选项没有Java class选项
  7. linux开启和关闭防火墙
  8. 自然语言处理 | (30) 文本相似度计算与文本匹配问题
  9. 【科研人必备】各大英文期刊投稿必备搜索/文章相关推荐投稿搜索方法
  10. 斐讯w2换表盘_斐讯W2智能手表初体验:路由不要钱!手表也白送!
  11. 手机上定时日程提醒怎么设置?
  12. 系统主题修改桌面嵌入html,更换主题桌面主题 Win7桌面动态主题怎么更换
  13. HTML用画布画哆啦A梦,前端小项目:使用canvas绘画哆啦A梦
  14. csgo删除机器人_《CS:GO》更新移除补位机器人并调整地图和修复bug
  15. Lesson 56 Faster than sound! 比声音还快!
  16. java注解与APT技术
  17. MaxWell抓取数据
  18. Spark分布式计算原理
  19. 数论相关_最大公约数最小公倍数
  20. bem什么意思_BEM的定义

热门文章

  1. 获取全年所有节假日非工作日
  2. JAVA智能分析的简单聚众筹平台计算机毕业设计Mybatis+系统+数据库+调试部署
  3. 生物统计学(biostatistics)学习笔记(三)
  4. PHP手机网店管理系统
  5. Request 请求转发
  6. 西门子200plc与英威腾GD变频器modbus通讯
  7. 瑞能实业IPO被终止:年营收4.47亿 曾拟募资3.76亿
  8. HTML怎么引入字体包中的字体
  9. 某大型连锁超市库存管理系统分析报告
  10. cisp-pte考试经验分享