混合线性模型笔记1:模型假定
前言
之前的GS专栏中,我们介绍了基因组选择中的理论,实践代码,数据过滤,模型介绍等。在基因组选择中,BLUP的方法应用范围最广,BLUP是混合线性模型中随机因子的效应值,因此想要了解基因组选择,混合线性模型是基础。
因此下面几篇博文中我们将系统介绍混合线性模型的基本知识,包括模型定义,公式推导,似然函数书写,方差组分估算等内容。并通过使用编程语言(R
,Python
,Julia
)实现相关操作。
理论学习和编程语言一起学习,不亦乐乎?
1. 混合模型假定
y=Xb+Zu+ey = Xb + Zu +ey=Xb+Zu+e
解释
- y为观测值向量
- b为固定因子效应值向量(BLUE)
- X为固定因子关系矩阵
- u为随机因子效应值向量(BLUP)
- Z为随机因子关系矩阵
- e为残差向量
假定
- E(u) = 0 # 即BLUP值的平均值为0
- Var(u) = G # 即BLUP值的方差为G
- E(e)= 0 # 残差平均值为0
- Var(e) = R # 残差方差为R
- Cov(u,e)= 0 # 残差和BLUP相互独立,协方差为0
可以写为:
[ue]∼N([00],[G(σg)00R(σγ)])\begin{bmatrix} u\\e \end{bmatrix} \sim N (\begin{bmatrix}0\\0\end{bmatrix},\begin{bmatrix} G(\sigma_g) &0\\ 0 &R(\sigma_{\gamma})\end{bmatrix})[ue]∼N([00],[G(σg)00R(σγ)])
上面的意思是u和e的平均值为0,方差为G和R,协方差为0
推断
E(y)=E(Xb+Zu+e)=E(Xb)+0+0=E(Xb)=XbE(y) = E(Xb + Zu + e) = E(Xb) + 0 + 0 = E(Xb) = Xb E(y)=E(Xb+Zu+e)=E(Xb)+0+0=E(Xb)=Xb
Var(y)=Var(Xb+Zu+e)=Var(Zu)+Var(e)=ZVar(u)Z′+R=ZGZ′+RVar(y) = Var(Xb + Zu + e) = Var(Zu) + Var(e) = ZVar(u)Z' + R = ZGZ' + R Var(y)=Var(Xb+Zu+e)=Var(Zu)+Var(e)=ZVar(u)Z′+R=ZGZ′+R
2. 固定,随机和混合模型
2.1 固定模型
所有效应都是固定效应,对应的就是没有随机效应,称为固定模型
y=Xb+ey = Xb + e y=Xb+e
E(y)=XbE(y) = XbE(y)=Xb
Var(y)=Var(Xb+e)=Var(e)=RVar(y) = Var(Xb + e ) = Var(e) = RVar(y)=Var(Xb+e)=Var(e)=R
2.2 随机模型
所有效应都是随机效应,对应的就是没有固定效应,称为随机模型
y=1μ+Zu+ey = 1\mu + Zu +e y=1μ+Zu+e
E(y)=1μE(y) = 1\muE(y)=1μ
Var(u)=GVar(u) = G Var(u)=G
Var(e)=RVar(e) = R Var(e)=R
Var(y)=ZGZ′+RVar(y) = ZGZ' + R Var(y)=ZGZ′+R
2.3 混合模型
既有固定因子,又有随机因子,称为混合模型
y=Xb+Zu+ey = Xb + Zu + e y=Xb+Zu+e
E(y)=XbE(y) = XbE(y)=Xb
Var(u)=GVar(u) = GVar(u)=G
Var(e)=RVar(e) = RVar(e)=R
Var(y)=ZGZ′+RVar(y) = ZGZ' + R Var(y)=ZGZ′+R
3. 向量计算方差公式推导
如果a是向量,y = ax, 如果var(x) = V, 那么var(y) = var(ax) = aVar(x)a’ = aVa’, 下面是具体描述
假定:
y=a′xy = a'xy=a′x
Y=AXY = AXY=AX
X是随机向量,并且Var(X)=VVar(X) = VVar(X)=V,那么:
Var(y)=a′Var(x)a=a′VaVar(y) = a'Var(x)a = a'VaVar(y)=a′Var(x)a=a′Va
Var(Y)=AVar(x)A′=AVA′Var(Y) = AVar(x)A' = AVA'Var(Y)=AVar(x)A′=AVA′
4. 混合线性模型为何适合分析动植物育种数据
模型假定优势: 一般线性模型 VS 混合线性模型:
- 一般线性模型要求数据是独立的,混合线性模型不要求,可以定义随机因子的关系矩阵A, G, H来分析相关数据
- 一般线性模型要求数据是齐次的,混合线性模型不要求,可以定义不同水平独立残差分布,或者残差关系矩阵
动植物育种数据特点:
- 个体间有亲缘关系,无论是IBD,还是IBS,可以通过A矩阵,G矩阵,H矩阵定义
- 不同地点,不同场,不同年,方差分布通常不是齐次的
- 数据经常有缺失或者数据不平衡
这些特点,使用混合线性模型非常适合分析动植物育种数据。依据混合线性模型的BLUP值进行排名,是最好的,无偏的,最佳预测的值。
5. 参考文献
张勤. 动物遗传育种中的计算方法[M]. 科学出版社, 2007.
吴密霞. 线性混合效应模型引论[M]. 科学出版社, 2013.
混合线性模型笔记1:模型假定相关推荐
- R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化
最近我们被客户要求撰写关于混合线性模型的研究报告,包括一些图形和统计输出. 混合模型在统计学领域已经存在了很长时间.例如,标准的方差分析方法可以被看作是混合模型的特殊情况.最近,混合模型有多种应用和扩 ...
- 混合线性模型学习笔记1
1. 课程来源: https://02429.compute.dtu.dk/Frontpage 需要安装的R包 install.packages(c('lmerTest', 'lsmeans', 'c ...
- 混合线性模型+mixed linear model+GEEs+GLMM+LMM
混合线性模型+mixed linear model+GEEs+GLMM+LMM 线性回归 广义线性回归 混合线性模型/线性混合模型 的区别是什么? spss中遇见线性混合模型 价值,意义,目的是什么? ...
- R语言对数线性模型loglm函数_使用R语言进行混合线性模型(mixed linear model) 分析代码及详解...
1.混合线性模型简介 混合线性模型,又名多层线性模型(Hierarchical linear model).它比较适合处理嵌套设计(nested)的实验和调查研究数据.此外,它还特别适合处理带有被试内 ...
- 一般线性模型和混合线性模型_线性混合模型如何工作
一般线性模型和混合线性模型 生命科学的数学统计和机器学习 (Mathematical Statistics and Machine Learning for Life Sciences) This i ...
- 非期望产出的sbm模型_线性模型 vs. Logistic模型——离散选择模型之二
前言:为什么因变量是分类变量的时候,我们会选择Logistic模型.而非最常见的线性回归模型?或者,换个说法:线性回归模型的劣势是什么?Logistic模型的优势又是什么?--针对这些问题,本文为您详 ...
- 一般线性模型和线性回归模型_您的线性回归模型指南
一般线性模型和线性回归模型 Interpretability is one of the biggest challenges in machine learning. A model has mor ...
- 关于R语言中混合线性模型summary()结果中交互作用beta值的含义
本文以2*2的实验设计为例,利用lmerTest包在R中进行混合线性模型分析,采用sum的因子编码方式,简单介绍一下在summary的结果中,交互作用的beta值的含义. 数据准备: library( ...
- 基于HBIC准则的混合PPCA的有效模型选择
基于HBIC准则的混合PPCA的有效模型选择 1 引言 2 Mixtures of probabilistic PCA(MPCA) 2.1 EM 算法 3 模型选择方法 3.1 two-stage m ...
- 基于R的混合线性模型的实现
作者:张光耀,硕士研究生,现就读于中科院心理所, GitHub 主页: https://github.com/usplos 前言 为什么要用混合线性模型:比如测量了不同收入水平的人群的收入和幸福感,但 ...
最新文章
- 收藏 | 多目标跟踪(MOT)入门
- redis源码之字符串压缩
- Kafka学习 之 理解Kafka集群(二)
- SAP UI5应用的footer区域绘制原理和入口
- [(转)hystar整理]Entity Framework 教程
- 019,Intelidea右键新建选项没有Java class选项
- linux开启和关闭防火墙
- 自然语言处理 | (30) 文本相似度计算与文本匹配问题
- 【科研人必备】各大英文期刊投稿必备搜索/文章相关推荐投稿搜索方法
- 斐讯w2换表盘_斐讯W2智能手表初体验:路由不要钱!手表也白送!
- 手机上定时日程提醒怎么设置?
- 系统主题修改桌面嵌入html,更换主题桌面主题 Win7桌面动态主题怎么更换
- HTML用画布画哆啦A梦,前端小项目:使用canvas绘画哆啦A梦
- csgo删除机器人_《CS:GO》更新移除补位机器人并调整地图和修复bug
- Lesson 56 Faster than sound! 比声音还快!
- java注解与APT技术
- MaxWell抓取数据
- Spark分布式计算原理
- 数论相关_最大公约数最小公倍数
- bem什么意思_BEM的定义