r语言实现sem_利用R语言做结构方程模型分析
R的功能很强大,各种包很多。但就是因为包太多,造成了很大的麻烦。不可避免的,可以做结构方程模型的包也不少,例如:sem、psych、OpenMx,lavaan等。我选择了lavaan包。原因:语法简介易懂,上手快,支持非正态、连续数据,可以处理缺失值。
lavaan包是由比利时根特大学的Yves Rosseel开发的。lavaan的命名来自于 latent variable analysis,由每个单词的前两个字母组成,la-va-an——lavaan。
为什么说它简单呢? 主要是因为它的lavaan model syntax,如果你会R的回归分析,那它对你来说再简单不过了。
一、语法简介
语法一:f3~f1+f2(路径模型)
结构方程模型的路径部分可以看作是一个回归方程。而在R中,回归方程可以表示为y~ax1+bx2+c,“~”的左边的因变量,右边是自变量,“+”把多个自变量组合在一起。那么把y看作是内生潜变量,把x看作是外生潜变量,略去截距,就构成了lavaan model syntax的语法一。
语法二:f1 =~ item1 + item2 + item3(测量模型)
"=~"的左边是潜变量,右边是观测变量,整句理解为潜变量f1由观测变量item1、item2和item3表现。
语法三:item1 ~~ item1 , item1 ~~ item2
"~~"的两边相同,表示该变量的方差,不同的话表示两者的协方差
语法四:f1 ~ 1
表示截距
此外还有其它高阶的语法,详见lavaan的help文档,一般的结构方程建模分析用不到,就不再列出。
二、模型的三种表示方法
以验证性因子分析举例说明,对于如下图所示的模型:
方法一:最简化描述
只需指定最基本的要素即可,其他的由函数自动实现,对模型的控制力度最弱。只使用于函数cfa()和sem()
model
textual=~x4+x5+x6
speed=~x7+x8+x9'
fit
需要注意的是,这种指定模型的方式在进行拟合时,会默认指定潜变量的第一个测量变量的因子载荷为1,如果要指定潜变量的方差为1,可以:
model.bis
textual =~ NA*x4 + x5 + x6
speed =~ NA*x7 + x8 + x9
visual ~~ 1*visual
textual ~~ 1*textual
speed ~~ 1*speed'
方法二:完全描述
需要指定所有的要素,对模型控制力最强,适用于lavaan()函数,适合高阶使用者
model.full
textual =~ 1*x4 + x5 + x6
speed =~ 1*x7 + x8 +x9
x1 ~~ x1
x2 ~~ x2
x3 ~~ x3
x4 ~~ x4
x5 ~~ x5
x6 ~~ x6
x7 ~~ x7
x8 ~~ x8
x9 ~~ x9
visual ~~ visual
textual ~~ textual
speed ~~ speed
visual ~~ textual +speed
textual ~~ speed'
fit
方法三:不完全描述
最简化和完全描述的混合版,在拟合时增加 auto.* 参数,适用于lavaan()函数
model.mixed
visual =~ 1*x1 + x2 +x3
textual =~ 1*x4 + x5 + x6
speed =~ 1*x7 + x8 +x9
# factor covariances
visual ~~ textual + speed
textual ~~ speed'
fit
可以设定的参数详见help帮助文档
PS:可以在lavaan()函数里设置参数mimic="Mplus"获得与Mplus在数值和外观上相似的结果,设置mimic="EQS",输出与EQS在数值上相似的结果
三、拟合结果的查看
查看拟合结果的最简单方法是用summary()函数,例如
summary(fit, fit.measures=TRUE)
但summary()只适合展示结果,parameterEstimates()会返回一个数据框,方便进一步的处理
parameterEstimates(fit,ci=FALSE,standardized = TRUE)
获得大于10的修正指数
MI
subset(MI,mi>10)
此外,还有其他的展示拟合结果的函数,功能还是蛮强大的
四、结构方程模型
(1)设定模型
model
# measurement model
ind60 =~ x1 + x2 +x3
dem60 =~ y1 + y2 + y3 + y4
dem65 =~ y5 + y6 + y7 + y8
# regressions
dem60 ~ ind60
dem65 ~ ind60 + dem60
# redisual covariances
y1 ~~ y5
y2 ~~ y4 +y6
y3 ~~ y7
y4 ~~ y8
y6 ~~ y8'
(2)模型拟合
fit
summary(fit, standardized = TRUE)
(3)给回归系数设置标签
给回归系数设定标签在做有约束条件的结构方程模型时会很有用。当两个参数具有相同的标签时,会被视为同一个,只计算一次。
model.equal
ind60 =~ x1 + x2 + x3 +
dem60 =~ y1 + d1*y2 + d2*y3 + d3*y4
dem65 =~ y5 + d1*y6 + d2*y7 + d3*y8
# regressions
dem60 ~ ind60
dem65 ~ ind60 + dem60
# residual covariances
y1 ~~ y5
y2 ~~ y4 + y6
y3 ~~ y7
y4 ~~ y8
y6 ~~ y8'
(4)多组比较
anova(fit, fit.equal)
anova()会计算出卡方差异检验
(5)拟合系数
lavaan包可以高度定制化的计算出你想要的拟合指标值,例如,我想计算出卡方、自由度、p值、CFI、NFI、IFI、RMSEA、EVCI的值
fitMeasures(fit,c("chisq","df","pvalue","cfi","nfi","ifi","rmsea","EVCI"))
(6)多组结构方程
在拟合函数里面设置 group参数即可实现,同样的可以设置group.equal参数引入等式限制
五、作图
Amos以作图化操作见长,目前版本的Mplus也可以实现作图,那R语言呢,自然也是可以的,只不过是另一个包——semPlot,其中的semPaths()函数。
简单介绍一下semPaths()中的主要函数
semPaths(object, what = "paths", whatLabels, layout = "tree", ……)
(1)object:是拟合的对象,就是上文中的“fit”
(2)what:设定图中线的属性, 默认为paths,图中所有的线都为灰色,不显示参数估计值;
semPaths(fit)若what设定为est、par,则展示估计值,并将线的颜色、粗细、透明度根据参数估计值的大小和显著性做出改变
semPaths(fit,what = "est")若设置为stand、std,则展示标准参数估计
semPaths(fit,what = "stand")
若设置为eq、cons,则与默认path相同,如果有限制等式,被限制的相同参数会打上相同的颜色;
(3)whatLabels:设定图中线的标签name、label、path、diagram:将边名作为展示的标签
est、par:参数估计值作为边的标签
stand、std:标准参数估计值作为边的标签
eq、cons:参数号作为标签,0表示固定参数,被限制相同的参数编号相同
no、omit、hide、invisible:隐藏标签
(4)layout:布局
主要有树状和环状两种布局,每种布局又分别有两种风格。
默认为“tree”,树状的第二种风格如下图,比第一种看起来舒服都了
semPaths(fit,layout = "tree2")
第一种环状
semPaths(fit,layout = "circle")
擦,都揉成一团了!
试试第二种风格
semPaths(fit,layout = "circle2")
还好一点。如果把Rstudio默认的图片尺寸设计好,作图效果会更棒。
还有一种叫spring的布局,春OR泉?
semPaths(fit,layout = "spring")
看起来跟环状的很像。
详细内容可以阅读以下文献,以及相应的help文档:
[1]Rosseel Y. lavaan: An R package for structural equation modeling[J]. Journal of Statistical Software, 2012, 48(2): 1-36.
r语言实现sem_利用R语言做结构方程模型分析相关推荐
- 分类变量如何做结构方程模型分析呢?
分类变量如民族.家庭类型.营销方式.消费类型.动机类型等,如何应用到结构方程模型中呢? 情况1:当分类变量作为结果变量或因变量时,和一般的逻辑回归分析类似,Mplus等结构方程模型软件可以做二分类或多 ...
- Python语言学习:利用python语言实现调用内部命令(python调用Shell脚本)—命令提示符cmd的几种方法
Python语言学习:利用python语言实现调用内部命令(python调用Shell脚本)-命令提示符cmd的几种方法 目录 利用python语言实现调用内部命令-命令提示符cmd的几种方法 T1. ...
- 人口学特征或个人因素适合做结构方程模型的潜变量吗?
经常有网友问,我在做结构方程模型时要分析性别.年龄.文化程度等个人特征或个人因素对其他变量的影响,因此能否构建一个"个人特征"或"个人因素"的潜变量,其中,性别 ...
- java集成r语言_R语言- 实验报告 - 利用R语言脚本与Java相互调用
一.实训内容 利用R语言对Java项目程序进行调用,本实验包括利用R语言对java的.java文件进行编译和执行输出. 在Java中调用R语言程序.本实验通过eclipse编写Java程序的方式,调用 ...
- R语言结构方程模型分析与应用
(R语言平台:模型构建.拟合.筛选及结果发表全流程:潜变量分析:组成变量分析:非线性关系处理.非正态数据.分组数据.嵌套数据分析与处理:混合效应模型:贝叶斯方法:经典案例练习及解读) 现代统计学理论和 ...
- 【C语言基础】利用C语言简单知识点实现计算器加减乘除运算功能
利用循环语句以及函数调用实现计算器的简单功能 计算器是我们在学习生活中不可或缺的一个工具,有时候要计算一些比较复杂的数据时只能借助于计算器.基本上每个人都会使用计算器,那么如何利用C语言设计出一个自己 ...
- 1071svm函数 r语言_如何利用R语言中的rpart函数建立决策树模型
决策树是根据若干输入变量的值构造出一个适合的模型,以此来预测输出变量的值,并用树形结构展示出来.决策树主要有两个类别:分类树和回归树.分类树主要针对离散的目标变量,回归树则针对连续的目标变量.R语言中 ...
- R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化
最近我们被客户要求撰写关于混合线性模型的研究报告,包括一些图形和统计输出. 混合模型在统计学领域已经存在了很长时间.例如,标准的方差分析方法可以被看作是混合模型的特殊情况.最近,混合模型有多种应用和扩 ...
- c语言太极图编程语言,利用C语言的Cairo图形库绘制太极图实例教程.pdf
利利用用C语语言言的的Cairo图图形形库库绘绘制制太太极极图图实实例例教教程程 前前言言 可能许多人对直接用C语言绘图仍然停留在T urbo C 的graphics.h年 ,或许也有教育老化的原因, ...
最新文章
- 局部特征(6)——局部特征描述汇总
- Hyperopt TypeError: 'generator' object is not subscriptable
- 6、Java Swing JTextField:单行文本框组件
- 攻防世界-Misc-_Aesop_secret
- java错误: 找不到或无法加载主类 HelloWorld
- 递归求二叉树的深度_优雅地用堆栈替代递归实现二叉树的深度优先搜索
- (最短路)Shopping
- 图论 —— 图的搜索
- LeetCode 剑指Offer 64.求1,2到n的和, 不使用循环/判断及乘除
- 深入解析MVVM架构
- 怎么查到运行的时间_“我的成考录取通知书怎么还没来,它是不是迷路了?”...
- redis logfile 只读_docker 配置redis主从,哨兵sentinel
- FastD 最佳实践二: 构建配置中心
- HTMLCSS 第五天 笔记
- 【大数据部落】用R挖掘Twitter数据
- Spring Cloud Hystrix Dashboard仪表盘 和 Turbine集群监控 (学习总结)
- php + redis 实现延迟队列
- 《通信原理》awgn信道仿真
- F28335 eCAP配置代码(自发自检)
- Java实现Base64、DES、AES、RSA加解密以及加密方式之间的区别