这篇文章主要介绍了如何确定CFA和SEM等模型所需要的样本量。

尽管确定合适的样本量是SEM中的一个关键问题,但遗憾的是,文献中没有就SEM的适当样本大小达成共识。有证据表明即使样本量很小,简单的SEM模型也可以进行有意义的测试(Hoyle,1999; Hoyle和Kenny,1999; Marsh和Hau,1999),但通常,N = 100-150被认为是最小样本量用于进行SEM(Tinsley和Tinsley,1987; Anderson和Gerbing,1988; Ding,Velicer和Harlow,1995; Tabachnick和Fidell,2001)。一些研究人员认为SEM需要更大的样本量,例如,N = 200(Hoogland和Boomsma 1998; Boomsma和Hoogland,2001; Kline,2005)。模拟研究表明,对于正态分布的指标变量且没有缺失数据,简单CFA模型的合理样本大小约为N = 150(Muthén和Muthén,2002)。对于多组建模,经验法则是每组至少100个样本比较合适(Kline,2005)。

通常根据观察到的变量的数量来考虑样本大小。对于正态分布数据,Bentler和Chou(1987)建议,当潜在变量有多个指标时,每个变量低至5个案例的比例就足够了。一个广泛接受的经验法则是每个指标变量10个案例/观察变量,以此作为样本量的下限(Nunnally,1967)。

通常关注在用于确定样本大小的模型中估计的案例/观察(N)的(N:q)与自由参数(q)的数量的比率。较高的N:q比是优选的。经验法则是模型中每个自由参数至少5个案例/观察值(即N:q 5)(Bentler和Chou,1987; Bentler,1995)。对于强烈的神经数据,最小样本量应至少是自由参数数量的10倍(即N:q 10)(Hoogland和Boomsma,1998)。 Kline(1998)认为N:q比应在10或甚至20的范围内。

很多人关注样本量(N)和模型中估计的自由参数数量(q)的比率(N:q)。较高的N:q比是比较好的额。经验法则至少N/q=5(Bentler和Chou,1987年; Bentler,1995)。对于具有强烈的kurtotic数据,最小样本量应该至少是自由参数数量的10倍(即N:q > 10)(Hoogland和Boomsma,1998)。 Kline(1998)认为N:q比率应该在10甚至20以上。

还可以根据每个潜在变量/因子的指示变量的数量来考虑样本大小确定。根据一些研究人员(Marsh等,1998; Marsh和Hau,1999)认为,每个因子的观察指标越多,可以弥补小样本量的缺陷,更大的样本量可以弥补每个因素的指标较少的缺陷。对于每个因子具有6-12个指示变量的CFA模型,可以认为N = 50的样本大小是足够的,而对于每个因子具有3-4个指标的模型,样本大小应该至少为N = 100(Boomsma, 1985; Marsh和Hau,1999)。但是,如果CFA模型中每个因子只有2个指标,则所需的样本量至少应为N>400(Marsh和Hau,1999; Boomsma和Hoogland,2001)。然而,根据我们的经验,每个因素都有大量的指标/项目,在实际研究中通常很难验证量表的因子结构,因为很多误差项可能会因此而相互关联。各种原因, 通常,每个因子具有多个指标的CFA模型不能很好地拟合数据,除非在模型中指定了一些误差方差或交叉因子载荷。

确定SEM所需的样本量是非常复杂的。对于足够的样本量没有绝对的标准,没有适用于SEM中所有情况的经验法则(Muthen和Muthen,2002)。除了需要估算的自由参数的数量和每个潜在变量的指标数量之外,SEM所需的样本量还取决于与数据特征和被测试模型相关的许多其他因素,例如观察指标(Gerbing和Anderson,1985; Velicer和Fava,1998),研究设计(例如,横截面与纵向; Muthen和Muthen,2002),数据多变量正态性(West,Finch和Curran,1995; Anderson,1996),处理缺失数据(Brown,1994),模型复杂性(Kline,1998),以及模型估计(例如,ML,MLR,WLSMV)(Fan,Thompson和Wang,1999)。在简单地信任文献中给出的经验法则时,应该谨慎。相反,一些基于模型的方法,如Satorra和Saris的方法(1985)和蒙特卡罗模拟(Muthen和Muthen,2002),以及基于模型拟合指数的方法[例如,MacCallum,Browne和Sugawara的方法(1996) )和Kim的方法(2005)],越来越多地用于进行功率分析和估计特定SEM模型的样本量。在这些方法中,在给定样本大小和显着性水平(例如,1 / 0.05)或估计达到某一功率所需的样本大小(例如,0.80)的情况下估计统计功效1。

注意

本文由jupyter notebook转换而来, 您可以在这里下载notebook

有问题可以直接在下方留言

或者给我发邮件675495787[at]qq.com

请记住我的网址: mlln.cn 或者 jupyter.cn

python结构方程模型_SEM结构方程模型分析的数据需要至少多少样本量相关推荐

  1. 爬取实习吧与python相关的招聘信息及分析与数据可视化

    大数据时代,计算机行业蓬勃发展,越来越多的人投身计算机事业养家糊口.所以该如何选择工作,现在社会需要怎么样的计算机人才,我们该如何对应的提升自己的本领都是尤为重要的.这篇文章就是对实习吧招聘网站有关p ...

  2. python实现关联算法_【原创】利用python实现apriori关联算法并分析挖掘数据

    原博文 2018-12-25 18:43 − # -*- coding: utf-8 -*- import json # Aprior算法 def loadDataSet(): '''创建一个用于测试 ...

  3. Python学习:如何使用pandas分析excel数据

    1.问题 在python中,读写excel数据方法很多,比如xlrd.xlwt和openpyxl,实际上限制比较多,不是很方便.比如openpyxl也不支持csv格式.有没有更好的方法? 2.方案 更 ...

  4. 零基础小白如何使用Python分析调查数据

    进行调查和民意调查是收集数据和深入了解诸如客户为何离开我们网站等问题的最佳方法之一.还是为什么选民会吸引这位候选人?但是分析调查数据可能是一个真正的挑战! 在本教程中,我们将逐步介绍如何使用Pytho ...

  5. 分析citibike数据eda

    数据科学 (Data Science) CitiBike is New York City's famous bike rental company and the largest in the US ...

  6. python结构方程模型_结构方程模型:方法与应用_结构方程模型公式

    讲解清晰,适合MPLus学习者!注意这是王济川的书! 第一章 绪论( Introduction) 11模型表述( Model formulation 1.11测量模型( Measurernent mo ...

  7. python基于tpot训练模型在获得最佳模型之后对模型进行交叉验证分析并可视化实战

    python基于tpot训练模型在获得最佳模型之后对模型进行交叉验证分析并可视化实战 目录

  8. 基于Python的信用评分卡模型分析

    目录 一.项目流程 二.数据获取 三.数据预处理 3.1 缺失值处理 3.2 异常值处理 3.3 数据切分 信用风险计量体系包括主体评级模型和债项评级两部分.主体评级和债项评级均有一系列评级模型组成, ...

  9. [Python人工智能] 三十四.Bert模型 (3)keras-bert库构建Bert模型实现微博情感分析

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章开启了新的内容--Bert,首先介绍Keras-bert库安装及基础用法及文本分类工作.这篇文章将通过keras- ...

  10. Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据

    #2018-03-23 16:26:20 March Friday the 12 week, the 082 day SZ SSMR [Python数据挖掘学习笔记]九.回归模型LinearRegre ...

最新文章

  1. Shell、内外部命令——Linux基本命令(2)
  2. 毕业三年,贷款40万创业之后我又做回了程序员
  3. STM32系统时钟默认设置
  4. 从Http它被连接到WebSocket
  5. lisp 计算三点的夹角_已知三点坐标求夹角 - 程序语言 - 小木虫 - 学术 科研 互动社区...
  6. 从给定的N个正数中选取若干个数之和最接近M
  7. 【数据结构与算法】之深入解析“零钱兑换II”的求解思路与算法示例
  8. 数学分析(Tom M.Apostol) 定理6.7
  9. 【转】Microsoft Graph Web应用程序极致开发体验
  10. 15_采用Pull解析器解析和生成XML内容
  11. merge r语言daframe_R语言:数据框
  12. 有限元分析能具体做什么?
  13. 个税计算公式excel_财务不会做工资表?全函数统计查询、自动个税计算模板送你,给力...
  14. 【汇编实战开发笔记】80x86汇编基础的三大块知识
  15. Docker Compose network配置
  16. 圆锥形怎么画_(艺考生必看)素描圆锥体怎么画?详解过程,想提高成绩的进来!...
  17. C技能树:运算符优先级与求值顺序
  18. python的dev包怎么安装_python-dev如何安装 sudo apt-get install python-dev ?
  19. linux驱动编写之十六(块驱动设备初识)
  20. 【GIT】git常用命令

热门文章

  1. 虚拟贴图理论篇之Texture Filtering
  2. maven中filtering的使用
  3. 小象学院python数据分析课程怎么样_小象学院Python数据分析第二期【升级版】
  4. Python 开发桌面应用居然如此简单
  5. 我的世界服务器如何做无限箱子,我的世界无限箱子制作方法图文攻略
  6. Trie——BZOJ4567/Luogu3294 [Scoi2016]背单词
  7. 把两个pdf合并成一个如何解决?
  8. 树莓派3B 安装 Raspbian 系统,配置环境
  9. LeetCode1456——定长子串中元音的最大数目
  10. java日期计算天数_用Java计算两个日期之间的天数