【SEM】1 基本概念

2018-2020结构方程笔记整理
资料by扬帆老师

(1)结构方程概述

结构方程(SEM, Structual Equation modeling)是一种检验潜变量和观测变量之间关系的假设的统计方法。

SEM框架下主要处理的两类变量:观测变量(observed variable)、潜变量(latent variable)

常见的观测变量:测试的分数、问卷的回答、其他数值材料……

常见的潜变量:
心理学——智力、抑郁、自尊心、饮酒行为、感受
社会学——社会阶层、职业期待、抱负、歧视
经济——经济预期、妇女赋权
商业——顾客满意度、顾客忠诚度
政治科学——工业发展程度、政治影响力

SEM可以:
1、研究测量值(measure)、被测量值之间的区别
2、研究潜变量,以及潜变量之间的关系
3、评价关于潜变量以及其测量值的理论模型
4、 对因果关系(causal relation)建模,以预测在一个复杂系统中,干预(interventions)如何产生影响

(2)图表语法

图形 含义
椭圆 潜变量、未观测到的变量
矩形 观测变量
连接两个变量的一个、单向、直箭头 因果关系,箭头尾导致箭头尖
连接两个变量的两个、单向、直箭头 反馈关系( feedback relation)或互为因果关系
连接两个变量的一个、双向、弯箭头 关联关系

(3)主要模型及符号含义

1、测量模型

x=λxξ+δy=λyη+ϵx = \lambda_x\xi + \delta \\ y = \lambda_y\eta + \epsilonx=λx​ξ+δy=λy​η+ϵ
假设E(ξ)=0,E(η)=0,E(δ)=0,E(ϵ)=0E(\xi)=0,E(\eta) = 0,E(\delta)=0,E(\epsilon)=0E(ξ)=0,E(η)=0,E(δ)=0,E(ϵ)=0,且ϵ≠δ≠ξ,η\epsilon \neq \delta \neq \xi, \etaϵ​=δ​=ξ,η

方程中符号具体含义如下表

主要研究:观察变量x能否准确测量潜变量ξ\xiξ,每个xi的可信度(应做“系数大小”理解?)

例子:

2、结构模型
η=Bη+Γξ+ζ\eta = B\eta+\Gamma\xi+\zetaη=Bη+Γξ+ζ
假设E(η)=0,E(ξ)=0,E(ζ)=0E(\eta)=0,E(\xi) = 0,E(\zeta)=0E(η)=0,E(ξ)=0,E(ζ)=0,且ζ,ξ\zeta ,\xiζ,ξ不相关,(I−B)(I-B)(I−B)是非奇异阵
方程中符号具体含义如下表

主要研究:潜变量间的因果关系及其大小

例子:

latent endogenous variables-内生潜变量
latent exogenous variables-外生潜变量

(4)典型理论模型

1、一个潜变量对应一个观测变量

2、一个潜变量对应多个观测变量

3、潜变量之间存在因果关系

4、潜变量之间存在关联关系

例:“教育成就与期待模型”(Educational Achievement and Aspirations Model)的路径图(path diagram)

(5)关键环节

1、相关理论

  • 概念
  • 结构
  • 形式化(Formalization)

2、基本问题

  • 因果关系
  • 模型构建:理论驱动or数据驱动
  • 探索性分析or验证性分析
  • 测量单位、标准化
  • 尺度类型(Scale types)

3、统计相关问题

  • 模型的规范化
  • 模型和参数的识别
  • 模型和参数的估计
  • 模型的拟合和检验:评估拟合效果、检测未拟合部分(Detection of lack of fit)
  • 检验关于结构的假设

4、计算相关问题

例子:计划行为理论(TPB)

  • 理论模型
  • Path diagram

(6)软件:LISREL

LISREL主要用于:

  • 模型构建
  • 精确估计和评估拟合效果
  • 拟合和测试许多标准和非标准模型(non-standard models)

PRELIS主要用于:

  • 处理数据:筛选、探索、摘要
  • 计算:协方差矩阵、相关矩阵、动量矩阵(Moment matrix)、渐近协方差矩阵

(7)协方差代数

基本假设:H0:Σ=Σ(θ)H_0:\Sigma = \Sigma(\theta)H0​:Σ=Σ(θ)

目的:选择合适的参数θ,使Σ(θ)\Sigma(\theta)Σ(θ)和样本协方差矩阵S尽量接近

Σ\SigmaΣ:方程中观测变量一侧对应的协方差阵,下三角
θ\thetaθ:观测变量对应的向量
Σ(θ)\Sigma(\theta)Σ(θ):方程中潜变量一侧对应的协方差阵,下三角

例子:简单回归 y=γx+zy=\gamma x+zy=γx+z

Σ=(var(y)cov(x,y)var(x))\begin{gathered} \Sigma = \begin{pmatrix} var(y) & \\cov(x, y) & var(x) \end{pmatrix} \end{gathered} Σ=(var(y)cov(x,y)​var(x)​)​

θ′=[γ,var(x),var(z)]\theta'=[\gamma,var(x),var(z)]θ′=[γ,var(x),var(z)]

Σ(θ)=(γ2var(x)+var(z)γvar(x)var(x))\begin{gathered} \Sigma(\theta) = \begin{pmatrix} \gamma^2 var(x) + var(z) & \\ \gamma var(x) & var(x) \end{pmatrix} \end{gathered} Σ(θ)=(γ2var(x)+var(z)γvar(x)​var(x)​)​

当满足条件:
cov(x,y)=cov(x,γx+z)=γcov(x,x)+cov(x,z)=γvar(x)cov(x, y)=cov(x, \gamma x+z)=\gamma cov(x, x)+cov(x, z)=\gamma var(x)cov(x,y)=cov(x,γx+z)=γcov(x,x)+cov(x,z)=γvar(x),即cov(x,z)=0cov(x, z)=0cov(x,z)=0时,有Σ=Σ(θ)\Sigma=\Sigma(\theta)Σ=Σ(θ)

例子:简单因子分析
y1=η+ϵ1,y2=η+ϵ2y1=\eta+\epsilon1,y2=\eta+\epsilon2y1=η+ϵ1,y2=η+ϵ2

(var(y1)cov(y1,y2)var(y2))=(var(η)+var(ϵ1)var(η)var(η)+var(ϵ2))\begin{gathered} \begin{pmatrix} var(y1) & \\ cov(y1,y2) & var(y2) \end{pmatrix} = \begin{pmatrix} var(\eta) + var(\epsilon1) & \\ var(\eta) & var(\eta) + var(\epsilon2) \end{pmatrix} \end{gathered} (var(y1)cov(y1,y2)​var(y2)​)=(var(η)+var(ϵ1)var(η)​var(η)+var(ϵ2)​)​

当满足条件:
cov(y1,y2)=cov(η+ϵ1,η+ϵ2)=cov(η,η)=var(η)cov(y1, y2)=cov(\eta+\epsilon1, \eta +\epsilon2)=cov(\eta, \eta)=var(\eta)cov(y1,y2)=cov(η+ϵ1,η+ϵ2)=cov(η,η)=var(η),即cov(x,z)=0cov(x, z)=0cov(x,z)=0 时,有Σ=Σ(θ)\Sigma=\Sigma(\theta)Σ=Σ(θ),即
cov(η,ϵ1),cov(η,ϵ2),cov(ϵ1,ϵ2)=0cov(\eta,\epsilon1),cov(\eta,\epsilon2),cov(\epsilon1,\epsilon2)=0cov(η,ϵ1),cov(η,ϵ2),cov(ϵ1,ϵ2)=0

例子:通用SEM模型
y=γξ+ζ,x1=ξ+δ1,x2=ξ+δ2y=\gamma \xi+ \zeta,x1=\xi+\delta1,x2=\xi+\delta2y=γξ+ζ,x1=ξ+δ1,x2=ξ+δ2

Σ=(var(y)cov(x1,y)var(x1)cov(x2,y)cov(x2,x1)var(x2))\begin{gathered} \Sigma= \begin{pmatrix} var(y) & & \\ cov(x1, y) & var(x1) & \\ cov(x2, y) & cov(x2, x1) & var(x2) \end{pmatrix} \end{gathered} Σ=⎝⎛​var(y)cov(x1,y)cov(x2,y)​var(x1)cov(x2,x1)​var(x2)​⎠⎞​​

Σ(θ)=(γ2var(ξ)+var(ζ)γvar(ξ)var(ξ)+var(δ1)γvar(ξ)var(ξ)var(ξ)+var(δ2))\begin{gathered} \Sigma(\theta)= \begin{pmatrix} \gamma^2 var(\xi) + var(\zeta)& & \\ \gamma var(\xi) & var(\xi)+var(\delta1) & \\ \gamma var(\xi) & var(\xi) & var(\xi)+var(\delta2) \end{pmatrix} \end{gathered} Σ(θ)=⎝⎛​γ2var(ξ)+var(ζ)γvar(ξ)γvar(ξ)​var(ξ)+var(δ1)var(ξ)​var(ξ)+var(δ2)​⎠⎞​​

(8)观测变量模型

1、Multiple Regression:多个x影响一个y

2、Bivariate Regression:多个x影响一个y,且一个x影响多个y

3、Recursive System

例子:工会情绪数据
y1 = 服从上级|deference (submissiveness) to managers
y2 = 支持劳工行动|support for labor activism
y3 = 对工会的情绪|sentiment towards unions
x1 = log(工作年份)|logarithm of years in textile mill
x2 = 年龄|age

SEM模型:
y1=γ12x2+z1y1=\gamma12 x2+z1y1=γ12x2+z1
y2=β21y1+γ22y2+z2y2=\beta21 y1+\gamma22 y2+z2y2=β21y1+γ22y2+z2
y3=β31y1+γ32y2+γ31x1+z2y3=\beta31 y1+\gamma32 y2+\gamma31 x1+z2y3=β31y1+γ32y2+γ31x1+z2
矩阵形式:
(y1y2y3)=(000β2100β31β320)(y1y2y3)+(0γ120γ22γ310)(x1x2)+(z1z2z3)\begin{gathered} \begin{pmatrix} y1\\y2\\y3 \end{pmatrix}= \begin{pmatrix} 0&0&0 \\ \beta21&0&0 \\ \beta31&\beta32&0 \end{pmatrix} \begin{pmatrix} y1 \\ y2 \\ y3 \end{pmatrix}+ \begin{pmatrix} 0&\gamma12 \\ 0&\gamma22 \\ \gamma31&0 \end{pmatrix} \begin{pmatrix} x1 \\ x2 \end{pmatrix}+ \begin{pmatrix} z1 \\ z2 \\ z3 \end{pmatrix} \end{gathered}⎝⎛​y1y2y3​⎠⎞​=⎝⎛​0β21β31​00β32​000​⎠⎞​⎝⎛​y1y2y3​⎠⎞​+⎝⎛​00γ31​γ12γ220​⎠⎞​(x1x2​)+⎝⎛​z1z2z3​⎠⎞​​
y=By+Γx+zy=By+\Gamma x+zy=By+Γx+z

4、非递归系统

【SEM】1 基本概念相关推荐

  1. 新媒体运营学习路线及全套视频教程资源

    新媒体运营主要包括以下内容,我们可以通过这种大纲的方式,检验我们的知识体系,在薄弱的地方进行加强,从而完善自己的知识体系. 第一阶段:新媒体营销入门基础理论和必备技能 文件夹:01. 第一章 营销基础 ...

  2. 网站SEO优化是什么(概念解释与SEM的区别)

    SEM SEM(搜索引擎营销)基本思想是让用户发现信息,并通过(搜索引擎)搜索点击进入网站/网页进一步了解他所需要的信息. SEM的方法包括搜索引擎优化(SEO).付费排名.精准广告以及付费收录 SE ...

  3. k8s概念入门之apiserver-针对1.1.版本阅读

    apiserver k8s中最重要的一个通信节点就是apiserver,是一个中心节点连接着每一环,是kubelet,kube-proxy和control-manager的交互的中心点,提供基于API ...

  4. 判断sem信号量为零_Linux系统编程——进程同步与互斥:System V 信号量

    信号量概述 信号量广泛用于进程或线程间的同步和互斥,信号量本质上是一个非负的整数计数器,它被用来控制对公共资源的访问. 编程时可根据操作信号量值的结果判断是否对公共资源具有访问的权限,当信号量值大于 ...

  5. SEM那些被人混淆的事儿(已完结)

    我开场前先说几句闲话.本来我已经决定不再写东西了,一来是发现社区里面大咖们越来越多,各个的真知灼见让本小白受教不少,于是乎还是倾听为上为佳:二来,本人在回答问题的过程中发现,越分享越是发现自己对一些事 ...

  6. 二十个你必须知道的SEO概念

    如果你拥有一个网站或独立博客,或者你的工作多少和互联网有关,那你一定耳濡目染多多少少对SEO(搜索引擎优化)有一定了解.本文将列举其中20个SEO领域最常用的名词和概念,如果你打算熟悉和了解他们请继续 ...

  7. Linux驱动概念扫盲篇

    驱动程序完全隐藏了设备工作的细节. 用户的活动通过一套标准化的调用来进行,这些调用与特别的驱动是独立的; 设备驱动的角色就是将这些调用映射到作用于实际硬件的和设备相关的操作上.  驱动应当做到使硬件可 ...

  8. 炒了8年的概念,到底该如何理解DevOps这个词?

    什么是DevOps及误区 DevOps概念从2009年提出已有8个年头.可是在8年前的那个时候,为什么DevOps没有迅速走红呢?即便是在2006年Amazon发布了ECS,微软在2008年和2010 ...

  9. 《SEM长尾搜索营销策略解密》一一2.9 长尾,寻找蓝海的最好方式

    本节书摘来自异步社区出版社<SEM长尾搜索营销策略解密>一书中的第2章,第2.9节,作者: 岳鹏飞 , 艾奇学院,更多章节内容可以访问云栖社区"异步社区"公众号查看. ...

  10. 信号量(sem)学习笔记

    信号量是一个特殊的整数值,主要用来控制多个进程对临界资源的互斥访问,进程根据信号量来判断是否有访问的资源,而信号和信号量是不同的概念,信号是一种处理异步事件的方法,而信号量是一种进程同步机制. 信号量 ...

最新文章

  1. 【正一专栏】梅西大婚——一辈子守候你都是值得的
  2. opengl加载显示3D模型lxo类型文件
  3. 后勤管理系统_教育信息化2.0,2019年校园智慧后勤管理系统五大品牌
  4. python 列表创建
  5. UE4 PostProcessVolume 蓝图操作后期框
  6. Django(九)admin相关知识
  7. JAVA内存释放机制
  8. python爬取拉勾网给定关键词职位信息存入数据库_python爬取拉勾网职位数据的方法...
  9. SCCM 部署操作系统 ,提示权限问题,报错:0xc00000098
  10. c#定时器Timer
  11. gd32f103驱动TLC59116(模拟i2c)
  12. Kotlin 1.4 版本正式发布:新功能一覽
  13. num转大写中文(零壹贰叁肆伍陆柒捌玖)
  14. 罗素“杀死了”康托尔
  15. WPF 文件、文件夹操作
  16. WPF管理平台 (一)- 登录页面
  17. 处理射手网字幕,方便打印
  18. PLSQL-Developer工具
  19. 2020华为暑假实习业务主管面经历--硬件技术工程师(单板硬件开发方向)
  20. Windows下的二进制文件工具

热门文章

  1. 注册AppStore开发者账号以及收款设置的流程详解(2019最新版)
  2. mybatis中mysql递归查询多级_mybatis+mysql递归查询
  3. Lingo 实现线性规划求解模型
  4. VMware16虚拟机:下载和安装教程
  5. PyQt5教程(二)——PyQt5的安装(详细)
  6. 数学建模 -- 层次分析法(AHP)
  7. 深入理解Nginx~文件路径的定义
  8. 安装VisualC++出现未安装等错误怎么办
  9. Vwmare 出现 the msi failed和解决方案
  10. 10个经典Python爬虫入门实例!你还不知道吗