Cluster standard errors又称 or Liang-Zeger standard errors。

1. Intuition-一个经典的例子

如果想考察一项新的教学方式,如引入课堂投影仪对学生成绩的影响。将全国的学校分为实验组和控制组,实验组的班级里老师开始使用投影仪,而控制组则未使用。当使用计量模型分析引入投影仪对学生成绩的影响时,我们可能保留student-level的数据,核心解释变量就是是否引入投影仪,同时控制student-level的其他characteristics,如智商、家庭收入等。此时,在估计系数时,会发现classic或者heteroscedasticity-robust standard error均不合适,因为在同一个班级内,学生成绩并非独立分布的。例如,一个班级的教师水平更高的话,可能该班级的学生的成绩整体更高。因而可以在class-level进行cluster standard errors。(有一个疑问,这里和直接控制class fixed effect的区别是什么?)

2. 数学推导

3. 什么时候选择cluster standard errors

Athey, Abadie, Imbens and Wooldridge(2022)when should you cluster standard errors

提出,在下面两种情况下的时候,需要cluster

第一种,a sampling design reason:具体而言,当我们拿到的sample其实是整体(population)通过整群抽样(cluster sampling)得到的,而我们又想使用sample得到的分析结果来解释population的性质,此时需要使用cluster standard error,并且在哪个level进行cluster sampling的,就在这个level进行cluster。

第二种,an experimental design: causal treatment 对实验组的冲击,实验组和对照组的选择是clustered,则需选择cluster standard error。例如一项政策的treatment 对象是个体,则无需选择cluster,但如果treatment是某些village的个体,则需要在village层面进行cluster。

4. Cluster standard error与控制fixed effect的区别?

如果在city-level抽样,并且在回归中控制了城市层面的固定效应,此时还需要在city-level的cluster吗?作者给的建议是此时还是需要进行一个判断,回归使用的样本是否是cluster  sampling或者assignment to treatment was clustered,若是,则还是需要进行city-level 的cluster。

参考:

https://en.wikipedia.org/wiki/Clustered_standard_errors

When should you cluster standard errors? New wisdom from the econometrics oracle

聚类标准误(cluster standard errors)是什么,什么情况下需要聚类,控制了固定效应(fixed effect)还需要聚类吗?相关推荐

  1. Python,OpenCV中的K均值聚类——K-Means Cluster

    Python,OpenCV中的K均值聚类 1. 效果图 2. 原理 2.1 什么是K均值聚类? 2.2 K均值聚类过程 2.3 cv2.kmeans(z, 2, None, criteria, 10, ...

  2. C语言实现聚类K-means cluster算法(附完整源码)

    聚类K-means cluster算法 实现聚类K-means cluster算法的完整源码(定义,实现,main函数测试) 实现聚类K-means cluster算法的完整源码(定义,实现,main ...

  3. Python层次聚类sci.cluster.hierarchy.linkage函数详解

    1 函数原型: scipy.cluster.hierarchy.linkage(y, method='single', metric='euclidean', optimal_ordering=Fal ...

  4. 数据的聚类(cluster)|| 关联规则 || 回归

    分类与聚类的比较 聚类分析是研究如何在没有训练的条件下把样本划分为若干类. 在分类中,已知存在哪些类,即对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来. 聚类需要解决 ...

  5. redis cluster 设置密码做集群时gem下client.rb文件修改

    redis cluster 设置密码做集群时gem下client.rb文件修改 来源 https://www.cnblogs.com/shihaiming/p/5949772.html redis节点 ...

  6. 层次聚类sklearn.cluster包AgglomerativeClustering

    ** Ward策略:让所有类簇中的方差最小化. Maximum策略:也叫completed linkage(全连接策略),力求将类簇之间的距离最大值最小化. Average linkage策略:力求将 ...

  7. wcbregress:面板聚类标准误

    全文阅读:https://www.lianxh.cn/news/5d4314cc25122.html 目录 1. 背景介绍 1.1 低估偏误说明 1.2 问题提出 2. 命令介绍 2.1 理论部分 2 ...

  8. 层次聚类(cluster.AgglomerativeClustering)并通过TSNE进行可视化分析

    单纯从层次聚类的角度来看,既有自顶向下,也有自底向上.从每一个样本一个聚类簇到所有样本一个聚类簇,或者所有样本是一个聚类簇到最后每一个样本都是一个聚类簇. 聚合层次聚类是一种自下而上的算法,首先将每个 ...

  9. Python金融数据挖掘 第11章 复习思考题1 (聚类)给出一个数据集data_multivar.txt,里面有200个点坐标,在平面坐标系下可以画出它的散点图,用K均值聚类算法来训练模型,分4类。

    1.题目 给出一个数据集data_multivar.txt,里面有200个点坐标,在平面坐标系下可以画出它的散点图,如图11-12所示. data_multivar.txt 图11-12 数据集 da ...

最新文章

  1. [wikioi 1307][poj 2054]欧少堆(乱搞)
  2. AndroidStudio导入新项目一直卡在Building gradle project
  3. Boost::context模块fiber的throw测试程序
  4. vue2.0 组件通信
  5. [css] 移动端1px像素的问题及解决方案是什么?
  6. android 自定义指南针,如何在android中制作自定义指南针视图
  7. [转载] Java中方法不可以有默认参数
  8. neo4j 查询同一节点的两个上级_手把手教你快速入门知识图谱 - Neo4J教程
  9. Ubuntu 20.04 安装 php 并配置 OpenResty
  10. FISCO BCOS 智能合约 可视化数据库 Mysql MariaDB
  11. 最全·推荐 | “ 等保2.0”中常见的网络安全审计技术(2020年版)
  12. 2018山西中考计算机软件名称,2018年山西省中考试题
  13. 单链表的结构体定义与声明
  14. 网易发起“疾风”智造IoT联盟,深化“互联网+先进制造业”发展
  15. 【牛客网-公司真题-前端入门篇】——2021牛客模考-卷1
  16. 为什么会出现403 Forbidden错误?三分钟教你快速解决问题!
  17. 实验室服务器多人共用账号,搭建多人共用的GPU服务器
  18. linux c 内存elf,关于LINUX下的可执行程序ELF(一)
  19. React的移动端项目打包成手机的app软件apk格式
  20. 数据仓库维度建模——事实表设计

热门文章

  1. python 调用easydl接口
  2. 基于百万级别的站内信设计
  3. 网站群发站内信数据库表设计
  4. 认识新华三官网官网下载网络模拟器HCL的安装了解HCL
  5. 如何解决蓝牙耳机总是声音断断续续的?
  6. java 创建string对象机制 字符串缓冲池 字符串拼接机制
  7. Centos7安装MySql8出现失败处理
  8. node.js命令行程序在Windows系统和Linux系统下的部署
  9. Codeforces Round #616 (Div. 2)B. Array Sharpening
  10. php拓展so,PHP扩展开发之动态加载so模块与静态重编译PHP(上)-Go语言中文社区...