目录

0.简介
1.下载与(Windows)安装
2.使用
3.参考文献
4.引用信息

0.简介

在问卷调查中经常遇到某个维度题项存在部分缺失的情况,例如下图中的1号个案仅在INT1上存在缺失。假如将单个题项缺失统计为一个缺失个案,并且也放弃INT维度的其它数据,则显得过于可惜。

当代插补技术中,多重插补(Multiple Imputation, MI)被认为是“最先进”的一个(Baraldi & Enders, 2010),但也不总是适用于问卷数据的缺失插补。首先,问卷数据使用多个题项测量一个概念,这导致极少的几个概念往往需要使用几十个题项,在较为详细的调查中数百个题项的问卷极为常见。变量数量过多会使计算量增大,也导致MI的收敛变得困难(Graham, 2009)。另一个问题在于,使用多重插补之后,往往需要使用特定公式合并统计结果,尽管许多软件已经提供了自动合并功能,但这只局限于特定分析技术(van Ginkel et al., 2020)。比如,SPSS可以自动合并多重插补结果的回归分析系数。然而,问卷调查中常用的一些分析方法并未受到支持,比如Cronbach α系数与因子分析结果等。
如上所述,在现实条件的限制下,研究者需要一些适用于问卷数据的插补方法。本插件提供的7种方法是问卷数据中常见的插补方法,但其中某些方法并不推荐使用。这些方法包括变量均值插补(Item Mean Imputation)、变量中位数插补(Item Median Imputation)、个人均值插补(Person Mean Imputation)(含Z分数)、校正的变量均值插补(Corrected Item Mean Substitution)、双向插补(Two Way Imputation)和热卡插补(Hot Dcek Imputation)。

1.(Windows)安装

读者可在公众号左下角通过“资料课程→资料下载→各类自制工具”进入下载。对SPSS单击鼠标右键,选择“以管理员身份运行”。

通过“扩展”进入“安装定制对话框”

选择“.spd”安装包进行安装。

安装成功后,将出现以下提示:

对话框在“分析”菜单下:

2.使用

手册中已经包含非常详细的使用过程,此处仅介绍其中一种插补方法——双向插补。
打开数据“Data.sav”(压缩包内有提供),进入对话框,将INT1至INT6选入,并选择“双向插补”,点击“确定”完成操作。

SPSS会为每个变量输出一个插补后的变量,新变量前缀为“iptt6_”,缺失数据均替换为双向算法计算出的数值。对于所有变量都缺失的个案不进行插补,使用者可考虑使用其它方法进行插补。

如果希望插补后的数据不存在小数,则可以在前述操作的基础上勾选“四舍五入为整数”选项,van Ginkel等人(2010)也认为在问卷数据分析中,可以将插补值四舍五入到整数。

与前述结果相比,所有插补的数据都进行了四舍五入,变成与原量表一致的李克特分数。

3.参考文献

Baraldi, A. N., & Enders, C. K. (2010). An introduction to modern missing data analyses. Journal of school psychology, 48(1), 5-37.
Graham, J. W. (2009). Missing data analysis: Making it work in the real world. Annual review of psychology, 60, 549-576.
van Ginkel, J. R., Linting, M., Rippe, R. C., & van der Voort, A. (2020). Rebutting existing misconceptions about multiple imputation as a method for handling missing data. Journal of personality assessment, 102(3), 297-308.
van Ginkel, J. R., Sijtsma, K., van der Ark, L. A., & Vermunt, J. K. (2010). Incidence of missing item scores in personality measurement, and simple item-score imputation. Methodology.

4.引用信息

英文可使用以下引用:
Zongman Qiu. (2020). Imputation: a SPSS macro for data imputation. https://www.researchgate.net/publication/344717807_Imputation_a_SPSS_macro_for_data_imputation
中文可使用以下引用:
邱宗满. (2020). Imputation: 用于数据插补的SPSS宏. https://www.researchgate.net/publication/344717807_Imputation_a_SPSS_macro_for_data_imputation

Imputation:用于数据插补的SPSS宏相关推荐

  1. 回归插补法_没有完美的数据插补法,只有最适合的

    数据缺失是数据科学家在处理数据时经常遇到的问题,本文作者基于不同的情境提供了相应的数据插补解决办法.没有完美的数据插补法,但总有一款更适合当下情况. 我在数据清理与探索性分析中遇到的最常见问题之一就是 ...

  2. missforest_missforest最佳丢失数据插补算法

    missforest Missing data often plagues real-world datasets, and hence there is tremendous value in im ...

  3. python 插补数据_python 2020中缺少数据插补技术的快速指南

    python 插补数据 Most machine learning algorithms expect complete and clean noise-free datasets, unfortun ...

  4. CVPR 2019 | 全新缺失图像数据插补框架—CollaGAN

    在同一域下的图像和数据是符合一个整体流形分布的,一旦域中的数据缺失,能否利用已有的域中数据去还原丢失的数据呢? Collaborative GAN 提出了一种新的缺失图像数据插补框架,称为协同生成对抗 ...

  5. 直线插补计算过程_【计鹏视角】风速数据插补对发电量的影响

    测风数据在插补时通常通过相关函数实现,相关函数一般采用线性方程函数,线性函数根据不同通道的风速相关性散点图来得到. 不同高度层的相关性散点图是成"带"状分布,相关系数越大,&quo ...

  6. 数据插补—拉格朗日插值法

    数据分析 数据清洗:缺失值处理.1删除记录 2数据插补 3不处理 常见插补方法 插值法-拉格朗日插值法 根据数学知识可知,对于平面上已知的n个点(无两点在一条直线上可以找到n-1次多项式 ,使次多项式 ...

  7. imputation-文献:False signals induced by single-cell imputation(scRNA-seq插补引入的假阳性问题)

    文章题目 False signals induced by single-cell imputation 中文名: 单细胞插补引起的假信号 文章地址: https://f1000research.co ...

  8. KNN的数据插补方法总结

    sklearn中的KNN在缺失值填补中的用法 参考链接:K近邻填补缺失值 如果缺失值是离散的,使用K近邻分类器,投票选出K个邻居中最多的类别进行填补:如果为连续变量,则用K近邻回归器,拿K个邻居中该变 ...

  9. 面向单细胞RNA-seq数据插补及聚类方法研究

    许俊林博士生答辩公告 浏览次数:175日期:2021-09-06编辑:研究生秘书 学位论文简介 单细胞RNA测序 (single-cell RNA-sequencing, scRNA-seq) 技术可 ...

  10. 数据预处理 第3篇:数据预处理(使用插补法处理缺失值)

    插补法可以在一定程度上减少偏差,常用的插补法是热卡插补.拟合插补和多重插补.拟合插补,要求变量间存在强的相关性:多重插补(MCMC法),是在高缺失率下的首选插补方法,优点是考虑了缺失值的不确定性. 一 ...

最新文章

  1. 自定义html页面鼠标右键,javascript鼠标右键菜单自定义效果
  2. python查看和更改当前工作目录
  3. Open3D:Win10 + VS2017配置Open3D(C++、python)
  4. JAVA写接口傻瓜(#)教程(四)
  5. 个人分析美国电脑销售现状(网店)
  6. exp/expdp中query参数的使用
  7. 数据链路层差错控制——奇偶校验码、循环冗余码和汉明码(海明码)
  8. python:lambda、filter、map、reduce
  9. Python 代理类实现和控制访问与修改属性的权限
  10. cdh 简介_CDH 1、CDH简介
  11. java怎么确定数据在区间内_处理数据时,单元格内内容太多无法计数怎么破?...
  12. 【推荐实践】Hulu-视频理解在个性化推荐与内容发现中的应用.pdf(附下载链接)...
  13. 03JavaScript程序设计修炼之道_2019-06-18_21-41-56_事件onfocus
  14. Linux 无线无法获取ip,Linux无法获取IP地址
  15. google code jam 2008 Mousetrap (逆向)
  16. [转载]JTree 编辑、删除、添加节点_-Chaz-_新浪博客
  17. 数字化教学资源平台html,数字化教学资源
  18. Mysql中索引相关问题
  19. composer install 中出现用户名密码错误问题的解决方法
  20. Python随机生成一注双色球彩票

热门文章

  1. 安装dbVisualizer报错:the java_home environment viariable does not point to a working 32-bit JDK OR JRE
  2. 使用BarTender连接Excel文件批量打印图片
  3. 深度Linux安装红警2,深度Deepin Linux v20 Beta下玩红警
  4. 大厂工作3年,我决定把大学到现在7年所有珍藏的书籍都分享一遍
  5. 商品分类,手机云进销存ERP门店零售批发仓库开单APP软件,文具五金服装鞋帽酒店烟酒饰品批发条码管理
  6. Copy On Write(写时复制)
  7. NetSetMan特别版 网络地址切换工具
  8. hbase java 建表_Java在HBase数据库创建表
  9. cad设计师证书怎么考
  10. 协同过滤算法及python实现