原文链接:https://www.lianxh.cn/news/4404052e7b336.html

目录

  • 1. 引言
  • 2. 问题与方法
    • 2.1 缺失数据会带来的问题
    • 2.2 缺失数据的常用方法
  • 3. tsfill 和 ipolate 命令简介
  • 4. Stata 实操:tsfill 和 ipolate 命令
    • 4.1 时间序列数据
    • 4.2 面板数据
  • 5. iploate 方法评价
  • 参考资料

1. 引言

在实证研究中,我们经常会遇到数据缺失的问题。在样本较大的情况下,我们可以删除缺失值,而在样本较小的情况下,缺失值的影响会变得很大,此时,填补数据这项工作就变得相对重要。

本文主要介绍了 Stata 中较为常用的缺失数据处理命令 tsfill 和 ipolate,旨在为大家处理缺失数据问题时提供帮助。

2. 问题与方法

2.1 缺失数据会带来的问题

通常,在缺失部分数据的情况下,只要数据量足够大,我们可以将含有缺失值的样本删掉,并且不会对结果产生太大影响。但是,在「样本量小」和「缺失数据多」的情况下,我们简单的删掉数据,会损失较多的信息,并且使得结果有偏。

例如,下表中有 8 个样本,左边为含有缺失值的数据,右边为完整数据,并且左边部分  有 4 个缺失值。当我们删除缺失值时,左边  均值为 39,而右边  均值为 29.75,可以看出二者还是有很大差别的。

+--------------------------------------+ | 含有缺失值的数据 | 完整数据 | +--------------------------------------+ |Case Age Gender | Case Age Gender | +--------------------------------------+ |1 . Female | 1 21 Female | |2 . Male | 2 22 Male | |3 39 Male | 3 39 Male | |4 . Female | 4 20 Female | |5 42 Male | 5 42 Male | |6 . Female | 6 18 Female | |7 37 Male | 7 37 Male | |8 38 Male | 8 39 Male | +--------------------------------------+ (缺失数据和完整数据的基本格式)

原文链接:https://www.lianxh.cn/news/4404052e7b336.html

Stata:缺失值的填充和补漏相关推荐

  1. R语言把dataframe数据转化为tibble格式、查看每个数据列的缺失值个数、使用数据列的均值对数据列的缺失值进行填充

    R语言把dataframe数据转化为tibble格式.查看每个数据列的缺失值个数.使用数据列的均值对数据列的缺失值进行填充 目录

  2. 【机器学习】机器学习中的缺失值及其填充处理

    大多数机器学习算法不允许目标值或特征数组中存在缺失值.因此,不能简单的忽略数据中的缺失值,而是要在数据预处理阶段解决这个问题. 最简单的解决方法是删除所有含其缺失值的观察值,用Numpy或Pandas ...

  3. Python中缺失值的填充

    Python中缺失值的填充 文章目录 Python中缺失值的填充 0 常用方法 1 填充None 2 填充众数 3 检查是否含有缺失值 0 常用方法 ​ 在Python中最常用的处理数据格式为Data ...

  4. 5.2 缺失值处理-填充缺失值

    数据挖掘中,面对的通常都是大型的数据库,它的属性有几十个甚至几百个,因为其中某个属性值的缺失而放弃大量其他的属性值,这种删除是对信息的极大浪费,所以产生了插补缺失值的思想与方法.常用的填充缺失值方法如 ...

  5. python数据处理之0值的替换缺失值的填充

    python数据处理之0值的替换和缺失值的填充 零值的替换:replace()方法里面填充的是键值对结构,注意空值必须用numpy.NaN来取而不是用字符串null data['AvgHomeValu ...

  6. Python中缺失值的填充fillna()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中缺失值的填充 fillna()函数 ● 选择题 以下关于 ...

  7. stata F值缺失_Stata数据处理: 面板数据填充和补漏

    Stata连享会 (知乎 | 简书 | 码云) 连享会   最新专题   直播 Source: http://www.statalist.org/forums/forum/general-stata- ...

  8. Stata数据处理:面板数据的填充和补漏

    原文链接:https://www.lianxh.cn/news/c2febe0f3530a.html 问题描述 我有一份面板数据,有些年份上的数据有两行或多行记录 (例如,本例中 2007 年的数据) ...

  9. Numpy 整体复制、按块复制、向量化操作、寻找缺失值、填充缺失值

    1. 整体复制和按块复制 已知数组: In [17]: a = np.array([1,2,3])In [18]: 返回如下数组: array([1, 1, 1, 2, 2, 2, 3, 3, 3, ...

最新文章

  1. TCP/IP协议——ARP详解
  2. json-server-----》基本使用
  3. 小甲鱼python课后题简书_Python练习题100道
  4. 王者荣耀s12赛季服务器维护,王者荣耀S12赛季延期,这篇攻略让我段位狂涨!
  5. Spring框架中提取list集合类型属性注入
  6. Know your weapons Ⅱ
  7. vue-resource HTTP API基础
  8. 机器学习 --- 3. 贝叶斯怎么想?(转)
  9. 含泪整理上万射击枪战游戏源码素材,你想要的这里都有!
  10. Verilog4选1数据选择器与2选1数据选择器仿真波形对比
  11. Zalo电脑版多开软件
  12. 计算机毕业设计java+jsp幼儿园信息网站(源码+系统+mysql数据库+Lw文档)
  13. 昆明钉钉智慧校园K12解决方案,校园安全、健康、生活、办公、网络整体解决方案
  14. Vue warn 屏蔽
  15. 第十一次作业 - Alpha 事后诸葛亮(团队)
  16. GPA学分绩点计算---Java实现版本
  17. Python基础知识点梳理
  18. 谷歌125亿美元收购摩托罗拉
  19. 选择 Go 还是 Rust?CloudWeGo-Volo 基于 Rust 语言的探索实践
  20. 设计模式之命令模式(java)实例——电视机遥控器

热门文章

  1. 独行怎能走远——给不喜欢有人教的学生
  2. IDEA 单行多行注释设置从当前鼠标位置开始 注释快捷键
  3. 记 · 青春日记 · 那种心跳的感觉
  4. mysql数据库效率最高_LVS+Keepalived效率最高的群集(实战)
  5. table2Excel边框,自定义列宽,行高,文件名
  6. 关于图灵测试和中文屋Chinese room的理解
  7. 研究人员是如何改善微型计算机的,北方高校微机实验室内微环境的研究及改善对策的探讨...
  8. 微信小程序打开微信公众号中的文章实战教程
  9. ajax实现登录成功后设置cookie,使用jquery的cookie实现登录页记住用户名和密码的方法...
  10. HDU 5445 Food Problem 两次多重背包