处理缺失值的一般步骤

《数据分析基础——R语言(处理缺失值)》https://blog.csdn.net/qq_35164554/article/details/97805065?utm_source=app&app_version=4.21.1

一、用0替代数据框中的NA值

《如何在R数据帧中用零替换NA值?》

https://blog.csdn.net/CHCH998/article/details/105528282?utm_source=app&app_version=4.21.1

《R语言数据框中,用0替代NA缺失值 - yangk - 博客园》

二、删除NA值

is.na()

> x <- c(1, 2, NA, 4, NA, 5) > bad <- is.na(x)
> print(bad)
[1] FALSE FALSE TRUE FALSE TRUE FALSE
> x[!bad]
[1] 1 2 4 5

complete.cases()

> x <- c(1, 2, NA, 4, NA, 5) > y <- c("a", "b", NA, "d", NA, "f") > good <- complete.cases(x, y)
> good
[1] TRUE TRUE FALSE TRUE FALSE TRUE
> x[good]
[1] 1 2 4 5 > y[good]
[1] "a" "b" "d" "f"
> head(airquality)
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 > good <- complete.cases(airquality)
> head(airquality[good, ])
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 7 23 299 8.6 65 5 7 8 19 99 13.8 59 5 8

na.omit()

三、使用平均数、中位数、众数等替换缺失值

四、通过变量之间的相关关系填补缺失值

五、通过观察值之间的相似性填补缺失值

R语言_缺失值NA的处理相关推荐

  1. [个人笔记]R语言:缺失值NA处理

    目录 前言 缺失值分布评估 看有多少行有缺失值: VIM:看一下缺失值的分布.比例情况 缺失值填补方法 Hmisc或e1071包:均值.中位数.随机填充 DMwR2包: 中心填充centralImpu ...

  2. R语言-数据清洗-缺失值处理

    缺失值处理包括两个步骤,即缺失数据的识别和缺失值处理.在R语言总缺失值以NA表示,可以使用函数is.na()判断缺失值是否存在,函数complete.cases()可识别样本数据是否完整从而判断缺失情 ...

  3. R语言进行缺失值填充(Filling in missing values):使用R原生方法、data.table、dplyr等方案

    R语言进行缺失值填充(Filling in missing values):使用R原生方法.data.table.dplyr等方案 目录 R语言进行缺失值填充&#x

  4. 泰尔指数r语言_还在用Excel算区位基尼系数?用geo.gini吧!

    区域经济研究中,经常需要测度产业空间集中的程度,常用的指标有区位基尼系数(Locational GiniCoefficient).泰尔指数(Theil Index)和EG指数等.这一期先讲区位基尼系数 ...

  5. pycharm中配置r语言_【R语言】R语言中的循环

    编程中减少代码重复的两个工具,一是循环,一是函数. 循环,用来处理对多个同类输入做相同事情(即迭代),如对不同列做相同操作.对不同数据集做相同操作. R语言有三种方式实现循环: (1)for循环.wh ...

  6. 如何利用R语言处理 缺失值 数据

    主要用到VIM和mice包 [plain]  view plain  copy install.packages(c("VIM","mice")) 1.处理缺失 ...

  7. 计算密码子频率的代码R语言_科学网—R语言终止密码子统计 - 熊荣川的博文

    熊荣川 六盘水师范学院生物信息学实验室 #R语言终止密码子统计 setwd("**") infile = "protein1.fasta" outname = ...

  8. clustMD r语言_使用vsearch,usearch和R语言进行16s扩增子分析

    以下教程中vsearch和usearch部分的操作在虚拟机中的ubuntu18系统下进行. 1. 示例数据的下载 czh@ubuntu:~/Desktop$ curl -O https://Astro ...

  9. R语言 处理缺失值数据

    关注微信公共号:小程在线 关注CSDN博客:程志伟的博客 主要用到VIM和mice包 install.packages(c("VIM","mice")) 1.处 ...

  10. R语言数据缺失值处理(随机森林,多重插补)

    缺失值是指数据由于种种因素导致的数据不完整,可以分为机械原因和人为原因.对于缺失值我们通常采用以下几种方法来进行插补. 1.读取数据 通过read.csv函数导入文档,也可以用其他函数读入,如open ...

最新文章

  1. linux 命令 grep -A -B -C 显示行选项
  2. Hive 05_hive变量、动态分区
  3. ios mysql 创建不同的用户表_iOS中数据库-创建表-增删改查数据-基础语法
  4. 半年内使用两次借呗就没法申请房贷?
  5. php+反序列化代码执行漏洞,PHP反序列化漏洞
  6. 高并发解决方案--负载均衡
  7. sql 系统 存储过程的使用方法 转载
  8. linux同步Internet时间
  9. ab测试工具结果分析
  10. 自学4年多 Github 上斩获 90k Star! 聊聊自学习编程的正确姿势!
  11. 【Linux系列文章】Shell开发
  12. 导数的四则运算法则_导数、微分、积分之间的区别与联系
  13. JavaScript将扁平化数据转为树形结构
  14. ovs-vsctl设置ofport不成功处理
  15. 电解电容的ESR到底是多少呢?
  16. 【Mybatis】分页
  17. USRP B210同步采集
  18. 如何成为一名优秀的程序员(四)
  19. 脸部日常护理私家秘方
  20. c# MVC API 获取访问者IP 并加以验证

热门文章

  1. Windows安装和设置教程
  2. XML数据结构 SAX 解析
  3. ios根号怎么打_ios计算器开根号 苹果手机计算器怎么开根号 详情介绍
  4. 移动硬盘打不开,换一台电脑就又可以打开了
  5. lpush rpush 区别_redis中lpush、rpush、lset、lrem是什么
  6. 宝, 来学习一下CSS中的宽高比,让 h5 开发更想你的夜!
  7. android+桌面组件开发,Android桌面小部件开发,及注意事项
  8. Android 开发横屏App或创建横屏布局
  9. 下载神器aria2的yaaw WebUI用法
  10. 什么是索引?怎么创建索引?索引的使用原则?