R语言_缺失值NA的处理
处理缺失值的一般步骤
《数据分析基础——R语言(处理缺失值)》https://blog.csdn.net/qq_35164554/article/details/97805065?utm_source=app&app_version=4.21.1
一、用0替代数据框中的NA值
《如何在R数据帧中用零替换NA值?》
https://blog.csdn.net/CHCH998/article/details/105528282?utm_source=app&app_version=4.21.1
《R语言数据框中,用0替代NA缺失值 - yangk - 博客园》
二、删除NA值
is.na()
> x <- c(1, 2, NA, 4, NA, 5) > bad <- is.na(x)
> print(bad)
[1] FALSE FALSE TRUE FALSE TRUE FALSE
> x[!bad]
[1] 1 2 4 5
complete.cases()
> x <- c(1, 2, NA, 4, NA, 5) > y <- c("a", "b", NA, "d", NA, "f") > good <- complete.cases(x, y)
> good
[1] TRUE TRUE FALSE TRUE FALSE TRUE
> x[good]
[1] 1 2 4 5 > y[good]
[1] "a" "b" "d" "f"
> head(airquality)
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 > good <- complete.cases(airquality)
> head(airquality[good, ])
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 7 23 299 8.6 65 5 7 8 19 99 13.8 59 5 8
na.omit()
三、使用平均数、中位数、众数等替换缺失值
四、通过变量之间的相关关系填补缺失值
五、通过观察值之间的相似性填补缺失值
R语言_缺失值NA的处理相关推荐
- [个人笔记]R语言:缺失值NA处理
目录 前言 缺失值分布评估 看有多少行有缺失值: VIM:看一下缺失值的分布.比例情况 缺失值填补方法 Hmisc或e1071包:均值.中位数.随机填充 DMwR2包: 中心填充centralImpu ...
- R语言-数据清洗-缺失值处理
缺失值处理包括两个步骤,即缺失数据的识别和缺失值处理.在R语言总缺失值以NA表示,可以使用函数is.na()判断缺失值是否存在,函数complete.cases()可识别样本数据是否完整从而判断缺失情 ...
- R语言进行缺失值填充(Filling in missing values):使用R原生方法、data.table、dplyr等方案
R语言进行缺失值填充(Filling in missing values):使用R原生方法.data.table.dplyr等方案 目录 R语言进行缺失值填充&#x
- 泰尔指数r语言_还在用Excel算区位基尼系数?用geo.gini吧!
区域经济研究中,经常需要测度产业空间集中的程度,常用的指标有区位基尼系数(Locational GiniCoefficient).泰尔指数(Theil Index)和EG指数等.这一期先讲区位基尼系数 ...
- pycharm中配置r语言_【R语言】R语言中的循环
编程中减少代码重复的两个工具,一是循环,一是函数. 循环,用来处理对多个同类输入做相同事情(即迭代),如对不同列做相同操作.对不同数据集做相同操作. R语言有三种方式实现循环: (1)for循环.wh ...
- 如何利用R语言处理 缺失值 数据
主要用到VIM和mice包 [plain] view plain copy install.packages(c("VIM","mice")) 1.处理缺失 ...
- 计算密码子频率的代码R语言_科学网—R语言终止密码子统计 - 熊荣川的博文
熊荣川 六盘水师范学院生物信息学实验室 #R语言终止密码子统计 setwd("**") infile = "protein1.fasta" outname = ...
- clustMD r语言_使用vsearch,usearch和R语言进行16s扩增子分析
以下教程中vsearch和usearch部分的操作在虚拟机中的ubuntu18系统下进行. 1. 示例数据的下载 czh@ubuntu:~/Desktop$ curl -O https://Astro ...
- R语言 处理缺失值数据
关注微信公共号:小程在线 关注CSDN博客:程志伟的博客 主要用到VIM和mice包 install.packages(c("VIM","mice")) 1.处 ...
- R语言数据缺失值处理(随机森林,多重插补)
缺失值是指数据由于种种因素导致的数据不完整,可以分为机械原因和人为原因.对于缺失值我们通常采用以下几种方法来进行插补. 1.读取数据 通过read.csv函数导入文档,也可以用其他函数读入,如open ...
最新文章
- linux 命令 grep -A -B -C 显示行选项
- Hive 05_hive变量、动态分区
- ios mysql 创建不同的用户表_iOS中数据库-创建表-增删改查数据-基础语法
- 半年内使用两次借呗就没法申请房贷?
- php+反序列化代码执行漏洞,PHP反序列化漏洞
- 高并发解决方案--负载均衡
- sql 系统 存储过程的使用方法 转载
- linux同步Internet时间
- ab测试工具结果分析
- 自学4年多 Github 上斩获 90k Star! 聊聊自学习编程的正确姿势!
- 【Linux系列文章】Shell开发
- 导数的四则运算法则_导数、微分、积分之间的区别与联系
- JavaScript将扁平化数据转为树形结构
- ovs-vsctl设置ofport不成功处理
- 电解电容的ESR到底是多少呢?
- 【Mybatis】分页
- USRP B210同步采集
- 如何成为一名优秀的程序员(四)
- 脸部日常护理私家秘方
- c# MVC API 获取访问者IP 并加以验证