R语言剔除包含NA值的行
在数据分析的过程中,数据的前处理是非常重要的。数据中出现“NA”是非常常见的,“NA”指“Not Available”,出现NA常常会影响我们进行数据分析,这是因为NA是会传染的。
NA值的影响
- 看以下例子:
> a <- c(1,2,3,4,5)
> mean(a)
[1] 3
如果出现NA,情况就不一样了
> a <- c(1,2,3,4,5,NA)
> mean(a)
[1] NA
由此可见,NA值会影响到我们进行统计分析,那么如何去除NA值或者在分析的过程中忽略NA值呢?
去除行NA值
- 利用complete.cases()函数
complete.cases()函数的效果如果该行或该列存在任何NA值,都会剔除该行或列,使用complete.cases()后效果如下:
> # 创建数据框
mydata <- data.frame(name=c("M","T","J","H","F"),sex=c("F","M",NA,"M","M"),score=c(90,85,75,89,NA))
> mydataname sex score
1 M F 90
2 T M 85
3 J <NA> 75
4 H M 89
5 F M NA
> mydata<-mydata[complete.cases(mydata),]
> mydataname sex score
1 M F 90
2 T M 85
4 H M 89
- dplyr包
dplyr包filter()函数,也可实现筛选不包含缺失值的行
dplyr::filter(df, !is.na(columnname))
> dplyr::filter(mydata, !is.na(score))name sex score
1 M F 90
2 T M 85
3 J <NA> 75
4 H M 89
R语言剔除包含NA值的行相关推荐
- R语言怎么把NA值替换成0?
有时候我们通过一些计算函数处理完数据,经常会出现NA值(缺失值),但实际意义代表的是0,以前看了一大堆,讲什么什么包的函数处理,但是要么处理完数据类型变成字符型了,要么行名列名不见了,前两天发现一个很 ...
- R语言删除包含NA的列
测试数据如下: Itun <- data.frame(v1 = c(1,1,2,1,2,1), v2 = c(NA, 1, 2, 1, 2, NA)) Itun[ , colSums(is.na ...
- R语言dplyr包移除dataframe数据行实战(Remove Rows):按照条件移除数据行、按照索引移除数据行、删除包含NA值的所有数据行、删除具体列包含NA值的数据行
R语言dplyr包移除dataframe数据行实战(Remove Rows):按照条件移除数据行.按照索引移除数据行.删除包含NA值的所有数据行.删除具体列包含NA值的数据行 目录
- R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战
R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战 目录
- R语言中的特殊值 NA NULL NaN Inf
这几个都是R语言中的特殊值,都是R的保留字, NA:Not available 表示缺失值 用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容 用 is.null() 来判 ...
- R语言使用diag函数生成一个N行N列的单位矩阵
R语言使用diag函数生成一个N行N列的单位矩阵 目录 R语言使用diag函数生成一个N行N列的单位矩阵 R语言是解决什么问题的? R语言使用diag函数生成一个N行N列的单位矩阵 安利一个R语言的优 ...
- R语言read.csv()读入行不规则数据
R语言read.csv()读入行不规则数据出错 > csv4=read.csv("CondenOriginal.csv") Error in file(file, " ...
- 如何在R代码中找到一个值的行号
如何在R代码中找到一个值的行号? 例如: 在以下一组值中,如何在第4列中找到特定值的行号? 如何使用R代码命令找到列4中的值"1578"的行号. > mydata_2sex ...
- R语言量化:alpha值和beta值
量化投资中经常提到的alpha(收益)和beta(收益)是从资本资产定价模型(CAPM)中衍生出来的概念.CAPM是一个给风险定价的基本模型,它认为只有系统风险(Systematic risk)才能带 ...
最新文章
- wpf+xml实现的一个随机生成早晚餐的小demo
- 人工智能最佳学习实践
- Windows下lex 与 yacc的使用
- 数字新写法3_000_000,简单明了
- load方法引入本地html报错,分享基于plus.downloader的图片懒加载功能,支持本地缓存v1.1.0...
- 用力和应变片计算弹性模量_实验力学实验讲义(08.9).doc
- 数学--数论--容斥定理完全解析(转)
- Halcon算子学习:图像阈值分割-threshold、binary_threshold、dyn_threshold算子
- document.onreadystatechange()来判断页面加载完
- 定推【好处】篇,牵手定推,好处多多
- html 抽签分小组代码,JavaScript实现班级抽签小程序
- 电阻参数_电阻器的主要技术参数、分类和选用
- 从零开始自制实现WebServer(十二)---- 剑指定时器小根堆处理 给EventLoop定时任务处理一个温暖的家
- 防火墙之ipsec vpn实验
- Absolutt ingenting er mye mer skjerpende parajumpers ? v?re en ulydig prest
- Windows端口开启关闭
- 日志搜集、过滤及推送处理框架logstash及fluentd总结
- CRH直方图和姿态识别代码
- I2C总线的SDA和SCL
- cacheput注解 用法_以注解的方式使用redis缓存得用法@CachePut , @CacheEvict, @Cacheable...
热门文章
- jquery获取已选择和未选择的checkBox项以及清空所选项
- 阿里云服务器中安装配置MYSQL数据库完整教程
- 《棒球英豪》:青春球场·棒球1号位
- DOS计算机设置登录密码,电脑开机的时候有个DOS的密码怎么设置啊、
- 研发质量管理的“红与黑”
- 付费学习,花钱比意志力靠谱
- ax.contour绘制等值线图时报错:The following kwargs were not used by contour: ‘color‘
- Android学习记录(二十八)--Android apache httpclients的使用。
- 解析人工智能时代蕴含的人文主义精神
- 谷歌AdMob广告学习