在数据分析的过程中,数据的前处理是非常重要的。数据中出现“NA”是非常常见的,“NA”指“Not Available”,出现NA常常会影响我们进行数据分析,这是因为NA是会传染的。

NA值的影响

  • 看以下例子:
> a <- c(1,2,3,4,5)
> mean(a)
[1] 3

如果出现NA,情况就不一样了

> a <- c(1,2,3,4,5,NA)
> mean(a)
[1] NA

由此可见,NA值会影响到我们进行统计分析,那么如何去除NA值或者在分析的过程中忽略NA值呢?

去除行NA值

  1. 利用complete.cases()函数
    complete.cases()函数的效果如果该行或该列存在任何NA值,都会剔除该行或列,使用complete.cases()后效果如下:
> # 创建数据框
mydata <- data.frame(name=c("M","T","J","H","F"),sex=c("F","M",NA,"M","M"),score=c(90,85,75,89,NA))
> mydataname  sex score
1    M    F    90
2    T    M    85
3    J <NA>    75
4    H    M    89
5    F    M    NA
> mydata<-mydata[complete.cases(mydata),]
> mydataname sex score
1    M   F    90
2    T   M    85
4    H   M    89
  1. dplyr包
    dplyr包filter()函数,也可实现筛选不包含缺失值的行
dplyr::filter(df,  !is.na(columnname))
> dplyr::filter(mydata,  !is.na(score))name  sex score
1    M    F    90
2    T    M    85
3    J <NA>    75
4    H    M    89

R语言剔除包含NA值的行相关推荐

  1. R语言怎么把NA值替换成0?

    有时候我们通过一些计算函数处理完数据,经常会出现NA值(缺失值),但实际意义代表的是0,以前看了一大堆,讲什么什么包的函数处理,但是要么处理完数据类型变成字符型了,要么行名列名不见了,前两天发现一个很 ...

  2. R语言删除包含NA的列

    测试数据如下: Itun <- data.frame(v1 = c(1,1,2,1,2,1), v2 = c(NA, 1, 2, 1, 2, NA)) Itun[ , colSums(is.na ...

  3. R语言dplyr包移除dataframe数据行实战(Remove Rows):按照条件移除数据行、按照索引移除数据行、删除包含NA值的所有数据行、删除具体列包含NA值的数据行

    R语言dplyr包移除dataframe数据行实战(Remove Rows):按照条件移除数据行.按照索引移除数据行.删除包含NA值的所有数据行.删除具体列包含NA值的数据行 目录

  4. R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战

    R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战 目录

  5. R语言中的特殊值 NA NULL NaN Inf

    这几个都是R语言中的特殊值,都是R的保留字, NA:Not available  表示缺失值   用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容  用 is.null() 来判 ...

  6. R语言使用diag函数生成一个N行N列的单位矩阵

    R语言使用diag函数生成一个N行N列的单位矩阵 目录 R语言使用diag函数生成一个N行N列的单位矩阵 R语言是解决什么问题的? R语言使用diag函数生成一个N行N列的单位矩阵 安利一个R语言的优 ...

  7. R语言read.csv()读入行不规则数据

    R语言read.csv()读入行不规则数据出错 > csv4=read.csv("CondenOriginal.csv") Error in file(file, " ...

  8. 如何在R代码中找到一个值的行号

    如何在R代码中找到一个值的行号? 例如: 在以下一组值中,如何在第4列中找到特定值的行号? 如何使用R代码命令找到列4中的值"1578"的行号. > mydata_2sex ...

  9. R语言量化:alpha值和beta值

    量化投资中经常提到的alpha(收益)和beta(收益)是从资本资产定价模型(CAPM)中衍生出来的概念.CAPM是一个给风险定价的基本模型,它认为只有系统风险(Systematic risk)才能带 ...

最新文章

  1. wpf+xml实现的一个随机生成早晚餐的小demo
  2. 人工智能最佳学习实践
  3. Windows下lex 与 yacc的使用
  4. 数字新写法3_000_000,简单明了
  5. load方法引入本地html报错,分享基于plus.downloader的图片懒加载功能,支持本地缓存v1.1.0...
  6. 用力和应变片计算弹性模量_实验力学实验讲义(08.9).doc
  7. 数学--数论--容斥定理完全解析(转)
  8. Halcon算子学习:图像阈值分割-threshold、binary_threshold、dyn_threshold算子
  9. document.onreadystatechange()来判断页面加载完
  10. 定推【好处】篇,牵手定推,好处多多
  11. html 抽签分小组代码,JavaScript实现班级抽签小程序
  12. 电阻参数_电阻器的主要技术参数、分类和选用
  13. 从零开始自制实现WebServer(十二)---- 剑指定时器小根堆处理 给EventLoop定时任务处理一个温暖的家
  14. 防火墙之ipsec vpn实验
  15. Absolutt ingenting er mye mer skjerpende parajumpers ? v?re en ulydig prest
  16. Windows端口开启关闭
  17. 日志搜集、过滤及推送处理框架logstash及fluentd总结
  18. CRH直方图和姿态识别代码
  19. I2C总线的SDA和SCL
  20. cacheput注解 用法_以注解的方式使用redis缓存得用法@CachePut , @CacheEvict, @Cacheable...

热门文章

  1. jquery获取已选择和未选择的checkBox项以及清空所选项
  2. 阿里云服务器中安装配置MYSQL数据库完整教程
  3. 《棒球英豪》:青春球场·棒球1号位
  4. DOS计算机设置登录密码,电脑开机的时候有个DOS的密码怎么设置啊、
  5. 研发质量管理的“红与黑”
  6. 付费学习,花钱比意志力靠谱
  7. ax.contour绘制等值线图时报错:The following kwargs were not used by contour: ‘color‘
  8. Android学习记录(二十八)--Android apache httpclients的使用。
  9. 解析人工智能时代蕴含的人文主义精神
  10. 谷歌AdMob广告学习