数据预处理

导入玩家的玩牌游戏数据

加载并查看数据信息

player <- read.csv("玩家玩牌数据.csv",F)
head(player)
str(player)

给数据设置变量名

player_col_names <- c("用户id","性别","等级","站内好友数","经验值","积分","登录总次数","玩牌局数","赢牌局数","身上货币量")
//查看变量名
colnames(player) <- player_col_names
//查看前六行
head(player)

查看缺失值

// 利用is.na函数判断“玩牌局数”变量各值是否为缺失值
is.na(player$玩牌局数)
// 统计缺失值与非缺失值的个数
table(is.na(player$玩牌局数))
//sum()和mean()函数来统计缺失值的个数和占比
// 计算缺失值个数
sum(is.na(player$玩牌局数))
// 计算缺失值占比
mean(is.na(player$玩牌局数))

用md.pattern函数查看player的缺失值模式

md.pattern(player)

删除缺失值

当缺失值占比不大时,可以采用缺失值删除的方法

player_full <- na.omit(player)

替换缺失值

如果数据缺失值过大,且对数据总体有一定影响,可以采用替换的方式。

//用0替换缺失值
player[is.na(player)] <- 0

R语言:数据预处理-缺失值相关推荐

  1. R语言数据预处理——离散化(分箱)

    R语言数据预处理--离散化(分箱) 一.项目环境 开发工具:RStudio R:3.5.2 相关包:infotheo,discretization,smbinning,dplyr,sqldf 二.导入 ...

  2. R语言数据预处理、数据因子化并自定义因子标签、通过labels参数指定因子标签

    R语言数据预处理.数据因子化并自定义因子标签.通过labels参数指定因子标签 目录

  3. R语言|数据预处理方法

    数据预处理的主要内容包括 数据清洗 原始数据的质量直接影响了数据分析的质量,不符合要求的脏数据有: 无关数据. 重复数据或者含有特殊符号的数据. 缺失值.产生原因是有些数据无法获取,或者获取成本过高, ...

  4. mysql内数据离散化,R语言数据预处理操作——离散化(分箱)

    一.项目环境 开发工具:RStudio R:3.5.2 相关包:infotheo,discretization,smbinning,dplyr,sqldf 二.导入数据 # 这里我们使用的是鸢尾花数据 ...

  5. R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战

    R语言删除包含缺失值的行并将字符数据列(character)转化为因子列(factor)实战 目录

  6. R语言数据对象与运算

    R语言数据对象与运算 笔记整理 2.1 数据对象及类型 R语言创建和控制的实体被称为对象(object) ls()命令来查看当前系统里的数据对象 R对象的名称必须以一个英文字母打头,并由一串大小写字母 ...

  7. 【组队学习】【28期】R语言数据科学

    R语言数据科学 论坛版块: http://datawhale.club/c/team-learning/36-category/36 开源内容: https://github.com/datawhal ...

  8. 推荐:一本“高颜值”的R语言数据可视化图书(包邮送3本)

    文章留言点赞前3名的朋友,每人送1本<R语言数据化可视化之美增强版>,名单揭晓日期为:本周日 (2020年7月12日晚7点).到时,获奖的朋友可以直接添加微信:meta-genomics, ...

  9. 半折预售:新书-R语言数据可视化之美|ggplot2作者推荐

    我本来想等正式发售的时候,再告诉大家我的新书<R语言数据可视化之美>已经出版,奈何新书还太贵,这几天刚好京东有买100减50的活动,所以想想还是赶紧告诉大家吧,不然平时购买的话,太真有点小 ...

  10. R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战

    R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...

最新文章

  1. input属性为number,maxlength不起作用的解决方案
  2. 如何从SEO优化角度设计网站导航栏?
  3. 对现有的所能找到的DDOS代码(攻击模块)做出一次分析----GET篇
  4. 小马源码_Java互联网架构-重新认识Java8-HashMap-不一样的源码解读
  5. 在同一局域网内的同一工作组内登陆其中的机器时显示输入网络密码对话框
  6. idea中实体类右击没有ptg_这些6到飞起的idea插件,你还没用过?
  7. 科罗拉多州立大学计算机科学,科罗拉多州立
  8. linux刷新解析,如何在Linux(和FreeBSD)上刷新DNS解析器缓存
  9. Redis下载安装(Windows,Lunix)
  10. Android音频之多设备同时输出-cast通路分析
  11. 微信公众号与服务器ip,微信公众号服务器IP网段与实际IP不一致?无法通过微信公众号推送消息到自己的服务器...
  12. python实现商品进销存管理系统
  13. 如何将低dpi图片升级到300dpi
  14. EXCEL数据改动自动标记功能怎么实现
  15. Tensorflow 2.X h5转pb
  16. OpenCV算法加速(2)使用SIMD指令集(MMX、SSE、AVX)和MIPP实现视觉算法优化
  17. 传导骚扰的一些其他总结
  18. 【验证码二】使用验证码
  19. 如何整合内心的冲突和混乱,构建、形成自己的思维体系?
  20. ElementUI表格数据批量选中操作

热门文章

  1. 联想台式主机拆机教程_联想主机外壳怎么拆开_联想主机怎么拆图解
  2. android模拟器开启vt,雷电模拟器怎么开启VT 雷电安卓模拟器VT虚拟化打开教程
  3. java代码对图片缩放
  4. Android资深开发者告诉你:简历这样写绝对吸引面试官眼球,面试电话接到手软
  5. Unity资源热更-Addressables总结(一)
  6. LIFELONG LEARNING WITH DYNAMICALLY EXPANDABLE NETWORKS论文阅读+代码解析
  7. css在透明的背景下显示白色字体
  8. Mybatis查询之list作为参数查询
  9. ios13 自带字体列表
  10. 计算机word设置斜框线,Word绘制多线斜线表头技巧-word技巧-电脑技巧收藏家