再数据分析的过程中往往需要先创建新变量再进行分析。根据经验,主要包括两方面。

1.独立创建变量,再利用新变量数据进行数据整理和分析,这样比较简单,代码如下:

data$newvar<-data$oldvar

创建一个空白变量代码如下:

data$newvar<-NA

2、新变量是有其他变量转化或者计算得来,代码如下:

由定量变量计算生成新变量:

data$BMI<-data$weight/data$height/data$height*10000

定量或定性变量转化生成新变量:

data<-within({

newvar<-NA

newvar[data$age<18]<-"未成年人"

newvar[data$age>=18]<-"成年人"

})

也可以使用循环语句来实现:

data$newvar<-NA

for(i in 1:length(data$age)){

if data$age[i]<18 data$newvar[i]<-"未成年人"

else data$newvar[i]<-"成年人"

}

需要注意的是,使用循环语句时候,if条件使用的变量(age)不能为空,否则会报错!!!

R语言给数据集创建新变量相关推荐

  1. R语言数据处理 之 创建新变量

    初步的数据处理,通常要创建新的变量.其实,创建新变量可以: 避开未经处理的数据未有所需数据的难处: 变换一些已有数据,以更好的为下一步分析作准备: 而常创建的新变量有: 缺失值指针 (Missingn ...

  2. R语言创建新变量方法

    R语言创建新变量方法 在数据分析中,可能需要对数据进行求和.求均值等处理,并且将处理后的数据重新保存到原来的数据框中,这里提供三种可供解决的方法: 数据框$变量名 <- 表达式.若原数据框中含有 ...

  3. R语言变量的处理(创建新变量 变量重新赋值

    创建新变量: 方法一: #在mydata数据库中创建新变量sum,sum是mydata数据库中x1和x2之和 mydata$sum <- mydata$x1 + mydata$x2 #在myda ...

  4. R语言使用两个分类变量创建双向表(Two Way Table、两个分类变量的频率表)实战: 矩阵的双向表、dataframe的双向表、条形图和马赛克图来可视化频率表

    R语言使用两个分类变量创建双向表(Two Way Table.两个分类变量的频率表)实战: 矩阵的双向表.dataframe的双向表.条形图和马赛克图来可视化频率表 目录

  5. r语言处理数据集编码_在强调编码语言或工具之前,请学习这3个基本数据概念

    r语言处理数据集编码 重点 (Top highlight) I got an Instagram DM the other day that really got me thinking. This ...

  6. R语言为dataframe添加新的数据列(add new columns):使用R原生方法、data.table、dplyr等方案

    R语言为dataframe添加新的数据列(add new columns):使用R原生方法.data.table.dplyr等方案 目录 R语言为dataframe

  7. R语言为dataframe添加新的数据列(横向拼接、Appending columns,Unioning columns):使用R原生方法、data.table、dplyr等方案

    R语言为dataframe添加新的数据列(横向拼接.Appending columns,Unioning columns):使用R原生方法.data.table.dplyr等方案 目录 R语言为dat

  8. R语言gganimate包创建可视化gif动图、并使用anim_save函数保存可视化gif动图(gganimate export to gif)

    R语言gganimate包创建可视化gif动图.并使用anim_save函数保存可视化gif动图(gganimate export to gif) 目录

  9. R语言gganimate包创建可视化gif动图、可视化动图:ggplot2可视化静态散点图、gganimate包创建动态散点分面图(facet_wrap)动画基于transition_time函数

    R语言gganimate包创建可视化gif动图.可视化动图:ggplot2可视化静态散点图.gganimate包创建动态散点分面图(facet_wrap)动画基于transition_time函数 目 ...

最新文章

  1. 表单重复提交的解决方法
  2. 关于添加“服务引用”和“添加引用”的一点总结
  3. python判断实例的类型
  4. 容器打印日志到控制台阻塞的排障
  5. 机械硬盘低级格式化软件_低级比高级安全?磁盘格式化要保护秘密
  6. [蓝桥杯2016初赛]平方怪圈-数论,模拟
  7. linux-关于用户的约定
  8. 我如何使用Python帮助我选择了Google Summer of Code '19的组织
  9. 【英语学习】【医学】无机化学 - 化合物命名(3) - 含氧酸/无氧酸
  10. TensorFlow的安装方法
  11. sql 创建表、删除表 增加字段 删除字段操作
  12. 怎么计算crc16校验数据的校验码
  13. 计算机实战项目之 [含论文+任务书+中期检查表+答辩PPT+源码等]基于javaweb宠物领养网站
  14. 2023湖南师范大学计算机考研信息汇总
  15. 人工智能的十大应用方向是哪些?
  16. ansys linux卸载干净,安装了几次ansys14.5,都没有成功,删除重新安装后许可安装不了了...
  17. 利用POI将word转换成html实现在线阅读
  18. 开发中的各种时间格式转换(二)
  19. 写给二线城市【Python工程师】的成长指南
  20. 网格交易 python代码_网格交易原理和代码

热门文章

  1. 使用FFmpeg 批量处理视频
  2. mysql 配置定时任务_Mysql定时任务
  3. PostgreSQL权限修改 : ALTER DEFAULT PRIVILEGES
  4. 怎样让windows xp自动登录
  5. Apriori算法和FP-Tree算法简介
  6. Python 数字黑洞
  7. IoT 设备接入服务,你从这篇博客就能快速上手~
  8. 2020.1.13 C语言学习 结构体+结构体数组+结构体指针
  9. 安徽科技学院 信网学院网络文化节 房辉
  10. 北京西客站火车行李托运指南