R语言数据框中的stringsAsFactors参数

  • 数据框基本建立
    • 参数:stringsAsFactors

数据框基本建立

(注:本文章中的Name变量区分大小写)

Name <- c("A BC", "D EF", "H IJ")
age <- c(1,2,3)
sex <- c(TRUE, TRUE, FALSE)
Mydata <- data.frame(Name, age, sex)

以上是我们用最简便的办法建立的一个数据框。结果如下:

但是假设“A BC”中A为学生的姓,BC为学生的名字,现在我们想要将学生按照姓和名字重新排列。首先需要利用strsplit()函数,但是运行后将会出现以下情况:

这是由于当我们在建立数据框的时候,R语言将会默认把字符型(character)当成因子(factor)。如果我们用class查看的话会发现:

其中我们认为应该命名为字符型的变量变成了因子,而其他类型的变量和我们预想的一样。

参数:stringsAsFactors

利用参数stringsAsFactors,解决上述问题。在建立数据框时候加入语句
stringsAsFactors = FALSE
此时数据框将不会默认把字符型转化为因子,运行代码。

Name <- c("A BC", "D EF", "H IJ")
age <- c(1,2,3)
sex <- c(TRUE, TRUE, FALSE)
Mydata <- data.frame(Name, age, sex, stringsAsFactors = FALSE)

此时,如果我们采用strsplit()函数操作字符就可以完成正常的字符操作。

利用class函数可以查询此时的Name类型为character

所以,当数据框中含有字符类型的数据时,请务必注意在数据框建立时加入语句:stringsAsFactors = FALSE

R语言数据框中的stringsAsFactors参数相关推荐

  1. R语言数据框中创建新的变量的三种方法

    方法1 > mydata<-data.frame(x1=c(1,2,3,4),x2=c(5,6,7,8)) > mydata$sum<-mydata$x1+mydata$x2 ...

  2. r中将数据框中数据类型转化_R中的数据类型

    r中将数据框中数据类型转化 Before we delve deeper into R programming, it is important to understand the various d ...

  3. R语言数据可视化中颜色设置

    R语言数据可视化中颜色设置 最近在学统计学,使用的是R语言,为了更好的掌握这门语言,就把学到的零碎知识记录下来. 下面全是R语言的颜色的内容: 一.颜色的种类: 一共有颜色种类657种 colors( ...

  4. R语言 如何搭建和操作R语言数据框 R语言基础知识rbind,cbind,merge和str用法

    数据框是一种特殊的数据结构,它通常用来存储数据表格或电子表格形式的数据.数据框中的毎一列代表一个特定的属性或字段,而行由这些列的具体取值组成.这种数据结构在处理有大量字段和属性的数据集时十分有用. 建 ...

  5. java离群值,R从数据框中按组别移除离群值

    离群值(outlier)通常被定义为小于 QL - l.5 IQR 或者 大于 Qu + 1.5 IQR的值,QL称为下四分位数, Qu称为上四分位数,IQR称为四分位数间距,是Qu上四分位数和QL下 ...

  6. r语言赋值为na_R语言数据框中,用0替代NA缺失值

    MesaSQLite数据库的简单使用方法 前言部分 本文非原创 文章摘自:http://m.blog.csdn.net/blog/wsxzk123/17282325 数据库工具:MesaSQLite ...

  7. R语言数据框data.frame行和列求和方法

    代码如下: widgets <- c(179,153,183,153,154) gadgets <- c(167,193,190,161,181) thingys <- c(182, ...

  8. r语言数据变量分段_R语言:统计多个数据框中分类变量各值的频数

    导读 查看文件.获取ID 读取数据表 读取数据表 一.查看文件.获取ID 关键参数: list.files(pattern="条件") # 根据条件获取文件名 strsplit(向 ...

  9. R语言筛选dataframe中某一日期之后的数据集、特定日期之后的数据行

    R语言筛选dataframe中某一日期之后的数据集.特定日期之后的数据行 目录 R语言筛选dataframe中某一日期之后的数据集.特定日期之后的数据行

最新文章

  1. python读excel字体颜色_python 设置 excel 单元格颜色填充和字体效果
  2. Kafka分布式环境搭建
  3. Java的技术采⽤用⽣生命周期
  4. 2020-08-24
  5. 匹配追踪分解 时频 matlab,Matlab匹配追踪(MatchingPursuit) 之一
  6. MongoDB 查询文档
  7. mysqladmin命令详解
  8. 学会写出"图形界面+数据库"的程序要多长时间?
  9. kali linux工具pyrit,在Kali Linux上安装cuda、pyrit-cuda以及optimus
  10. JavaScript截取分割字符串
  11. python用input输入整数列表_python中,用input()输入一个整数
  12. sccm数据库远程服务器,SCCM 2007 R2部署之连接远程SQL Server模式
  13. 手机丢了微信聊天记录怎么恢复?别担心,教你一招找回
  14. java计算机毕业设计小型企业员工工资管理系统源码+系统+数据库+lw文档+mybatis+运行部署
  15. 学习强国-为中华崛起而学习
  16. 我的Crystal xcelsius之旅
  17. 关于mysql的timestamp时间范围
  18. nsis打包时候如何让附带的第三方软件静默安装
  19. unity lua C# 这边 new 了一个GameObject 对象并发给Lua那边, 这时C# 这边在通过GC释放掉这个对象;lua 那边会报错;遇到这种问题的解决方案
  20. Windows 系统日志常用事件

热门文章

  1. 2岁宝宝身高标准 你家宝贝达标了么
  2. Java中的死锁及其解决方案
  3. 手机html己停用怎么办,Apple ID被停用怎么办?“Apple ID 已停用”解决办法
  4. Hadoop课程学习——Hadoop的windows环境安装及问题
  5. 盘点系列--大学四年,我电脑上都装了啥编辑软件?!
  6. Go 爬虫之 colly 从入门到不放弃指南
  7. i++和++i 和i+1的区别
  8. Redis五大数据类型(字符串对象(string)、列表对象(list)、哈希对象(hash)、无序集合(set)和Sorted Set数据类型(zset有序集合))
  9. 请问我这表该如何遍历呢?
  10. RCE _通达 OA -2020HW