R语言数据框中的stringsAsFactors参数
R语言数据框中的stringsAsFactors参数
- 数据框基本建立
- 参数:stringsAsFactors
数据框基本建立
(注:本文章中的Name变量区分大小写)
Name <- c("A BC", "D EF", "H IJ")
age <- c(1,2,3)
sex <- c(TRUE, TRUE, FALSE)
Mydata <- data.frame(Name, age, sex)
以上是我们用最简便的办法建立的一个数据框。结果如下:
但是假设“A BC”中A为学生的姓,BC为学生的名字,现在我们想要将学生按照姓和名字重新排列。首先需要利用strsplit()函数,但是运行后将会出现以下情况:
这是由于当我们在建立数据框的时候,R语言将会默认把字符型(character)当成因子(factor)。如果我们用class查看的话会发现:
其中我们认为应该命名为字符型的变量变成了因子,而其他类型的变量和我们预想的一样。
参数:stringsAsFactors
利用参数stringsAsFactors,解决上述问题。在建立数据框时候加入语句
stringsAsFactors = FALSE
此时数据框将不会默认把字符型转化为因子,运行代码。
Name <- c("A BC", "D EF", "H IJ")
age <- c(1,2,3)
sex <- c(TRUE, TRUE, FALSE)
Mydata <- data.frame(Name, age, sex, stringsAsFactors = FALSE)
此时,如果我们采用strsplit()函数操作字符就可以完成正常的字符操作。
利用class函数可以查询此时的Name类型为character
所以,当数据框中含有字符类型的数据时,请务必注意在数据框建立时加入语句:stringsAsFactors = FALSE
R语言数据框中的stringsAsFactors参数相关推荐
- R语言数据框中创建新的变量的三种方法
方法1 > mydata<-data.frame(x1=c(1,2,3,4),x2=c(5,6,7,8)) > mydata$sum<-mydata$x1+mydata$x2 ...
- r中将数据框中数据类型转化_R中的数据类型
r中将数据框中数据类型转化 Before we delve deeper into R programming, it is important to understand the various d ...
- R语言数据可视化中颜色设置
R语言数据可视化中颜色设置 最近在学统计学,使用的是R语言,为了更好的掌握这门语言,就把学到的零碎知识记录下来. 下面全是R语言的颜色的内容: 一.颜色的种类: 一共有颜色种类657种 colors( ...
- R语言 如何搭建和操作R语言数据框 R语言基础知识rbind,cbind,merge和str用法
数据框是一种特殊的数据结构,它通常用来存储数据表格或电子表格形式的数据.数据框中的毎一列代表一个特定的属性或字段,而行由这些列的具体取值组成.这种数据结构在处理有大量字段和属性的数据集时十分有用. 建 ...
- java离群值,R从数据框中按组别移除离群值
离群值(outlier)通常被定义为小于 QL - l.5 IQR 或者 大于 Qu + 1.5 IQR的值,QL称为下四分位数, Qu称为上四分位数,IQR称为四分位数间距,是Qu上四分位数和QL下 ...
- r语言赋值为na_R语言数据框中,用0替代NA缺失值
MesaSQLite数据库的简单使用方法 前言部分 本文非原创 文章摘自:http://m.blog.csdn.net/blog/wsxzk123/17282325 数据库工具:MesaSQLite ...
- R语言数据框data.frame行和列求和方法
代码如下: widgets <- c(179,153,183,153,154) gadgets <- c(167,193,190,161,181) thingys <- c(182, ...
- r语言数据变量分段_R语言:统计多个数据框中分类变量各值的频数
导读 查看文件.获取ID 读取数据表 读取数据表 一.查看文件.获取ID 关键参数: list.files(pattern="条件") # 根据条件获取文件名 strsplit(向 ...
- R语言筛选dataframe中某一日期之后的数据集、特定日期之后的数据行
R语言筛选dataframe中某一日期之后的数据集.特定日期之后的数据行 目录 R语言筛选dataframe中某一日期之后的数据集.特定日期之后的数据行
最新文章
- python读excel字体颜色_python 设置 excel 单元格颜色填充和字体效果
- Kafka分布式环境搭建
- Java的技术采⽤用⽣生命周期
- 2020-08-24
- 匹配追踪分解 时频 matlab,Matlab匹配追踪(MatchingPursuit) 之一
- MongoDB 查询文档
- mysqladmin命令详解
- 学会写出"图形界面+数据库"的程序要多长时间?
- kali linux工具pyrit,在Kali Linux上安装cuda、pyrit-cuda以及optimus
- JavaScript截取分割字符串
- python用input输入整数列表_python中,用input()输入一个整数
- sccm数据库远程服务器,SCCM 2007 R2部署之连接远程SQL Server模式
- 手机丢了微信聊天记录怎么恢复?别担心,教你一招找回
- java计算机毕业设计小型企业员工工资管理系统源码+系统+数据库+lw文档+mybatis+运行部署
- 学习强国-为中华崛起而学习
- 我的Crystal xcelsius之旅
- 关于mysql的timestamp时间范围
- nsis打包时候如何让附带的第三方软件静默安装
- unity lua C# 这边 new 了一个GameObject 对象并发给Lua那边, 这时C# 这边在通过GC释放掉这个对象;lua 那边会报错;遇到这种问题的解决方案
- Windows 系统日志常用事件
热门文章
- 2岁宝宝身高标准 你家宝贝达标了么
- Java中的死锁及其解决方案
- 手机html己停用怎么办,Apple ID被停用怎么办?“Apple ID 已停用”解决办法
- Hadoop课程学习——Hadoop的windows环境安装及问题
- 盘点系列--大学四年,我电脑上都装了啥编辑软件?!
- Go 爬虫之 colly 从入门到不放弃指南
- i++和++i 和i+1的区别
- Redis五大数据类型(字符串对象(string)、列表对象(list)、哈希对象(hash)、无序集合(set)和Sorted Set数据类型(zset有序集合))
- 请问我这表该如何遍历呢?
- RCE _通达 OA -2020HW