R语言 dataframe 取指定行列filter 随机取数
一、dataframe基本操作
1.读取数据集,生成dataframe,查看前几行数据
data <- read.csv("../input/ab_data.csv", header = TRUE)
# 生成dataframe
data <- data.frame(data)
# 查看数据
head(data)
2.取指定行,比如下面取group列中为“treatment”和landing列中为“old_page”的
get1 <- data %>% filter( group == "treatment" & landing_page == "old_page")
3.取列名, 直接使用$即可
data1 <- data$converted
4.新建列,这里是提取timestamp里的日期
data$day_date<-as.Date(data$timestamp)
5.提取唯一值,类似python的unique
unique_id <- unique(data$user_id)
length(unique_id)
6.行列合并, rbind和cbind
notaligned_user <- data%>% filter( group == "treatment" & landing_page == "old_page")
notaligned_user2 <- data%>% filter( group == "control" & landing_page == "new_page")# rbind:合并后列数不变,行数相加,类似叠猫猫
notaligned_user_all <- rbind(notaligned_user,notaligned_user2)# cbind:合并后行数不变,列数相加,列名也会跟着加
notaligned_user_all <- cbind(notaligned_user,notaligned_user2)
7.获取列数,使用nrow
data_row_num<- nrow(data)
ggplot网址:
http://www.sthda.com/english/wiki/ggplot2-barplots-quick-start-guide-r-software-and-data-visualization
R语言 dataframe 取指定行列filter 随机取数相关推荐
- R语言dataframe创建新的特征(变量)、行加和特征、行均值特征(基于加减乘除、指数、模数等操作符)、创建新的特征(变量)、生成编码特征(基于比较操作符、逻辑操作符)
R语言dataframe创建新的特征(变量).行加和特征.行均值特征(基于加减乘除.指数.模数等操作符).为dataframe创建新的特征(变量).生成编码特征(基于比较操作符.逻辑操作符) 目录
- R语言dataframe计算满足筛选条件的行的个数(筛选满足条件的数据行并计数):类似于excel的countif函数
R语言dataframe计算满足筛选条件的行的个数(筛选满足条件的数据行并计数):类似于excel的countif函数 目录
- R语言ggplot2可视化指定保存到pdf的图像的具体尺寸、保证缩放的一致性:使得绘图元素(文本、点大小等)在设计上都具有相同的绝对大小、设置全局数据点大小、主题格式、设置图像保存的具体尺寸
R语言ggplot2可视化指定保存到pdf的图像的具体尺寸.保证缩放的一致性:使得绘图元素(文本.点大小等)在设计上都具有相同的绝对大小.设置全局数据点大小.主题格式.设置图像保存的具体尺寸 目录
- R语言dataframe分组数据汇总(aggregate and sum):类似于excel的sumif函数
R语言dataframe分组数据汇总统计(aggregate and sum):类似于excel的sumif函数 目录 R语言dataframe分组数据汇总统计(aggregate and sum): ...
- R语言ggplot2可视化指定图像标题(title)、副标题(subtitle)的内容、字体大小、字体类型、色彩、对齐方式等实战
R语言ggplot2可视化指定图像标题(title).副标题(subtitle)的内容.字体大小.字体类型.色彩.对齐方式等实战 目录
- R语言dataframe(data.table)使用用最近的前一个非NA值向前填充缺失值NA实战
R语言dataframe(data.table)使用用最近的前一个非NA值向前填充缺失值NA实战 目录 R语言dataframe(data.tabl
- R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计、所有特征的NA值统计
R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计.所有特征的NA值统计 目录
- R语言dataframe获取每个字段(特征)的数据类型实战:使用sapply函数获取每个字段(特征)的数据类型、通过柱状图可视化特征的种类以及个数
R语言dataframe获取每个字段(特征)的数据类型实战:使用sapply函数获取每个字段(特征)的数据类型.通过柱状图可视化特征的种类以及个数 目录
- R语言dataframe数据列格式转换(从整型integer转化为浮点型float)
R语言dataframe数据列格式转换(从整型integer转化为浮点型float) 目录 R语言dataframe数据列格式转换(从整型integer转化为浮点型float)
最新文章
- [转]笑话: 耐力惊人的三只乌龟
- Android中有关数据库SQLite的介绍
- R语言-解决问题:程辑包‘xxx’是用R版本3.3.4 来建造的
- 一道笔试题--求二进制数1的个数
- 手机鸿蒙公测选择一个应用,鸿蒙系统公测半个月,首批“差评”很难听,但是却也很真实...
- java调用c dll,指针参数和结构体参数搞定
- python封装 继承 多态 举例_python面向对象中的封装、继承、多态
- 使用BAT批处理执行sql
- 第512章 河系量子计算机,第512章 河系量子计算机
- 下载地址jquery upload file demo (C#)
- react 对象渲染_不要过度使用React.useCallback()
- SEO哪些因素会照成百度排名不稳定
- 检查mysql的空密码 弱密码_识别SQLServer中空密码或者弱密码的登录名
- 分析手段之一:质谱仪GCMS质谱技术
- python正则表达式爬取链家租房信息
- Android 自定义View UC下拉刷新效果(一)
- 数字化时代:电梯广告的喜与忧
- 改变Dev-C++生成的exe文件图标
- 自动化办公——PPT免费模板(强力推荐)
- 现场dolphinscheduler每次都在晚上停止任务15分钟,是什么导致了这个情况?
热门文章
- 因为没有使用有效的安全证书进行签名,该内容已被屏蔽。
- Ubuntu20.04服务器版本如何使用命令从U盘拷贝文件到服务器
- 小程序开发语言python_微信小程序是用什么语言开发的呢
- Reporting verbs
- qt构建浏览器_如何为组织构建安全的浏览器
- 电池测试软件 iphone,一招教你检测 iPhone 电池损耗,有的居然超过 50﹪!
- Mysql 错误 1273 Unknown collation
- 清华大学鲍橒计算机1999,鲍橒从“最强大脑”到“盲棋第一人”
- 人像大片这么拍才像样:OPPO R15加入3D人像打光
- 督查督办管理系统适合什么企业