一、dataframe基本操作

1.读取数据集,生成dataframe,查看前几行数据

data <- read.csv("../input/ab_data.csv", header = TRUE)
# 生成dataframe
data <- data.frame(data)
# 查看数据
head(data)

2.取指定行,比如下面取group列中为“treatment”和landing列中为“old_page”的

get1 <- data %>% filter( group == "treatment" & landing_page == "old_page")

3.取列名, 直接使用$即可

data1 <- data$converted

4.新建列,这里是提取timestamp里的日期

data$day_date<-as.Date(data$timestamp)

5.提取唯一值,类似python的unique

unique_id <- unique(data$user_id)
length(unique_id)

6.行列合并, rbind和cbind

notaligned_user <- data%>% filter( group == "treatment" & landing_page == "old_page")
notaligned_user2 <- data%>% filter( group == "control" & landing_page == "new_page")# rbind:合并后列数不变,行数相加,类似叠猫猫
notaligned_user_all <- rbind(notaligned_user,notaligned_user2)# cbind:合并后行数不变,列数相加,列名也会跟着加
notaligned_user_all <- cbind(notaligned_user,notaligned_user2)

7.获取列数,使用nrow

data_row_num<- nrow(data)

ggplot网址:

http://www.sthda.com/english/wiki/ggplot2-barplots-quick-start-guide-r-software-and-data-visualization

R语言 dataframe 取指定行列filter 随机取数相关推荐

  1. R语言dataframe创建新的特征(变量)、行加和特征、行均值特征(基于加减乘除、指数、模数等操作符)、创建新的特征(变量)、生成编码特征(基于比较操作符、逻辑操作符)

    R语言dataframe创建新的特征(变量).行加和特征.行均值特征(基于加减乘除.指数.模数等操作符).为dataframe创建新的特征(变量).生成编码特征(基于比较操作符.逻辑操作符) 目录

  2. R语言dataframe计算满足筛选条件的行的个数(筛选满足条件的数据行并计数):类似于excel的countif函数

    R语言dataframe计算满足筛选条件的行的个数(筛选满足条件的数据行并计数):类似于excel的countif函数 目录

  3. R语言ggplot2可视化指定保存到pdf的图像的具体尺寸、保证缩放的一致性:使得绘图元素(文本、点大小等)在设计上都具有相同的绝对大小、设置全局数据点大小、主题格式、设置图像保存的具体尺寸

    R语言ggplot2可视化指定保存到pdf的图像的具体尺寸.保证缩放的一致性:使得绘图元素(文本.点大小等)在设计上都具有相同的绝对大小.设置全局数据点大小.主题格式.设置图像保存的具体尺寸 目录

  4. R语言dataframe分组数据汇总(aggregate and sum):类似于excel的sumif函数

    R语言dataframe分组数据汇总统计(aggregate and sum):类似于excel的sumif函数 目录 R语言dataframe分组数据汇总统计(aggregate and sum): ...

  5. R语言ggplot2可视化指定图像标题(title)、副标题(subtitle)的内容、字体大小、字体类型、色彩、对齐方式等实战

    R语言ggplot2可视化指定图像标题(title).副标题(subtitle)的内容.字体大小.字体类型.色彩.对齐方式等实战 目录

  6. R语言dataframe(data.table)使用用最近的前一个非NA值向前填充缺失值NA实战

    R语言dataframe(data.table)使用用最近的前一个非NA值向前填充缺失值NA实战 目录 R语言dataframe(data.tabl

  7. R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计、所有特征的NA值统计

    R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计.所有特征的NA值统计 目录

  8. R语言dataframe获取每个字段(特征)的数据类型实战:使用sapply函数获取每个字段(特征)的数据类型、通过柱状图可视化特征的种类以及个数

    R语言dataframe获取每个字段(特征)的数据类型实战:使用sapply函数获取每个字段(特征)的数据类型.通过柱状图可视化特征的种类以及个数 目录

  9. R语言dataframe数据列格式转换(从整型integer转化为浮点型float)

    R语言dataframe数据列格式转换(从整型integer转化为浮点型float) 目录 R语言dataframe数据列格式转换(从整型integer转化为浮点型float)

最新文章

  1. [转]笑话: 耐力惊人的三只乌龟
  2. Android中有关数据库SQLite的介绍
  3. R语言-解决问题:程辑包‘xxx’是用R版本3.3.4 来建造的
  4. 一道笔试题--求二进制数1的个数
  5. 手机鸿蒙公测选择一个应用,鸿蒙系统公测半个月,首批“差评”很难听,但是却也很真实...
  6. java调用c dll,指针参数和结构体参数搞定
  7. python封装 继承 多态 举例_python面向对象中的封装、继承、多态
  8. 使用BAT批处理执行sql
  9. 第512章 河系量子计算机,第512章 河系量子计算机
  10. 下载地址jquery upload file demo (C#)
  11. react 对象渲染_不要过度使用React.useCallback()
  12. SEO哪些因素会照成百度排名不稳定
  13. 检查mysql的空密码 弱密码_识别SQLServer中空密码或者弱密码的登录名
  14. 分析手段之一:质谱仪GCMS质谱技术
  15. python正则表达式爬取链家租房信息
  16. Android 自定义View UC下拉刷新效果(一)
  17. 数字化时代:电梯广告的喜与忧
  18. 改变Dev-C++生成的exe文件图标
  19. 自动化办公——PPT免费模板(强力推荐)
  20. 现场dolphinscheduler每次都在晚上停止任务15分钟,是什么导致了这个情况?

热门文章

  1. 因为没有使用有效的安全证书进行签名,该内容已被屏蔽。
  2. Ubuntu20.04服务器版本如何使用命令从U盘拷贝文件到服务器
  3. 小程序开发语言python_微信小程序是用什么语言开发的呢
  4. Reporting verbs
  5. qt构建浏览器_如何为组织构建安全的浏览器
  6. 电池测试软件 iphone,一招教你检测 iPhone 电池损耗,有的居然超过 50﹪!
  7. Mysql 错误 1273 Unknown collation
  8. 清华大学鲍橒计算机1999,鲍橒从“最强大脑”到“盲棋第一人”
  9. 人像大片这么拍才像样:OPPO R15加入3D人像打光
  10. 督查督办管理系统适合什么企业