1. lapplyeg:x=list(a=1:10,b=c(11,21,31,41,51))

lapply(x,mean) 或 sapply(x,mean)

lapply与sapply均为返回x中元素的平均值,sapply函数可将lapply的返回结果进行化简x=1:4

lapply(x,runif) runif意为从一个均匀分布里抽取若干个数出来,默认是从0到1 的均匀分布

lapply(x,runif,min=0,max=100) 从0到100的均匀分布里抽取若干个数出来x=list(a=matrix(1:6,2,3),b=matrix(4:7,2,2))

lapply(x,function(m) m[1,]) 此处m代表传入矩阵,函数运行的是矩阵的第一行

2.applyx=matrix(1:16,4,4)

apply(x,2,mean) 返回x中第二列的平均

apply(x,2,sum) 返回x中第二列的和

rowSums(x) 对每一行求和

rowMeans(x) 对每一行求平均

colSums(x) 对每一列求和

colMeans(x) 对每一列求平均x=matrix(rnorm(100),10,10) 从正态分布中随机取100个数据,并将其排成10行10列

apply(x,1,quantile,probs=c(0.25,0.75)) quantile意为求数据的百分位点 probs对quantile进行限定,以语句可返回矩阵x中每一行的25%和75%分位点的数据x=array(rnorm(2*3*4),c(2,3,4))

apply(x,c(1,2),mean)

3.mapplylist(rep(1,4),rep(2,3),rep(3,2),rep(4,1)) 第一个元素为4个1,第二个元素为3个2.........

mapply(rep,1:4,4:1) 1:4为rep函数的第一个参数,4:1为第二个参数,与上面的语句含义相同,即将1重复4次,2重复3次,3重复2次,4重复1次。s=function(n,mean,std){rnorm(n,mean,std)}

s(4,0,1)

mapply(s,1:5,5:1,2)

n代表从分布中抽取的数据的个数

mean和std分别代表随机分布的总体的均值和标准差

rnorm(n,mean,std 代表是从均值为mean方差为std的正态分布中抽取n个数据

s(4,0,1) 代表是从均值为0方差为1的正态分布中抽取4个数据

mapply(s,1:5,5:1,2) 应用s函数,返回的结果是一个列表

第一个元素是从均值为5,方差为2的正态分布中抽取的1个数据

第一个元素是从均值为4,方差为2的正态分布中抽取的2个数据

第一个元素是从均值为3,方差为2的正态分布中抽取的3个数据...........(一一对应)

mapply(s,1:5,5:1,2) 与 ,list(s(1,5,2),s(2,4,2),s(3,3,2),s(4,2,2),s(5,1,2)) 返回的结果是一样的,可以看出使用mapply能让语句更简单

4.tapplyx=c(rnorm(5),runif(5),rnorm(5,1)) x包含15个元素,前五个元素来自于正态分布,中间五个元素来自于均匀分布,最后五个元素来自于均值为1,标准差为0的正态分布

f=gl(3,5) 建立因子需要gl函数,第一个参数表示该因子有3个水平,第二个参数表示每个水平下有5个元素

tapply(x,f,mean) 对x这个向量按照g的水平进行分组,并对每组求均值

tapply(x,f,mean,simplify=FALSE) 得到的是一个未经化简的列表

5.splitx=c(rnorm(5),runif(5),rnorm(5,1))

f=gl(3,5)

split(x,f) 返回水平1对应的x中的前五个元素,水平2对应的中间五个元素,水平3对应的最后五个元素

lapply(split(x,f),mean) 返回分组后每一水平对应的5个元素的平均值 s=split(airquality,airquality$Month) 返回airquality中关于每一月份的数据table(airquality$Month) 查询每一月份包含的数目head(airquality)

lapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")]))

对s应用function(x),求得关于每个月ozone、wind、temp的均值,colMeans求列均值

sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")])) sapply可将结果简化

sapply(s, function(x) colMeans(x[,c("Ozone","Wind","Temp")],na.rm = TRUE))

有了na.rm则可将ozone、wind、temp中的缺失值去除掉,然后计算列均值

6.排序x=data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1))

sort(x$v2) 可对x中的v2列进行升序排列

sort(x$v2,decreasing = TRUE) 可对x中的v2列进行降序排列

order(x$v2) 可对x中的v2列进行升序排列,但返回的不是内容本身,而是其所在的行号

x[order(x$v2),] 按照v2列升序的行号的排列对整个数据框进行排列

x[order(x$v4,x$v2),] 先按照v4进行升序排列,之后再按照v2进行升序排列

x[order(x$v4,x$v2,decreasing = TRUE),] 先按照v4进行降序排列,再按照v2进行降序排列

7.总结数据信息head(airquality,10) 查看airquality的前十行,默认是前六行

tail(airquality,8) 查看airquality的后八行,默认是后六行

summary(airquality) 查看airquality每一列的最小值、第一个分位点、中间值、均值、第三个分位点、最大值以及缺失值的个数

str(airquality) 查看airquality的基本情况如变量数等table(airquality$Ozone) 查看airquality中的Ozone的具体数值,及每一数值出现的次数,不包括缺失值

table(airquality$Ozone,useNA='ifany') 还可以总结缺失值的个数

table(airquality$Month,airquality$Day) 返回的是二维数据,即查询某月某日的数据的个数any(is.na(airquality$Ozone)) 判断是否有缺失值

sum(is.na(airquality$Ozone)) 计算缺失值的总数

all(airquality$Month<12) 判断月份是不是都小于12xtabs(Freq~Class+Age,data=Titanic) xtabs可建立一个组合框,以class和age来计算频数

x=xtabs(Freq~Class+Age,data=Titanic)

ftable(x) 可将结果以更加扁平化的形式显示出来,内容与xtabs函数返回的结果一致

object.size(airquality) 查看airquality的大小(字节)

8总结

r语言summary函数使用_R语言--操纵数据--重要函数的使用相关推荐

  1. r语言各形状编号_R语言plot()函数的符号、颜色和尺寸

    龙源期刊网 http://www.qikan.com.cn R 语言 plot() 函数的符号.颜色和尺寸 作者:耿秀华 来源:<数字技术与应用> 2018 年第 10 期 摘 ; 要:本 ...

  2. r语言rank降序_R语言rank函数详细解析

    1.rank函数是什么 rank相关文档[1]可以译为"返回原数组(?)中各个元素排序(?)后的秩次(?)",表面上看确实可以得到次序,但对数组.排序.秩次交待不清. 2.rank ...

  3. r语言remarkdown展示图_R语言knitr之rmarkdown

    R语言knitr之rmarkdown 数据报告是作为数据分析师必不可少的工作之一,而目前大部分数据分析师所处环境可能是excel画图制表,然后制作成word或者email的方式.对于周期性的报告,每次 ...

  4. R语言怎么写积分_R语言入门的基本操作(1)

    大家好,这是从知乎<一个大学生的日常笔记>中迁移过来的R语言教程的第一篇. 这一份笔记follow了两本非常优秀的R语言教材,分别是Robert I.Kabacoff的<R语言实战& ...

  5. r语言各形状编号_R语言入门第八讲:编码分类变量(factor)

    今天第八篇~~~~~~ 在第一讲中我给大家介绍了read.table函数的使用.最近我在处理一个一百万左右的数据,发现read.table函数出了问题.我不知道是在excel转成txt时出的问题还是因 ...

  6. r语言 fread函数参数_R语言 第4章 初级绘图(6)

    分析数据间的关系 散点矩阵图 如果数据框是多维数据,那么plot函数将绘制出两两之间散点图组合成为散点矩阵图(matrix of scatterplots).散点矩阵图将多个散点图组合起来,以便可以同 ...

  7. r语言rank降序_R语言学习笔记:sort、rank、order、arrange排序函数

    R语言中排序有几个基本函数:sort().rank().order().arrange() 一.总结 sort()函数是对向量进行从小到大的排序 rank()函数返回的是对向量中每个数值对应的秩 or ...

  8. r语言qsignrank函数用法_R语言常用函数名

    一.数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character:字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 lengt ...

  9. r语言 回归分析 分类变量_R语言 | 回归分析(二)

    R语言 语言学与R语言的碰撞 Xu & Yang PhoneticSan 学习参考 Discovering Statistics Using R Statistics for Linguist ...

最新文章

  1. matlab与python 语言区别总结(1)_matlab与python 语言区别总结(1)
  2. Eclipse在高分屏下图标过小的解决方法
  3. 企业信息化投入中咨询服务_企业信息化咨询中的问题与对策研究
  4. html让下拉条消失,CSS 实现隐藏滚动条同时又可以滚动
  5. LeetCode 1263. 推箱子(BFS+DFS / 自定义哈希set)
  6. ubuntu下使用openocd+jlink进行STM32开发调试
  7. CSO安全手册中的七条守则
  8. Docker生态技术链
  9. 公众号jdk 获取手机号_怎样快速获取使用国庆节公众号文章的素材和模板
  10. React:JSX 深入
  11. django数据库设置为MySQL
  12. 局域网无法访问共享新方法
  13. 一洽客服客户试用转化率100%
  14. GHOST备份还原系统教程
  15. 2022-2028年全球及中国ODM智能手机行业投资前景分析
  16. 成功解决 MDK5中No ST-LINK detected的问题
  17. 推荐ietester工具
  18. 谁是靠算法挑战华尔街的赌神?
  19. 【python】微信公众号开发
  20. 拓嘉启远:拼多多前期没有流量如何补充

热门文章

  1. 【官方推荐】Laravel7 + Vue2.0前后端分离框架通用后台源码
  2. 不懂就问:ZooKeeper 集群如何进行数据同步?
  3. YT6801 YT6801S YT6801SH YT9215S
  4. python zip是什么意思_Python中zip()函数的解释和可视化
  5. MySQL数据库调优————表结构设计优化
  6. html查询历史天气,历史天气查询2345,怎样查以前的预报天气
  7. Centos7安装subversion
  8. 笔记本驱动的安装事项[acer]
  9. java的rest异步调用_使用AsyncRestTemplate进行异步调用
  10. 帆软报表列表_FineReport报表软件数据填报功能详述