目 录

1、str() 显示数据集和变量类型,并简要展示数据集情况

2、subset()  取子集

3、which.min(), which.max()和which()

4、pmin( )/ pmax( )

5、complete.cases( ) 判断对象中是否数据完全

6、grep()找出所数据框中元素所在的列值(仅数据框中)

7、assign()通过变量名的字符串来赋值

8、 split()根据因子变量拆分数据框/向量

9、unique()返回 x 但是省去重复的数值

10、round(),floor()和ceiling()

11、sign() 符号函数

12、%in% 检验x是否为集合y中的元素(x%in%y )

13、ls( )用来列出现存的所有对象

常见函数列表

14、数据管理相关

15、字符串处理函数

16、因子

17、数学计算

18、数组相关

19、逻辑运算

20、控制结构相关

21、自定义函数相关

22、输入输出

23、工作环境

24、简单统计量

25、时间序列

【往期回顾

R语言 | 第一部分:数据预处理

R语言|第2讲:生成数据

R语言常用的数据输入与输出方法 | 第三讲

R语言数据管理与dplyr、tidyr | 第4讲

R语言 控制流:for、while、ifelse和自定义函数function|第5讲

正 文

1、str() 显示数据集和变量类型,并简要展示数据集情况

> data(mtcars)> str(mtcars)'data.frame':   32 obs. of  11 variables: $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num  6 6 4 6 8 6 8 4 4 6 ... $ disp: num  160 160 108 258 360 ... $ hp  : num  110 110 93 110 175 105 245 62 95 123 ... $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt  : num  2.62 2.88 2.32 3.21 3.44 ... $ qsec: num  16.5 17 18.6 19.4 17 ... $ vs  : num  0 0 1 1 0 1 0 1 1 1 ... $ am  : num  1 1 1 0 0 0 0 0 0 0 ... $ gear: num  4 4 4 3 3 3 3 4 4 4 ... $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

2、subset()  取子集

条件筛选后,mtcars_df数据集为20 obs.

> data(mtcars)> str(mtcars)'data.frame':   32 obs. of  11 variables: #……省略部分内容 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ... #……省略部分内容> mtcars_df  3)> str(mtcars_df)'data.frame':   20 obs. of  11 variables: #……省略部分内容 $ wt  : num  3.21 3.44 3.46 3.57 3.19 ... #……省略部分内容

3、which.min(), which.max()和which()

which(), which.max(), which.min()返回的是位置(索引)

which(x, arr.ind = FALSE, useNames = TRUE)

x是一个向量或者数组;arr.ind = FALSE 默认返回数组索引

> set.seed(1)> x > x [1] -0.6264538  0.1836433 -0.8356286  1.5952808  0.3295078 -0.8204684  0.4874291 [8]  0.7383247  0.5757814 -0.3053884> which(x > 0) #显示x>0的所有数值[1] 2 4 5 7 8 9> which.min(x) #显示min(x)的所有数值的位置[1] 3> which.max(x) #显示max(x)的所有数值的位置[1] 4> plot(1:10,x) #如下图

> y > which(y > 5) #显示x>5的所有数值[1]  6  7  8  9 10 > which(y > 5,arr.ind = TRUE) #显示x>5的所有数值的位置     row col[1,]   1   2[2,]   2   2[3,]   3   2[4,]   4   2[5,]   5   2

4、pmin( )/ pmax( )

把多个等长度的向量按元素逐个对比,返回所有向量的第K个元素中最小(最大)值

> x > y > > pmin(x,y)[1] 1 2 1 3 4> pmax(x,y)[1] 2 5 3 4 5

5、complete.cases( ) 判断对象中是否数据完全

complete.case()可以判断对象中是否数据完全,然后返回TRUE, FALSE。这一函数在去除数据框中缺失值时很有用。

> x 1,> x     [,1][1,]    1[2,]    2[3,]   NA[4,]    4> complete.cases(x)[1]  TRUE  TRUE FALSE  TRUE> x[complete.cases(x),][1] 1 2 4

6、grep()找出所数据框中元素所在的列值(仅数据框中)

> x > x  X1 X21  1 NA2  2  4> grep(1,x)[1] 1> grep(2,x)[1] 1> grep(4,x)[1] 2

7、assign()通过变量名的字符串来赋值

> assign("x",c(1:10))> x [1]  1  2  3  4  5  6  7  8  9 10

8、 split()根据因子变量拆分数据框/向量

split(x,f);x 可以为向量或者数据框,f 为对应的因子,函数以列表的形式返回

> x = data.frame(matrix(1:10,nrow = 5))> MorFM = c("Female","Male","Female","Female","Female")> split(x,MorFM)$Female  X1 X21  1  63  3  84  4  95  5 10$Male  X1 X22  2  7> yx > yx$Female  X1 X21  1  63  3  84  4  95  5 10> yx$Male  X1 X22  2  7

9、unique()返回 x 但是省去重复的数值

> x <- c(1:5,2:10,3,5)> x [1]  1  2  3  4  5  2  3  4  5  6  7  8  9 10  3  5> unique(x) [1]  1  2  3  4  5  6  7  8  9 10

10、round(),floor()和ceiling()

round()四舍五入取整;floor()向下取整;ceiling()向上取整

> round(3.5)[1] 4> floor(3.5)[1] 3> ceiling(3.5)[1] 4

11、sign() 符号函数

sign()根据其参数向量中的数值是正值、零、负值将其分别转化为1,0,-1

> set.seed(1)> x <- rnorm(20)> x [1] -0.62645381  0.18364332 -0.83562861  1.59528080  0.32950777 -0.82046838 [7]  0.48742905  0.73832471  0.57578135 -0.30538839  1.51178117  0.38984324[13] -0.62124058 -2.21469989  1.12493092 -0.04493361 -0.01619026  0.94383621[19]  0.82122120  0.59390132> x_sign <- sign(x)> x_sign [1] -1  1 -1  1  1 -1  1  1  1 -1  1  1 -1 -1  1 -1 -1  1  1  1> plot(x,x_sign)

12、%in% 检验x是否为集合y中的元素(x%in%y )

> y > 5%in%y[1] TRUE> 4%in%y[1] FALSE

13、ls( )用来列出现存的所有对象

pattern是一个具名参数,可以列出所有名称中含有字符串“s”的对象。

> library(ggplot2)> ls("package:ggplot2", pattern="geom_.a")[1] "geom_bar"    "geom_label"  "geom_map"    "geom_path"   "geom_raster"

其他函数列表

14、数据管理相关vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求子集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象sort,order,unique,rev:排序unlist:展开列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性15、字符串处理函数character:字符型向量nchar:字符数substr:取子串format,format C:把对象用格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换

16、因子

factor:因子codes:因子的编码levels:因子的各水平的名字nlevels:因子的水平个数cut:把数值型对象分区间转换为因子table:交叉频数表split:按因子分组aggregate:计算各数据子集的概括统计量tapply:对“不规则”数组应用函数17、数学计算+, -, *, /, ^, %%, %/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值range:最大值和最小值sum,prod:向量元素和积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数18、数组相关array:建立数组matrix:生成矩阵data.matrix:把数据框转换为数值型矩阵lower.tri:矩阵的下三角部分mat.or.vec:生成矩阵或向量 t:矩阵转置cbind:把列合并为矩阵rbind:把行合并为矩阵diag:矩阵对角元素向量或生成对角矩阵aperm:数组转置nrow, ncol:计算数组的行数和列数dim:对象的维向量dimnames:对象的维名row/colnames:行名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应用函数tapply:对“不规则”数组应用函数sweep:计算数组的概括统计量aggregate:计算数据子集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的行下标集col:求列下标集19、逻辑运算,<=,>=,==,!=:比较运算符!,&,&&,|,||,xor():逻辑运算符 logical:生成逻辑向量all,any:逻辑向量都为真或存在真ifelse():二者择一match,%in%:查找unique:找出互不相同的元素which:找到真值下标集合duplicated:找到重复元素20、控制结构相关if,else,ifelse,switch:分支for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。21、自定义函数相关function:函数定义source:调用文件call:函数调用22、输入输出cat,print:显示对象 sink:输出转向到指定文件 dump,save,dput,write:输出对象 scan,read.table,load,dget:读入23、工作环境ls,objects:显示对象列表rm, remove:删除对象 q,quit:退出系统 .First,.Last:初始运行函数与退出运行函数。options:系统选项 ?,help,help.start,apropos:帮助功能 data:列出数据集24、简单统计量sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量sort,order,rank与排序有关,其它还有ave,fivenum,mad,quantile,stem等25、时间序列ts:时间序列对象diff:计算差分time:时间序列的采样时间window:时间窗

说明:本文中前半部分内容为作者自行整理,后半部分内容引自网络,稍作整理(蓝色标记部分是笔者认为比较常见和使用的函数)。

R语言中dim函数_R语言 常见函数知识点梳理与解析 | 精选分析相关推荐

  1. R语言中dim函数_R语言--向量化计算(apply族函数)

    R语言最优秀的是它的向量化编程,这其中apply族函数扮演了非常重要的角色.apply族函数是由apply.sapply.lapply.mapply.tapply等函数组成的.熟练使用apply族函数 ...

  2. R语言中dim函数_R语言中的方差分析方法汇总

    方差分析,是统计中的基础分析方法,也是我们在分析数据时经常使用的方法.下面我总结一下R语言如何对常用的方差分析进行操作. 1. 方差分析的假定 上面这个思维导图,也可以看出,方差分析有三大假定:正态, ...

  3. r语言c函数例子,R语言 常见函数知识点梳理与解析 | 精选分析

    $MaleX1 X22 2 7 > yx yx$FemaleX1 X21 1 63 3 84 4 95 5 10> yx$MaleX1 X22 2 7 9.unique返回 x 但是省去重 ...

  4. r语言中paste函数_R中的paste()函数-简要指南

    r语言中paste函数 Using the paste() function in R will be straight and simple. In this tutorial let's see ...

  5. r语言中mpg数据_R语言数据筛选整理包dplyr

    dplyr软件包是R中功能最强大,最受欢迎的软件包之一.该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等.本文包括一些示例和如何 ...

  6. r语言中mpg数据_R语言数据实战 | 统计检验

    原标题:R语言数据实战 | 统计检验 1.单个总体均值的t检验 1. 什么是检验? 检验(test)是统计学中最重要的概念之一,在科学研究和实际业务中都有着广泛的应用.用一句话来概括就是:人们希望通过 ...

  7. r语言中mpg数据_R语言常用的数据处理的包(1)

    在R中有很多的内置函数,比如transform().rbind().cbind()等函数,这些函数我们可以直接使用,除此之外,还有常见的几种包在处理数据的时候非常好用. dplyr包 dplyr包是H ...

  8. r语言中mpg数据_R语言数据分析系列之五

    R语言数据分析系列之五 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://gith ...

  9. r语言中c函数错误,R语言中c()函数与paste()函数的区别说明

    c()函数:将括号中的元素连接起来,并不创建向量 paste()函数:连接括号中的元素 例如 c(1, 2:4),结果为1 2 3 4 paste(1, 2:4),结果为"1 2" ...

最新文章

  1. [19/03/30-星期六] IO技术_四大抽象类_ 字节流( 字节输入流 InputStream 、字符输出流 OutputStream )_(含字节文件缓冲流)...
  2. Hibernate:hbm2ddl.auto =在生产中更新?
  3. sql 操作字符串备忘(转)
  4. Redis缓存 ava-Jedis操作Redis,基本操作以及 实现对象保存
  5. VF01开票自动生成会计凭证
  6. 【转】C++ traits技术
  7. OpenGL使用深度剥离命令获得独立的透明度
  8. 三极管的“非教科书式”解析,什么正偏、反偏都统统滚蛋!
  9. Vs2015智能提示英文?
  10. Django-ROM(字段,参数)
  11. WIN2016群集存储
  12. 筑牢梅雨季用电“安全网”
  13. matlab 高精度无理数,如何从MatLab上的无理数生成近似分数?
  14. Overlaps的压盖计数规则
  15. 新版HyperMesh的Assemblies中调出下拉菜单查看Component(装配关系模型树)
  16. 【JavaScript】实现微信发消息-解决方案
  17. Android接入高德地图SDK如何设置Key(发布版/测试版)
  18. 一篇文章通透理解序列号实现原理
  19. 文本生成任务常见评估指标
  20. “数据”到底是资产还是负债?

热门文章

  1. jQuery canvas碎片粒子组成爱心图形动画特效
  2. 写给程序员的数理科普:混沌与三体
  3. 深度解析CTM项目成功的原因
  4. 最近所学的Json以及ajax的应用
  5. 快速调出multisim里单刀双置开关
  6. access实验报告体会_Access实验报告
  7. ppt扇形图怎么显示数据_ppt如何制作扇形图 ppt如何画扇形统计图-泡泡糖办公
  8. [ZUCC 英语周测]Quiz B-3-7
  9. MSP430F5529-定时器介绍
  10. glibc 知:系统调用