一、在这我以鸢尾花为例

iris
dim(iris)###行列数目
names(iris)###有那些列
str(iris)###数据的结构如何
attributes(iris)# 数据的列名、行名和数据结构
head(iris)###前六行
iris[,1:2]###所有行的一到二列
iris[1,1:5]###第一行的1到5列
iris[1:10,"Sepal.Length"]####看取Sepal.Length前是个数据
iris$Sepal.Length[1:10]###取出变量数据
#二、看看单个变量的情况
summary(iris$Sepal.Length)###分析
quantile(iris$Sepal.Length, c(0.1, 0.3, 0.65)) # 指定分位点对应的分位数
mean(iris$Sepal.Length)
median(iris$Sepal.Length)
range(iris$Sepal.Length) # 返回均值、中位数和数据的范围
#三、对于连续变量:
var(iris) # 返回变量的方差
hist(iris$Sepal.Length) # 画出变量的直方图,看看变量的分布情况
plot(density(iris$Sepal.Length)) # 画出变量的密度函数图
#四对于类别变量:
table(iris$Species) # 统计每个类别的计数,了解一下各个类别的分布
pie(table(iris$Species)) # 画出每个类别的占比饼图
barplot(table(iris$Species)) # 画出柱状图
#五、观察多个变量之间的关系
首先看看变量之间的相关性:
cov(iris[ , 1:4]) # 计算变量之间的协方差矩阵
cor(iris[ , 1:4]) # 计算变量之间的相关系数矩阵
#然后研究一些在不同的目标变量水平下,某变量的基本情况:
aggregate(Sepal.Length~Species, summary, data=iris) # 对于Sepal.Length变量,在每个Species水平上执行summary计算
boxplot(Sepal.Length~Species, data=iris) # 针对每个Species水平绘制Sepal.Length的盒形图
with(iris, plot(Sepal.Length, Sepal.Width, col=Species, pch=as.numeric(Species))) #针对每个Species水平绘制两个变量的散点图,并用颜色和点状区分
plot(jitter(iris$Sepal.Length), jitter(iris$Sepal.Width))

接着用图形的方式研究变量之间的关系:

pairs(iris) # 绘制任意两个矩阵之间的散点图,发现变量之间的相关性

> iris[1,1:5]###第一行的1到5列
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
> iris[1:10,"Sepal.Length"]####看取Sepal.Length前是个数据
[1] 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9
> iris$Sepal.Length[1:10]###取出变量数据
[1] 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9
> #二、看看单个变量的情况
> summary(iris$Sepal.Length)###分析
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.300 5.100 5.800 5.843 6.400 7.900
> quantile(iris$Sepal.Length, c(0.1, 0.3, 0.65)) # 指定分位点对应的分位数
10% 30% 65%
4.80 5.27 6.20
> mean(iris$Sepal.Length)
[1] 5.843333
> median(iris$Sepal.Length)
[1] 5.8
> range(iris$Sepal.Length) # 返回均值、中位数和数据的范围
[1] 4.3 7.9
> #三、对于连续变量:
> var(iris) # 返回变量的方差
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Sepal.Length 0.6856935 -0.0424340 1.2743154 0.5162707 NA
Sepal.Width -0.0424340 0.1899794 -0.3296564 -0.1216394 NA
Petal.Length 1.2743154 -0.3296564 3.1162779 1.2956094 NA
Petal.Width 0.5162707 -0.1216394 1.2956094 0.5810063 NA
Species NA NA NA NA NA
Warning message:
In var(iris) : 强制改变过程中产生了NA
> hist(iris$Sepal.Length) # 画出变量的直方图,看看变量的分布情况
> plot(density(iris$Sepal.Length)) # 画出变量的密度函数图
> #四对于类别变量:
> table(iris$Species) # 统计每个类别的计数,了解一下各个类别的分布

setosa versicolor virginica
50 50 50
> pie(table(iris$Species)) # 画出每个类别的占比饼图
> barplot(table(iris$Species)) # 画出柱状图
> #五、观察多个变量之间的关系
> 首先看看变量之间的相关性:
> cov(iris[ , 1:4]) # 计算变量之间的协方差矩阵
Sepal.Length Sepal.Width Petal.Length Petal.Width
Sepal.Length 0.6856935 -0.0424340 1.2743154 0.5162707
Sepal.Width -0.0424340 0.1899794 -0.3296564 -0.1216394
Petal.Length 1.2743154 -0.3296564 3.1162779 1.2956094
Petal.Width 0.5162707 -0.1216394 1.2956094 0.5810063
> cor(iris[ , 1:4]) # 计算变量之间的相关系数矩阵
Sepal.Length Sepal.Width Petal.Length Petal.Width
Sepal.Length 1.0000000 -0.1175698 0.8717538 0.8179411
Sepal.Width -0.1175698 1.0000000 -0.4284401 -0.3661259
Petal.Length 0.8717538 -0.4284401 1.0000000 0.9628654
Petal.Width 0.8179411 -0.3661259 0.9628654 1.0000000
> #然后研究一些在不同的目标变量水平下,某变量的基本情况:
> aggregate(Sepal.Length~Species, summary, data=iris) # 对于Sepal.Length变量,在每个Species水平上执行summary计算
Species Sepal.Length.Min. Sepal.Length.1st Qu. Sepal.Length.Median
1 setosa 4.300 4.800 5.000
2 versicolor 4.900 5.600 5.900
3 virginica 4.900 6.225 6.500
Sepal.Length.Mean Sepal.Length.3rd Qu. Sepal.Length.Max.
1 5.006 5.200 5.800
2 5.936 6.300 7.000
3 6.588 6.900 7.900

六、为了了解更多的基础,我将会用小例子进行表达

(1)pch的用法

R语言绘图是通过函数命令及相应参数设置实现的。如plot(x,y),plot为绘图函数命令,x,y则是绘图参数,指定了绘图的数据向量。但这种最基本的绘图设置很难满足个性化绘图的要求,我们需要根据需要对图形元素进行设置。图形元素是各类图形的基本构成要素,因此,不管我们绘制那种类型的图形,都离不开图形元素的设定,要想绘制出漂亮的统计图形,我们首先要熟悉绘图函数最常见的图形元素设置。

Ø  pch (绘图符号设置参数)

绘图时我们可以用各类符号显示数据,pch是plotting character 的缩写。pch缺省下设定数据显示为点状。pch 符号可以使用0 : 25来表示26 个标识(参看图pch 符号),如pch=23设定数据点显示形状为菱形;当pch=0时不显示任何符号;当然我们也可以任意指定如#;%; ¤; j;+;¡; :; o等符号。值得注意的是,21 : 25这几个符号可以使用bg="颜色" 参数进行不同的颜色填充。颜色参数col则可以用于设置1:25所表示符号的颜色。

#par(mfrow=c(1,3))#一页3图
layout(matrix(c(1,2,3),nr=1,byrow=T))##按行
plot(1:25,pch=1:25,cex=2.5,bg="blue", main="pch符号图",xlab="pch编码")
plot(1:25,pch="$",cex=6,main="pch=$")####字体大小为六
plot(1:26,pch=LETTERS[1:26],col=1:26)

转载于:https://www.cnblogs.com/alsely/p/6746597.html

我的R 之路: R最常见的小基础。。。。。。。。相关推荐

  1. 150分钟学会R语言与R常见问题解答

    序: 这篇文档内容的来源多样,既有来自于 R官方文档(包括 R intro,R data,R admin),也有来 自于互联网的 contributed documents:还有若干来自于 Capit ...

  2. c语言 r语言 java,R语言rJava包安装载入及JAVA环境配置

    rJava 包的安装与载入 一般文本分词的教程都会贴出: install.packages("rJava") library(rJava) 来引导我们装载rJava包,运行inst ...

  3. R语言|数据类型————R语言入门到入土系列(一)

    本系列将从R语言的基本入门到R语言实战系列,逐步编写R语言的教程. R语言数据类型 R语言的赋值与输出 R语言的数据类型 数据类型的查看 数据类型的转换 R语言的赋值与输出 R语言赋值语法如下: 赋值 ...

  4. 批量修改文件权限 和所有者 chown nobody:nobody * -R chmod 775 * -R

    chown nobody:nobody * -R chmod 775 * -R

  5. R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型、分类预测器(分类变量)被自动替换为一组虚拟编码变量、summary函数查看检查模型、使用table函数计算混淆矩阵评估分类模型性能

    R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型(Logistic regression).分类预测器(分类变量)被自动替换为一组虚拟编码变量.summary函数查看检查模型.使用t ...

  6. R语言使用R原生函数plot和lines可视化线图、并使用lty参数自定义线条类型、lwd自定义设置线条的粗细、col参数自定义线条颜色(Change R base plot line types)

    R语言使用R原生函数plot和lines可视化线图.并使用lty参数自定义线条类型.lwd自定义设置线条的粗细.col参数自定义线条颜色(Change R base plot line types) ...

  7. R语言可视化R原生plot函数与ggplot可视化结果组合、整合输出实战:原生R绘图plot函数可视化、ggplot2包可视化、R原生plot函数与ggplot可视化结果组合

    R语言可视化R原生plot函数与ggplot可视化结果组合.整合输出实战:原生R绘图plot函数可视化.ggplot2包可视化.R原生plot函数与ggplot可视化结果组合 目录

  8. R语言ggplot2可视化散点图实战:绘制基础散点图、为所有散点添加标签、只为大于阈值的散点添加标签

    R语言ggplot2可视化散点图实战:绘制基础散点图.为所有散点添加标签.只为大于阈值的散点添加标签 目录

  9. R语言获取当前R版本(version)实战

    R语言获取当前R版本(version)实战 目录 R语言获取当前R版本(version)实战 #R.Version()函数 #$version.string抽取版本信息 #R.version.stri ...

  10. 近世代数--极大理想--I是R的极大理想↔R/I是域

    近世代数--极大理想--I是R的极大理想↔R/I是域 博主是初学近世代数(群环域),本意是想整理一些较难理解的定理.算法,加深记忆也方便日后查找:如果有错,欢迎指正. 我整理成一个系列:近世代数,方便 ...

最新文章

  1. 数学--数论--中国剩余定理+扩展中国剩余定理(孙子定理)
  2. c语言出圈游戏课设报告,c语言作业 出圈游戏
  3. Spring Boot 使用 AOP 实现页面自适应
  4. nfs搭建和可能的问题
  5. BZOJ3592 : Architext
  6. python时间序列画图plot总结
  7. 水很深的深度学习-Task05循环神经网络RNN
  8. 系统集成项目管理工程师(试题分析、考试大纲、教材目录)
  9. ios根据服务器修改App名称,iOS 修改APP工程名字
  10. 微软重新评估收购雅虎提议
  11. push_back讲解
  12. 面向 Java 开发人员的区块链链代码
  13. proxmox的安装
  14. AI 换脸术「Deepfakes」进化简史
  15. 关于Value ‘0000-00-00 00:00:00‘ can not be represented as java.sql.Timestamp异常问题的解读
  16. Rabbitmq交换机详解
  17. 如何在WORD中输入方框,并且在里面打勾?
  18. 蓝牙设备改参数教程_修改蓝牙设备的名称
  19. C语言 请给小学生随机出10道加减法的练习题,要求:10以内的加减法,并且能批改。
  20. 谷歌真被ChatGPT搞慌了!两位创始人紧急回归制定战术,搜索广告根基不容有失...

热门文章

  1. TextureView实现视频播放
  2. C# 字段、属性、成员变量
  3. mybatis 3.2.7 与 spring mvc 3.x、logback整合
  4. SuperWebSocket发布0.1版本
  5. python学习之老男孩python全栈第九期_day022作业
  6. nginx开启密码认证
  7. webpack配置信息说明
  8. exit()和return的区别
  9. display: inline-block;为什么会撑开父div
  10. 13. PHP OPcache