R语言数据分析系列之五

本节来讨论一下R语言的基本图形展示,先来看一张效果图吧。

这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://github.com/comaple/R-wordcloud.git

好了我们開始今天的旅程吧:

本节用到的包有:RColorBrewer用来生成序列颜色值, plotrix三维图形

本节用到的数据集:vcd包中的Arthritis数据集

数据集

install.packages("vcd")

library('vcd')

install.packages(plotrix) #将图形包也一并安装了

library(plotrix)

data(package='vcd') # 查看vcd包得所有数据集

class(Arthritis) # 查看数据集类型

names(Arthritis) # 查看列名

arth

arth[1:10,] #查看前10行数据

柱状图

#该数据集最后一列Improved为因子型数据。

table(arth$Improved) #查看因子水平的count值

col

barplot(table(arth$Improved),col=col,xlab='improved',ylab='count',main='StatisticsOf Improved') #绘制柱状图

barplot(table(arth$Improved),col=col,horiz=T,xlab='count',ylab='improved',main='StatisticsOf Improved') #水平柱状图

barplot(counts,col=col,legend=rownames(counts),width=0.1) #堆砌条形图

barplot(counts,col=col[1:3],legend=rownames(counts),width=0.1,beside=T)#分组条形图

饼图

par(mfrow=c(1,2)) # 定义横向画布,两格布局

label

ages

pie(table(ages),family='STKaiti') # 画出饼图

pie(table(ages),labels=paste(levels(ages),':',round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比')

pie3D(table(ages),labels= paste(round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比',explode=0.1)# 3D 饼图

直方图

我们採用mtcars数据集来进行图形绘制:

h

lines(density(mtcars$mpg),col='blue',lwd=2)#加入核密度图

假设要单独绘制和密度图的话能够这样:

plot(density(mtcars$mpg),main='DensityOf Car Gallon')

图中我们能够看到,我们得核密度函数採用的高斯核,方差为2.477。样本採样为32个。

箱型图

箱线图。通过绘制连续型变量的五数总括,即最小值(相应图中最以下那条线)、下四分位数(相应第二条线)、中位数(相应最中间那条线)、上四分位数(相应箱子上边沿) 以及最大值(相应最上面那条线),描写叙述了连续型变量的分布。

而且能够将离群点列出。

比如我们还拿mtcars数据集,当中mpg是每百公里油耗。cyl是发动机汽缸数。要对照不同得汽缸数对每加仑汽油行驶的公里数的影响就能够这样作图:

boxplot(mpg ~ cyl,data=mtcars,main='Car Milage Data',xlab='Number Of Cylinder',ylab='Miles Per Gallon')

从图中我们能够明显看到。4缸发动机有效利用率最高。6缸的最稳定,8缸利用率低且不够稳定。

r语言中mpg数据_R语言数据分析系列之五相关推荐

  1. r语言中mpg数据_R语言数据筛选整理包dplyr

    dplyr软件包是R中功能最强大,最受欢迎的软件包之一.该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等.本文包括一些示例和如何 ...

  2. r语言中mpg数据_R语言数据实战 | 统计检验

    原标题:R语言数据实战 | 统计检验 1.单个总体均值的t检验 1. 什么是检验? 检验(test)是统计学中最重要的概念之一,在科学研究和实际业务中都有着广泛的应用.用一句话来概括就是:人们希望通过 ...

  3. r语言中mpg数据_R语言常用的数据处理的包(1)

    在R中有很多的内置函数,比如transform().rbind().cbind()等函数,这些函数我们可以直接使用,除此之外,还有常见的几种包在处理数据的时候非常好用. dplyr包 dplyr包是H ...

  4. R语言中dim函数_R语言--向量化计算(apply族函数)

    R语言最优秀的是它的向量化编程,这其中apply族函数扮演了非常重要的角色.apply族函数是由apply.sapply.lapply.mapply.tapply等函数组成的.熟练使用apply族函数 ...

  5. r语言中mpg数据_零基础生信入门第一课——R语言数据清洗,超详细讲解,建议收藏!...

    小伙伴们大家好!今天我要用一篇推文精要概括数据清洗中的最基本最关键的步骤,对于零基础的学员一定会有很大收获!数据清洗是完成一篇生信文章最基本但也是最终要的准备工作,如果不会数据清洗,就要错过很多优质数 ...

  6. R语言中dim函数_R语言 常见函数知识点梳理与解析 | 精选分析

    目 录 1.str() 显示数据集和变量类型,并简要展示数据集情况 2.subset()  取子集 3.which.min(), which.max()和which() 4.pmin( )/ pmax ...

  7. R语言中dim函数_R语言中的方差分析方法汇总

    方差分析,是统计中的基础分析方法,也是我们在分析数据时经常使用的方法.下面我总结一下R语言如何对常用的方差分析进行操作. 1. 方差分析的假定 上面这个思维导图,也可以看出,方差分析有三大假定:正态, ...

  8. R语言数据分析系列之五

    R语言数据分析系列之五 -- by comaple.zhang 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,具体实现细节请参见我的g ...

  9. R循环有两个_R语言数据分析与挖掘(第九章):聚类分析(2)——层次聚类

    层次聚类(hierarchical clustering)基于簇间的相似度在不同层次上分析数据,从而形成树形的聚类结构,层次聚类一般有两种划分策略:自底向上的聚合(agglomerative)策略和自 ...

最新文章

  1. PDF数据提取------1.介绍
  2. linux 驱动开发 --- 字符设备与混杂设备区别
  3. c语言姓名号码,c语言如何输入编号和姓名
  4. java分割面板_Split 面板分割
  5. Java实现获取HDFS子目录数量_Java实现读取HDFS目录
  6. (15)ZYNQ FPGA AXI-stream总线简介(学无止境)
  7. 只有一条数据线了?iOS 14暗示苹果不在iPhone 12中附赠耳机
  8. 七年布局Cloud OS,微软将再创云产业新高
  9. 微信公众号1万粉丝流量主能赚多少钱?
  10. 张小丫第一次微信支付(讲解)
  11. Gtarcade的Hunger Heroes游戏马拉松即将开始
  12. 万能素材库_2016万能高考作文素材大全
  13. 彻底解决SPI协议OLED屏幕通道干扰乱码
  14. 小度计算机笔记,“一场无速记发布会”,小度真无线智能耳机革新语音笔记功能...
  15. 黑马程序员——Java基础--IO流(一)---File类以及其他流对象
  16. 2019年 支付宝集福攻略
  17. 什么是对象、什么是面对对象?
  18. 网络通讯学习(3)-----UDP通讯(仅了解)
  19. 奇思妙想:高大上的高并发其实可以利用Zuul完成
  20. 微众银行除了电话客服之外,还有一种联系方式要知道

热门文章

  1. k8s中通过Jenkins蓝绿/灰度发布微服务
  2. AWS 云从业者认证(AWS Certified Cloud Practitioner)
  3. Android studio真机调试(用小米10s为例)
  4. C# GDI 手绘图片转化为电子版处理
  5. 【外汇天眼】外汇周回顾:MT5发布新功能,M4Markets收购计划成功
  6. 新型工业路由器,为进入智能工业时代加快步伐
  7. Mac上如何输入数学符号??
  8. The missing semester of your CS education--命令行环境
  9. YUI可真是个不错的东东
  10. 在网页地图图片上加注企业和“圳品”数量信息+1