R语言数据分析系列之五
R语言数据分析系列之五
—— by comaple.zhang
本节来讨论一下R语言的基本图形展示,先来看一张效果图吧。
这是一张用R语言生成的,虚拟的wordcloud云图,具体实现细节请参见我的github项目:https://github.com/comaple/R-wordcloud.git
好了我们开始今天的旅程吧:
本节用到的包有:RColorBrewer用来生成序列颜色值, plotrix三维图形
本节用到的数据集:vcd包中的Arthritis数据集
数据集
install.packages("vcd")
library('vcd')
install.packages(plotrix) #将图形包也一并安装了
library(plotrix)
data(package='vcd') # 查看vcd包得全部数据集
class(Arthritis) # 查看数据集类型
names(Arthritis) # 查看列名
arth <- Arthritis # 复制一份
arth[1:10,] #查看前10行数据
柱状图
#该数据集最后一列Improved为因子型数据。
table(arth$Improved) #查看因子水平的count值
col <- c(brewer.pal(9,'YlOrRd')[1:9]) #设置颜色序列
barplot(table(arth$Improved),col=col,xlab='improved',ylab='count',main='StatisticsOf Improved') #绘制柱状图
barplot(table(arth$Improved),col=col,horiz=T,xlab='count',ylab='improved',main='StatisticsOf Improved') #水平柱状图
barplot(counts,col=col,legend=rownames(counts),width=0.1) #堆砌条形图
barplot(counts,col=col[1:3],legend=rownames(counts),width=0.1,beside=T)#分组条形图
饼图
par(mfrow=c(1,2)) # 定义横向画布,两格布局
label <- c('壮年','中年','长辈','老年')
ages <- cut(arth$Age,breaks=c(20,30,50,70,100),labels=label)#将年龄数据离散化
pie(table(ages),family='STKaiti') # 画出饼图pie(table(ages),labels=paste(levels(ages),':',round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比')
pie3D(table(ages),labels= paste(round(table(ages)/sum(table(ages))*100,2),'%'),family='STKaiti',main='关节炎发病率年龄段占比',explode=0.1)# 3D 饼图
直方图
我们采用mtcars数据集来进行图形绘制:
h <- hist(mtcars$mpg,breaks=12,col=col,freq=F,xlab='MilesPer Gallon',main='Histogram Of Car Gallon,Density curve') # 绘制直方图lines(density(mtcars$mpg),col='blue',lwd=2)#添加核密度图
如果要单独绘制和密度图的话可以这样:
plot(density(mtcars$mpg),main='DensityOf Car Gallon')
图中我们可以看到,我们得核密度函数采用的高斯核,方差为2.477,样本采样为32个。
箱型图
箱线图,通过绘制连续型变量的五数总括,即最小值(对应图中最下面那条线)、下四分位数(对应第二条线)、中位数(对应最中间那条线)、上四分位数(对应箱子上边沿) 以及最大值(对应最上面那条线),描述了连续型变量的分布。并且可以将离群点列出。
例如我们还拿mtcars数据集,其中mpg是每百公里油耗,cyl是发动机汽缸数,要对比不同得汽缸数对每加仑汽油行驶的公里数的影响就可以这样作图:
boxplot(mpg ~ cyl,data=mtcars,main='Car Milage Data',xlab='Number Of Cylinder',ylab='Miles Per Gallon')
从图中我们可以明显看到,4缸发动机有效利用率最高,6缸的最稳定,8缸利用率低且不够稳定。
R语言数据分析系列之五相关推荐
- r语言中mpg数据_R语言数据分析系列之五
R语言数据分析系列之五 本节来讨论一下R语言的基本图形展示,先来看一张效果图吧. 这是一张用R语言生成的,虚拟的wordcloud云图,详细实现细节请參见我的github项目:https://gith ...
- R语言数据分析系列之七
R语言数据分析系列之七 -- by comaple.zhang 回归分析建模是数据分析里面很重要的一个应用之一,即通过使用已有的自变量的值建立某种关系,来预测未知变量(因变量)的值.如果因变量是连续的 ...
- R语言|回归分析(一) ———R语言数据分析系列(一)
回归分析 数据准备 数据基本信息 建立回归模型 建立回归方程 预测数值 回归方程可视化 散点图加拟合 回归方程诊断 完整代码 回归分析它是最为人熟知的建模技术之一.线性回归通常是人们在学习预测模型时首 ...
- 三十四、R语言数据分析实战
@Author : By Runsen @Date : 2020/5/14 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大学沉迷日语,Python, Java和一系列数据分析软件.导致翘 ...
- 《R语言数据分析与挖掘实战》——3.2 数据特征分析
本节书摘来自华章计算机<R语言数据分析与挖掘实战>一书中的第3章,第3.2节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区"华章计算机"公众号查看. ...
- R语言学习系列之本地数据获取
R语言学习系列之本地数据获取 任何数据分析工作之前,都得把数据先读取进来你才能进行后续的分析工作.所以本文简要介绍在R中如何对本地文件进行获取,希望可以给刚刚接触R语言的同学一点启发. 一.控制台的输 ...
- R语言学习系列之向量化计算
##R语言学习系列之向量化计算 本文主要讲解R语言向量化计算的原理及方法,希望对初学者能够提供帮助. ##一.向量化 什么是向量化计算呢?其实你可以简单的理解成这样:当我们在使用函数或者定义函数的时候 ...
- 手把手教你入门R语言--数据分析篇(1)——数据导入与基础绘图
R语言入门系列课程(6) 前面已将R语言的基础全部交给大家了,这两节将教大家用R语言进行数据分析的基础.数据读入(数据源包括txt文件.Excel文件.MySLQ数据库.MongoDB数据库).数据写 ...
- 《R语言数据分析》——3.2 聚集
本节书摘来自华章出版社<R语言数据分析>一书中的第3章,第3.2节,作者盖尔盖伊·道罗齐(Gergely Daróczi),潘怡 译,更多章节内容可以访问云栖社区"华章计算机&q ...
最新文章
- 【C++】Google C++编码规范(一):作用域
- MySQL优化篇:执行计划explain中key_len计算方式
- 2021年的第一盆冷水:有人说别太把图神经网络当回事儿
- 关于react中setState的深入理解
- delphi 打包工具_每年帮你省钱20万的砖头打包方式,是你想要的吗?
- lettuce webdriver 自动化测试---玩转BDD
- matlab产生时间数组以月为单位_Matlab中处理日期与时间的函数
- Linux下CMake简明教程(九) 添加控制选项
- 问题 | FileNotFoundError: [Errno 2] No such file or directory: 'null'
- Android复习02(ListView具体操作[很详细]、简单音乐播放器)
- jquery-学生列表增删编辑,纯前端操作
- 数据库原理—数据库基础(二)
- 基于AD09的四层板设计概要
- 但行好事,莫问前程。
- html实现播放器下一集方法,本地化DPLAYER和CKPLAYER播放器自动下一集
- 必备干货,程序员进阶升级全攻略!
- 计算机审计试题及答案,计算机审计练习题及答案
- 我的大学六年--郭天祥
- 京东要开实体店?且看他在线下如何被苏宁碾压
- 燃!恭喜云上伙伴众安保险港交所上市