作者:穆晨

来源:https://www.cnblogs.com/muchen/p/5310732.html

阅读目录

  • 数据分布图简介

  • 绘制基本直方图

  • 基于分组的直方图

  • 绘制密度曲线

  • 绘制基本箱线图

  • 往箱线图添加槽口和均值

  • 绘制2D等高线

  • 绘制2D密度图

数据分布图简介

中医上讲看病四诊法为:望闻问切。而数据分析师分析数据的过程也有点相似,我们需要望:看看数据长什么样;闻:仔细分析数据是否合理;问:针对前两步工作搜集到的问题与业务方交流;切:结合业务方反馈的结果和项目需求进行数据分析。

"望"的方法可以认为就是制作数据可视化图表的过程,而数据分布图无疑是非常能反映数据特征(用户症状)的。R语言提供了多种图表对数据分布进行描述,本文接下来将逐一讲解。

绘制基本直方图

本例选用如下测试集:

直方图的横轴为绑定变量区间分隔的取值范围,纵轴则表示变量在不同变量区间上的频数。绘制时只需将基函数的美学特征集中配置好需要分析的变量,然后创建新的直方图图层即可。R语言示例代码如下:

# 基函数

运行结果:

基于分组的直方图

本例选用如下测试集:

直方图的分组图和本系列前面一些博文中讲的一些分组图不同,它不能进行水平方向的堆积 - 这样看不出频数变化趋势;也不能进行垂直方向的堆积 - 这样同样看不出趋势。这里采用一种新的堆积方法:重叠堆积,R语言实现代码如下:

# 预处理:将smoke变量转换为因子类型

运行结果:

也可以采用分面的方法,R语言实现代码如下:

# 预处理1:将smoke变量转换为因子类型

运行结果:

绘制密度曲线

本例选用如下测试集:

密度曲线表达的意思和直方图很相似,因此密度曲线的绘制方法和直方图也几乎是相同的。区别仅在于密度曲线的横轴要绑定到连续型变量,另外绘制函数的名字不同。R语言示例代码如下:

# 预处理:将smoke变量转换为因子类型

运行结果:

绘制基本箱线图

本例选用如下测试集:

箱线图是一种常用数据分布图,下图表示了这种图中各元素的意义:

绘制方法是在基函数中将变量分组绑定到横轴,变量本身绑定到纵轴。此外,为了美观也可以将分组绑定到fill变量并设置调色板。R语言示例代码如下:

# 基函数ggplot(birthwt, aes(x = factor(race), y = bwt, fill = factor(race))) +  # 箱线图函数  geom_boxplot() +  # 颜色标尺  scale_fill_brewer(palette = "Pastel2")

运行结果:

往箱线图添加槽口和均值

在上一节绘制的基本箱线图之上,还能进一步绘制以展示更多信息。

其中最常见的是为箱子添加槽口,它能更清晰的表示中位数的位置。R语言实现代码如下:

# 基函数

运行结果:

通过stat_summary()函数,还可以在箱线图中标记均值点。R语言实现代码如下:

# 基函数

运行结果:

绘制2D等高线

本例选用如下测试集:

绘制2D等高线主要是调用stat_density()函数。这个函数会给出一个基于数据的二维核密度估计,然后我们可基于这个估计值来判断各样本点的"等高"性。接下来首先给出各数据点及等高线的绘制方法,R语言实现代码如下:

# 基函数

运行结果:

        也可以通过设置密度函数美学特征集中的colour参数来给不同密度的等高线着色,R语言实现代码如下:

# 基函数

运行结果:

绘制2D密度图

本例选用如下测试集:

等高线图也是密度图的一种,因此绘制密度图和等高线图用的是同一个函数:stat_density(),只是它们传入的参数不同。首先绘制经典栅格密度图,R语言实现代码如下:

# 基函数

运行结果:

也可以将密度变量映射到透明度来渲染,R语言实现代码如下:

x = eruptions, 

运行结果:

猜你喜欢

  • 11种概率分布,你了解几个?

  • 贝叶斯定理的通俗理解

  • R语言资源整理——史上最全

  • R语言简单实现决策树算法

R 多变量数据预处理_R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)...相关推荐

  1. R 多变量数据预处理_R语言常用统计方法包+机器学习包(名称、简介)

    上期帮大家盘点了一下R中常用的可视化包,这期将简要盘点一下关于统计分析与机器学习的R包,并通过简要介绍包的特点来帮助读者深入理解可视化包. 本文作者为"食物链顶端"学习群中的小伙伴 ...

  2. R 多变量数据预处理_R语言 数据管理与dplyr、tidyr | 第4讲

    原创: 拴小林 数据驱动实践 6月11日 原文:R语言数据管理与dplyr.tidyr | 第4讲 往期回顾 R语言 | 第一部分:数据预处理 R语言|第2讲:生成数据 R语言常用的数据输入与输出方法 ...

  3. R语言为散点图添加凸包(convex hull):数据预处理(创建一个包含每组数据凸包边界的数据集)、ggplot2使用geom_polygon函数为可视化图像添加凸包(convex hull)

    R语言为散点图添加凸包(convex hull):数据预处理(创建一个包含每组数据凸包边界的数据集).ggplot2使用geom_polygon函数为可视化图像添加凸包(convex hull) 目录

  4. R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)...

    作者:穆晨 来源:https://www.cnblogs.com/muchen/p/5310732.html 阅读目录 数据分布图简介 绘制基本直方图 基于分组的直方图 绘制密度曲线 绘制基本箱线图 ...

  5. 第六篇:R语言数据可视化之数据分布图(直方图、密度曲线、箱线图、等高线、2D密度图)

    阅读目录 数据分布图简介 绘制基本直方图 基于分组的直方图 绘制密度曲线 绘制基本箱线图 往箱线图添加槽口和均值 绘制2D等高线 绘制2D密度图 数据分布图简介 中医上讲看病四诊法为:望闻问切.而数据 ...

  6. R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据:使用gt包可视化表格数据,使其易于阅读和理解、使用gtExtras包添加一个图,显示表中某一列中的数字

    R语言使用gt包和gtExtras包优雅地.漂亮地显示表格数据:使用gt包可视化表格数据,使其易于阅读和理解.使用gtExtras包添加一个图,显示表中某一列中的数字 目录

  7. R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据:使用gt包可视化表格数据,使其易于阅读和理解、使用gtExtras包添加一个图,显示表中某一列中的数字、并为类型数据添加图像符号标签

    R语言使用gt包和gtExtras包优雅地.漂亮地显示表格数据:使用gt包可视化表格数据,使其易于阅读和理解.使用gtExtras包添加一个图,显示表中某一列中的数字.并为类型数据添加图像符号标签 目 ...

  8. R语言ggplot2可视化时间序列数据并添加稳定趋势线识别数据的稳定趋势

    R语言ggplot2可视化时间序列数据并添加稳定趋势线识别数据的稳定趋势 目录 R语言ggplot2可视化时间序列数据并添

  9. R语言ggplot2可视化时间序列数据:ggplot2可视化在时间轴上添加按月的箱图(boxplot)

    R语言ggplot2可视化时间序列数据:ggplot2可视化在时间轴上添加按月的箱图(boxplot) 目录

最新文章

  1. 华裔教授教你写论文2.引言的逻辑解析
  2. 关于linux 内存碎片指数
  3. mqtt 获取所有topic_MQTT协议解析
  4. java 二进制 base64编码_java 按字节读写二进制文件(Base64编码解码)
  5. 这怕是我看过的最好的关于 “ 拜占庭将军问题 ” 的文章
  6. 【转】各种树:trie树、B树、B-树、B+树、B*树
  7. C++语言基础 —— STL —— 容器与迭代器 —— heap
  8. QT_StepByStep(2)--滑动杆的实现
  9. bada 2D游戏编程之一——图形绘制
  10. 海归|94年的高校女博导,自曝曾两次想退学,如今获国家60万资助!
  11. Segment Routing MPLS介绍
  12. 2021年高处作业安装拆除维护证考试题库解析
  13. 迷茫的青春,迷茫的方向
  14. PS怎么调整字体的行间距
  15. UpdatePanel触发javascript脚本技巧javascript
  16. 基于ssm的网上问卷调查系统的实现与设计
  17. Linux 修改系统时间为东八区时间
  18. 愿岁月不负天地,此生辽阔高远
  19. about ContentProvider
  20. 一文简单理解《Effective Java》建议

热门文章

  1. mysql怎么创建出生日期表_如何在MySQL中从出生日期开始生成数字序列
  2. Unity5.3+ 在UGUI 上使用 粒子特效
  3. 六问禅道5:需求和Bug的区别
  4. iframe标签控制视频大小及自动播放
  5. Google巧妙发布Sky星空地图
  6. 正大期货:期货交易常用的软件
  7. GVM-11 centos8 源码安装指南(OpenVas)
  8. 计算机网络——哈工大李全龙
  9. 疫情之下,普通人高薪就业指南:学软件测试,路就不会遥远
  10. (转)如何成为一名优秀的程序员?