一、概述

箱线图(bar plot)又叫箱须图(box-whisker plot)在医学科技论文中经常有用到,用于展示数据的大致分布特征,也用于探索异常值和离群点。平行排列的箱线图可以用于比较在某个分类变量各个类别下某指标的分布。R语言使用函数 barplot() 创建箱线图。

二、数据集

下面我将以R语言自带的anorexia数据集为例介绍函数barplot()的用法。该数据集来自于一项关于不同治疗方式下体重变化的临床试验研究。其中的反应变量wt.change记录了每位接受Cont、CBT和FT治疗方式下的治疗效果。

> anorexiaTreat Prewt Postwt wt.change
1   Cont  80.7   80.2      -0.5
2   Cont  89.4   80.1      -9.3
3   Cont  91.8   86.4      -5.4
4   Cont  74.0   86.3      12.3
5   Cont  78.1   76.1      -2.0
6   Cont  88.3   78.1     -10.2
7   Cont  87.3   75.1     -12.2
8   Cont  75.1   86.7      11.6
9   Cont  80.6   73.5      -7.1
10  Cont  78.4   84.6       6.2
11  Cont  77.6   77.4      -0.2
12  Cont  88.7   79.5      -9.2
13  Cont  81.3   89.6       8.3
14  Cont  78.1   81.4       3.3
15  Cont  70.5   81.8      11.3
16  Cont  77.3   77.3       0.0
17  Cont  85.2   84.2      -1.0
18  Cont  86.0   75.4     -10.6
19  Cont  84.1   79.5      -4.6
20  Cont  79.7   73.0      -6.7
21  Cont  85.5   88.3       2.8
22  Cont  84.4   84.7       0.3
23  Cont  79.6   81.4       1.8
24  Cont  77.5   81.2       3.7
25  Cont  72.3   88.2      15.9
26  Cont  89.0   78.8     -10.2
27   CBT  80.5   82.2       1.7
28   CBT  84.9   85.6       0.7
29   CBT  81.5   81.4      -0.1
30   CBT  82.6   81.9      -0.7
31   CBT  79.9   76.4      -3.5
32   CBT  88.7  103.6      14.9
33   CBT  94.9   98.4       3.5
34   CBT  76.3   93.4      17.1
35   CBT  81.0   73.4      -7.6
36   CBT  80.5   82.1       1.6
37   CBT  85.0   96.7      11.7
38   CBT  89.2   95.3       6.1
39   CBT  81.3   82.4       1.1
40   CBT  76.5   72.5      -4.0
41   CBT  70.0   90.9      20.9
42   CBT  80.4   71.3      -9.1
43   CBT  83.3   85.4       2.1
44   CBT  83.0   81.6      -1.4
45   CBT  87.7   89.1       1.4
46   CBT  84.2   83.9      -0.3
47   CBT  86.4   82.7      -3.7
48   CBT  76.5   75.7      -0.8
49   CBT  80.2   82.6       2.4
50   CBT  87.8  100.4      12.6
51   CBT  83.3   85.2       1.9
52   CBT  79.7   83.6       3.9
53   CBT  84.5   84.6       0.1
54   CBT  80.8   96.2      15.4
55   CBT  87.4   86.7      -0.7
56    FT  83.8   95.2      11.4
57    FT  83.3   94.3      11.0
58    FT  86.0   91.5       5.5
59    FT  82.5   91.9       9.4
60    FT  86.7  100.3      13.6
61    FT  79.6   76.7      -2.9
62    FT  76.9   76.8      -0.1
63    FT  94.2  101.6       7.4
64    FT  73.4   94.9      21.5
65    FT  80.5   75.2      -5.3
66    FT  81.6   77.8      -3.8
67    FT  82.1   95.5      13.4
68    FT  77.6   90.7      13.1
69    FT  83.5   92.5       9.0
70    FT  89.9   93.8       3.9
71    FT  86.0   91.7       5.7
72    FT  87.3   98.0      10.7
> attach(anorexia)
> counts <- table(Treat)
> counts
TreatCBT Cont   FT 29   26   17

三、基本语法

在 R 语言中创建条形图的基本语法是

## 分类s3方法
boxplot(formula, data = NULL, ..., subset, na.action = NULL,xlab = mklab(y_var = horizontal),ylab = mklab(y_var =!horizontal),add = FALSE, ann = !add, horizontal = FALSE,drop = FALSE, sep = ".", lex.order = FALSE)## 默认 S3 方法:
boxplot(x, ..., range = 1.5, width = NULL, varwidth = FALSE,notch = FALSE, outline = TRUE, names, plot = TRUE,border = par("fg"), col = "lightgray", log = "",pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5),ann = !add, horizontal = FALSE, add = FALSE, at = NULL)

以下是所使用的参数的描述 -

  • formula 一个公式,例如y ~ grp,其中是要根据分组变量(通常是一个因子)y分成组的数据值的数值向量。grp注意 ~ g1 + g2相当于g1:g2
  • data 数据集
  • subset 一个可选向量,指定要用于绘图的观察子集
  • na.action NA一个函数,它指示当数据包含s时应该发生什么。默认是忽略响应或组中的缺失值
  • xlab 是 x 轴的标签。
  • ylab 是 y 轴的标签。
  • ann logical指示是否应注释轴(通过 xlab和ylab)。
  • drop, sep, lex.order 传递给split.default,看那里。
  • x 用于指定生成箱线图的数据。数值向量或包含此类向量的单个列表。其他未命名的参数将进一步的数据指定为单独的向量(每个对应于一个组件箱线图)。 NAs 在数据中是允许的。
  • … 对于formula方法,命名参数被传递给默认方法。对于默认方法,未命名的参数是附加的数据向量(除非x它们被忽略时是一个列表),而命名的参数是除了参数给定的参数和图形 参数之外要传递给的参数和图形参数(并覆盖 中的那些)。请注意, 可能会或可能不会使用它传递的图形参数:请参阅其文档。 bxpparsparsbxp
  • range 这决定了绘图胡须从盒子伸出多远。如果range为正,则晶须延伸到最极端的数据点,该数据点不超过 range框的四分位间距的倍数。零值会导致晶须延伸到数据极值。
  • width 一个向量,给出了组成图的框的相对宽度。
  • varwidth 如果varwidth是TRUE,则绘制框的宽度与组中观察数的平方根成正比。
  • notch 如果notch是TRUE,则在框的每一侧绘制一个凹口。如果两个图的缺口不重叠,这是两个中位数不同的“有力证据”(Chambers等,1983,第 62 页)。有关boxplot.stats 使用的计算,请参阅。
  • outline 如果outline不正确,则不绘制异常值(作为点,而 S+ 使用线)。
  • names 将在每个箱线图下打印的组标签。可以是字符向量或表达式(请参阅 plotmath)。
  • boxwex 要应用于所有框的比例因子。当只有几个组时,可以通过使框变窄来改善情节的外观。
  • staplewex 装订线宽度扩展,与框宽度成正比。
  • outwex 离群值线宽扩展,与框宽成正比。
  • plot 如果TRUE(默认)然后生成箱线图。如果不是,则返回箱线图所基于的摘要。
  • border 箱线图轮廓的可选颜色向量。border如果 的长度border小于图的数量,则回收中的值。
  • col 如果col为非空,则假定包含用于为箱线图的主体着色的颜色。默认情况下,它们是背景颜色。
  • log 指示是否应以对数比例绘制 x 或 y 或两个坐标的字符。
  • pars (可能很多)更多图形参数的列表,例如,boxwex或outpch;这些被传递给 bxp(如果plot为真);有关详细信息,请参见那里。
  • horizontal 逻辑指示箱线图是否应该是水平的;默认FALSE表示垂直框。
  • add 合乎逻辑,如果为真,则将箱线图添加到当前图。
  • at 给出箱线图绘制位置的数值向量,特别是在add = TRUE; 默认为1:nwheren是框的数量

1. 普通箱线图

boxplot(wt.change~Treat,data=anorexia,ylab="体重变化(lbs)",xlab="治疗方式",las =1)

2. 含凹槽箱线图

> boxplot(wt.change~Treat,notch=TRUE,data=anorexia,ylab="体重变化(lbs)",xlab="治疗方式",las =1)
Warning message:
In (function (z, notch = FALSE, width = NULL, varwidth = FALSE,  :some notches went outside hinges ('box'): maybe set notch=FALSE

3. 横向箱线图

> boxplot(wt.change~Treat,varwidth=TRUE,data=anorexia,xlab="体重变化(lbs)",ylab="治疗方式",las =1,col = c("red","yellow","green"),horizontal=T)
>

R语言数据可视化-箱线图相关推荐

  1. R语言ggplot2可视化绘制线图(line plot)、使用gghighlight包突出高亮满足条件的线图、并保留其它线图的色彩(而不是灰色)自定义非高亮线图的透明度

    R语言ggplot2可视化绘制线图(line plot).使用gghighlight包突出高亮满足条件的线图.并保留其它线图的色彩(而不是灰色)自定义非高亮线图的透明度 目录

  2. R语言ggplot2可视化绘制线图(line plot)、使用gghighlight包突出高亮线图的满足条件的线图、设置高亮线图不显示默认自动显示的文本标签(use_direct_label)

    R语言ggplot2可视化绘制线图(line plot).使用gghighlight包突出高亮线图的满足条件的线图.设置高亮线图不显示默认自动显示的文本标签(use_direct_label = FA ...

  3. r语言echarts画箱线图_R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)

    箱线图 箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图.在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的好处和一个在线绘制箱线图的工具.就这样都 ...

  4. r语言echarts画箱线图_echarts学习笔记之箱线图的分析与绘制详解

    一.箱线图 box-plot 箱线图(boxplot)也称箱须图(box-whisker plot),它是用一组数据中的最小值.第一四分位数.中位数.第三四分位数和最大值来反映数据分布的中心位置和散布 ...

  5. r语言echarts画箱线图_echarter: Echarts的R语言接口

    echarter是ECharts 4的R语言接口, 详细说明文档和案例请查看echarter . 简介 我之前一直使用highcharter做交互式数据可视化,因为工作的需要开始使用echarts,期 ...

  6. R语言数据可视化之折线图、堆积图、堆积面积图

    折线图简介 折线图通常用来对两个连续变量的依存关系进行可视化,其中横轴很多时候是时间轴. 但横轴也不一定是连续型变量,可以是有序的离散型变量. 绘制基本折线图 本例选用如下测试数据集: 绘制方法是首先 ...

  7. r语言echarts画箱线图_R语言之数据可视化---交互式图表recharts

    环图 一.安装方式: if (!require(devtools)) library(devtools) install_github("madlogos/recharts") 二 ...

  8. r语言liftchart_最棒的7种R语言数据可视化

    随着数据量不断增加,抛开可视化技术讲故事是不可能的.数据可视化是一门将数字转化为有用知识的艺术. R语言编程提供一套建立可视化和展现数据的内置函数和库,让你学习这门艺术.在可视化的技术实现之前,让我们 ...

  9. R语言ggplot2可视化箱图、配置抖动数据点(jitter points)避免数据点互相覆盖、并使用线条(line)连接两个箱图中不同分组成对的数据点(jitter on Boxplots)

    R语言ggplot2可视化箱图.配置抖动数据点(jitter points)避免数据点互相覆盖.并使用线条(line)连接两个箱图中不同分组成对的数据点(Connecting Paired Point ...

最新文章

  1. 【Flask】视图高级
  2. windows下安装redis以及一些常规操作
  3. django ForeignKey的使用
  4. 两种实现大图内容平移效果的方法
  5. 基于PSR-0编码规范开发一套PHP-MVC框架(二)
  6. 读书:梭罗的《瓦尔登湖》
  7. Centos中yum方式安装java
  8. 趣学python编程教孩子学编程_趣学Python——教孩子学编程
  9. Web Polygraph (WebAxe-4) 测试反向代理缓存服务器
  10. 量化基金投资常用策略简介
  11. 删除设备和驱动器下图标
  12. 断背山 - 剧情花絮 - 电影 - 风行
  13. 焦虑症是精神病吗?缓解焦虑症的方法有哪些
  14. C++入门教程(四十二):函数参数使用引用
  15. 聚类之高斯混合模型(Gaussian Mixture Model)
  16. java生成word带多级标题,word2007中多级标题的设置和目录的自动生成 | 学步园
  17. 不跳舞的人羡慕吧?scratch(图形化编程工具)使用点阵绘制跳舞的人!
  18. 什么是反射机制?反射的作用。
  19. 百度云高速下载器 kinhdown
  20. Excel输出随机小数的方法

热门文章

  1. 如何UNI-APP中使用iconfont彩色图标
  2. 谷歌表格图表 横坐标 滚动_如何将图表从Google表格同步到文档或幻灯片
  3. qq机器人插件之奥运奖牌获得数量
  4. 如何在WindowsXP中发短信
  5. AppStore 技术服务支持
  6. 你知道数据分析报告应该如何写吗?
  7. 超详细的gnuplot使用教程【2】
  8. 智安网络丨网络架构,是数据中心的“神经脉络”
  9. 【空间统计之六】点数据集方向分布统计(标准差椭圆)
  10. 钟汉良日记:改变心态了,回武平待3年