本节，介绍一下箱线图实现显著性添加的方法，类似这种：

单因素二水平T检验箱线图可视化

单因素三水平T检验箱线图可视化

单因素三水平柱形图

单因素三水平折线图

二因素柱形图

二因素折线图

1. 单因素二水平

这种试验，比如有两个品种，株高的差异，每个品种调查了10株，就构成了这样的试验数据。

模拟数据：

set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 15
dd = data.frame(Group = rep(c("A","B"),each=10),y = c(y1,y2))
dd
str(dd)
dd$Group = as.factor(dd$Group)

数据：

> ddGroup         y
1      A  4.439524
2      A  4.769823
3      A  6.558708
4      A  5.070508
5      A  5.129288
6      A  6.715065
7      A  5.460916
8      A  3.734939
9      A  4.313147
10     A  4.554338
11     B 16.224082
12     B 15.359814
13     B 15.400771
14     B 15.110683
15     B 14.444159
16     B 16.786913
17     B 15.497850
18     B 13.033383
19     B 15.701356
20     B 14.527209

这里，使用的是ggpubr包进行绘图：

1.1 绘制箱线图

library(ggplot2)
library(ggpubr)
ggboxplot(dd,x = "Group",y = "y")

1.2 箱线图添加不同颜色

ggboxplot(dd,x = "Group",y = "y",color = "Group")

1.3 箱线图添加散点图

ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter")

1.4 箱线图+散点图+显著性水平

这里，默认的统计方法是非参数统计Wilcoxon，如果想用t.test，见下面操作

ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means()

1.5 用`t.test`作为统计方法


ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means(method = "t.test")

1.6 直接输出显著性


ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means(method = "t.test",label = "p.signif")

2. 单因素三水平

二个水平可以用T检验，三个水平或者多个水平的数据，如何检验呢？

模拟数据：

# 构建三个水平 ANOVA
set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 15
y3 = rnorm(10) + 15dd = data.frame(Group = rep(c("A","B","C"),each=10),y = c(y1,y2,y3))
dd
str(dd)
dd$Group = as.factor(dd$Group)

数据如下：

> ddGroup         y
1      A  4.439524
2      A  4.769823
3      A  6.558708
4      A  5.070508
5      A  5.129288
6      A  6.715065
7      A  5.460916
8      A  3.734939
9      A  4.313147
10     A  4.554338
11     B 16.224082
12     B 15.359814
13     B 15.400771
14     B 15.110683
15     B 14.444159
16     B 16.786913
17     B 15.497850
18     B 13.033383
19     B 15.701356
20     B 14.527209
21     C 13.932176
22     C 14.782025
23     C 13.973996
24     C 14.271109
25     C 14.374961
26     C 13.313307
27     C 15.837787
28     C 15.153373
29     C 13.861863
30     C 16.253815

2.1 箱线图+散点图

p = ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter")
p

2.2 箱线图+散点图+显著性

p + stat_compare_means(method = "anova")

2.3 两两之间显著性绘制

my_comparisons = list( c("A", "B"), c("A", "C"), c("B", "C") )
p + stat_compare_means(comparisons = my_comparisons,# label = "p.signif",method = "t.test")

2.4 显示显著性

p + stat_compare_means(comparisons = my_comparisons,label = "p.signif",method = "t.test")

3. 两因素数据

模拟数据：

# 两个因素的数据
set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 8
y3 = rnorm(10) + 7
y4 = rnorm(10) + 15
y5 = rnorm(10) + 18
y6 = rnorm(10) + 17dd = data.frame(Group1 = rep(c("A","B","C"),each=10),Group2 = rep(c("X","Y"),each=30),y = c(y1,y2,y3,y4,y5,y6))
dd
str(dd)
dd$Group1 = as.factor(dd$Group1)
dd$Group2 = as.factor(dd$Group2)
str(dd)

数据预览：

> ddGroup1 Group2         y
1       A      X  4.439524
2       A      X  4.769823
3       A      X  6.558708
4       A      X  5.070508
5       A      X  5.129288
6       A      X  6.715065
7       A      X  5.460916
8       A      X  3.734939
9       A      X  4.313147
10      A      X  4.554338
11      B      X  9.224082
12      B      X  8.359814
13      B      X  8.400771
14      B      X  8.110683
15      B      X  7.444159
16      B      X  9.786913
17      B      X  8.497850
18      B      X  6.033383
19      B      X  8.701356
20      B      X  7.527209
21      C      X  5.932176
22      C      X  6.782025
23      C      X  5.973996
24      C      X  6.271109
25      C      X  6.374961
26      C      X  5.313307
27      C      X  7.837787
28      C      X  7.153373
29      C      X  5.861863
30      C      X  8.253815
31      A      Y 15.426464
32      A      Y 14.704929
33      A      Y 15.895126
34      A      Y 15.878133
35      A      Y 15.821581
36      A      Y 15.688640
37      A      Y 15.553918
38      A      Y 14.938088
39      A      Y 14.694037
40      A      Y 14.619529
41      B      Y 17.305293
42      B      Y 17.792083
43      B      Y 16.734604
44      B      Y 20.168956
45      B      Y 19.207962
46      B      Y 16.876891
47      B      Y 17.597115
48      B      Y 17.533345
49      B      Y 18.779965
50      B      Y 17.916631
51      C      Y 17.253319
52      C      Y 16.971453
53      C      Y 16.957130
54      C      Y 18.368602
55      C      Y 16.774229
56      C      Y 18.516471
57      C      Y 15.451247
58      C      Y 17.584614
59      C      Y 17.123854
60      C      Y 17.215942

3.1 绘制分组箱线图

p = ggboxplot(dd,x = "Group1",y="y",color = "Group2",add = "jitter")
p

3.2 增加P值

p + stat_compare_means(aes(group = Group2),method = "t.test")

3.3 修改为显著性结果

p + stat_compare_means(aes(group = Group2),method = "t.test",label = "p.signif")

3.4 将分组数据分开绘制

p = ggboxplot(dd,x = "Group2",y="y",color = "Group1",add = "jitter",facet.by = "Group1")
p

3.5 分组显示统计检验

p + stat_compare_means(method = "t.test")

3.6 分组显示显著性结果

p + stat_compare_means(method = "t.test",label = "p.signif",label.y = 17)

4. 单因素直方图绘制

直方图+标准误，之前用ggplot2需要很长的代码，这里有更好的方案。

4.1 直方图+标准误

p = ggbarplot(dd,x = "Group1",y = "y",add = "mean_se",color = "Group1")
p

4.2 直方图+标准误+显著性

p + stat_compare_means(method = "anova",,label.y = 15)+ stat_compare_means(comparisons = my_comparisons)

5. 单因素折线图绘制

5.1 折线图+标准误

p = ggline(dd,x = "Group1",y = "y",add = "mean_se")
p

5.2 折线图+标准误+显著性

p + stat_compare_means(method = "anova",,label.y = 15)+ stat_compare_means(comparisons = my_comparisons)

6. 二因素直方图绘制

6.1 直方图+标准误

p = ggbarplot(dd,x = "Group1",y = "y",add = "mean_se",color = "Group2", position = position_dodge(0.8))
p

6.2 直方图+标准误+显著性

p + stat_compare_means(aes(group=Group2), label = "p.signif")

7. 二因素折线图绘制

7.1 折线图+标准误

p = ggline(dd,x = "Group1",y = "y",add = "mean_se",color = "Group2", position = position_dodge(0.8))
p

7.2 折线图+标准误+显著性

p + stat_compare_means(aes(group=Group2), label = "p.signif")

8. 代码汇总


# > 欢迎关注我的公众号：`育种数据分析之放飞自我`。主要分享R语言，Python，育种数据分析，生物统计，数量遗传学，混合线性模型，GWAS和GS相关的知识。# 构建两个水平 T-test
set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 15
dd = data.frame(Group = rep(c("A","B"),each=10),y = c(y1,y2))
dd
str(dd)
dd$Group = as.factor(dd$Group)library(ggplot2)
library(ggpubr)
ggboxplot(dd,x = "Group",y = "y")
ggboxplot(dd,x = "Group",y = "y",color = "Group")
ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter")
ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means()ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means(method = "t.test")ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter") + stat_compare_means(method = "t.test",label = "p.signif")# 构建三个水平 ANOVA
set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 15
y3 = rnorm(10) + 15dd = data.frame(Group = rep(c("A","B","C"),each=10),y = c(y1,y2,y3))
dd
str(dd)
dd$Group = as.factor(dd$Group)p = ggboxplot(dd,x = "Group",y = "y",color = "Group",add = "jitter")
p
p + stat_compare_means(method = "anova")# Perorm pairwise comparisons
# compare_means(y ~ Group,  data = dd,method = "anova")my_comparisons = list( c("A", "B"), c("A", "C"), c("B", "C") )
p + stat_compare_means(comparisons = my_comparisons,# label = "p.signif",method = "t.test")p + stat_compare_means(comparisons = my_comparisons,label = "p.signif",method = "t.test")# 两个因素的数据
set.seed(123)
y1 = rnorm(10) + 5
y2 = rnorm(10) + 8
y3 = rnorm(10) + 7
y4 = rnorm(10) + 15
y5 = rnorm(10) + 18
y6 = rnorm(10) + 17dd = data.frame(Group1 = rep(c("A","B","C"),each=10),Group2 = rep(c("X","Y"),each=30),y = c(y1,y2,y3,y4,y5,y6))
dd
str(dd)
dd$Group1 = as.factor(dd$Group1)
dd$Group2 = as.factor(dd$Group2)
str(dd)## 分组查看
p = ggboxplot(dd,x = "Group1",y="y",color = "Group2",add = "jitter")
p
p + stat_compare_means(aes(group = Group2),method = "t.test")
p + stat_compare_means(aes(group = Group2),method = "t.test",label = "p.signif")## 分组查看
p = ggboxplot(dd,x = "Group2",y="y",color = "Group1",add = "jitter",facet.by = "Group1")
p
p + stat_compare_means(method = "t.test")
p + stat_compare_means(method = "t.test",label = "p.signif",label.y = 17)# 单分组
# 三水平直方图
p = ggbarplot(dd,x = "Group1",y = "y",add = "mean_se",color = "Group1")
p
p + stat_compare_means(method = "anova",,label.y = 15)+ stat_compare_means(comparisons = my_comparisons)# 有误差的折线图
p = ggline(dd,x = "Group1",y = "y",add = "mean_se")
p
p + stat_compare_means(method = "anova",,label.y = 15)+ stat_compare_means(comparisons = my_comparisons)# 二分组
p = ggbarplot(dd,x = "Group1",y = "y",add = "mean_se",color = "Group2", position = position_dodge(0.8))
p
p + stat_compare_means(aes(group=Group2), label = "p.signif")# 有误差的折线图
p = ggline(dd,x = "Group1",y = "y",add = "mean_se",color = "Group2", position = position_dodge(0.8))
p
p + stat_compare_means(aes(group=Group2), label = "p.signif")

欢迎关注我的公众号：育种数据分析之放飞自我。主要分享R语言，Python，育种数据分析，生物统计，数量遗传学，混合线性模型，GWAS和GS相关的知识。

R语言箱线图添加显著性--不同水平实现方法相关推荐

R语言绘制线图（line）实战
R语言绘制线图(line)实战目录 R语言绘制线图(line)实战 #仿真数据 #基础线图
R 学习 - 箱线图
箱线图箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图.在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的好处和一个在线绘制箱线图的工具.就这样都 ...
R语言箱型图 boxplot
boxplot简介 boxplot称为箱型图,又叫做盒状图,胡须图.是用来表示数值类型数据分布状况的统计图.它能显示出一组数据的最大值.最小值.中位数.及上下四分位数. 四分位数百度百科第一四分位数 ...
R语言学习 - 热图简化
前面推出过热图绘制和热图美化,现在来一个函数绘制热图的简化方式.文后更有不用写代码的在线工具可用. R语言 - 基础概念和矩阵操作 R语言 - 热图简化 R语言 - 热图绘制 (heatmap) R语 ...
R语言学习 - 热图美化（数值标准化和调整坐标轴顺序）
生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...
R语言基础图形绘制——箱线图
R语言绘制箱线图简介 1. 基础函数-`boxplot()` 2. `ggplot()`函数简介箱线图主要是通过四分位数描述数据分布,通过最大值,上四分位数,中位数,下四分位数,最小值五处位置描 ...
R语言数据可视化-箱线图
一.概述箱线图(bar plot)又叫箱须图(box-whisker plot)在医学科技论文中经常有用到,用于展示数据的大致分布特征,也用于探索异常值和离群点.平行排列的箱线图可以用于比较在某个分 ...
R 多变量数据预处理_R语言数据可视化之数据分布图（直方图、密度曲线、箱线图、等高线、2D密度图）...
作者:穆晨来源:https://www.cnblogs.com/muchen/p/5310732.html 阅读目录数据分布图简介绘制基本直方图基于分组的直方图绘制密度曲线绘制基本箱线图 ...
R语言数据可视化之数据分布图（直方图、密度曲线、箱线图、等高线、2D密度图）...
作者:穆晨来源:https://www.cnblogs.com/muchen/p/5310732.html 阅读目录数据分布图简介绘制基本直方图基于分组的直方图绘制密度曲线绘制基本箱线图 ...

R语言箱线图添加显著性--不同水平实现方法

1. 单因素二水平

1.1 绘制箱线图

1.2 箱线图添加不同颜色

1.3 箱线图添加散点图

1.4 箱线图+散点图+显著性水平

1.5 用`t.test`作为统计方法

1.6 直接输出显著性

2. 单因素三水平

2.1 箱线图+散点图

2.2 箱线图+散点图+显著性

2.3 两两之间显著性绘制

2.4 显示显著性

3. 两因素数据

3.1 绘制分组箱线图

3.2 增加P值

3.3 修改为显著性结果

3.4 将分组数据分开绘制

3.5 分组显示统计检验

3.6 分组显示显著性结果

4. 单因素直方图绘制

4.1 直方图+标准误

4.2 直方图+标准误+显著性

5. 单因素折线图绘制

5.1 折线图+标准误

5.2 折线图+标准误+显著性

6. 二因素直方图绘制

6.1 直方图+标准误

6.2 直方图+标准误+显著性

7. 二因素折线图绘制

7.1 折线图+标准误

7.2 折线图+标准误+显著性

8. 代码汇总

R语言箱线图添加显著性--不同水平实现方法相关推荐

最新文章

热门文章

R语言箱线图添加显著性--不同水平实现方法

1. 单因素二水平

1.1 绘制箱线图

1.2 箱线图添加不同颜色

1.3 箱线图添加散点图

1.4 箱线图+散点图+显著性水平

1.5 用t.test作为统计方法

1.6 直接输出显著性

2. 单因素三水平

2.1 箱线图+散点图

2.2 箱线图+散点图+显著性

2.3 两两之间显著性绘制

2.4 显示显著性

3. 两因素数据

3.1 绘制分组箱线图

3.2 增加P值

3.3 修改为显著性结果

3.4 将分组数据分开绘制

3.5 分组显示统计检验

3.6 分组显示显著性结果

4. 单因素直方图绘制

4.1 直方图+标准误

4.2 直方图+标准误+显著性

5. 单因素折线图绘制

5.1 折线图+标准误

5.2 折线图+标准误+显著性

6. 二因素直方图绘制

6.1 直方图+标准误

6.2 直方图+标准误+显著性

7. 二因素折线图绘制

7.1 折线图+标准误

7.2 折线图+标准误+显著性

8. 代码汇总

R语言箱线图添加显著性--不同水平实现方法相关推荐

最新文章

热门文章

1.5 用`t.test`作为统计方法