文章目录

写在前面
独立性检验
- χ2\chi^2χ2独立性检验
- Fisher独立性检验
- Cochran-Mantel-Haenszel χ2\chi^2χ2独立性检验
相关性分析
相关性检验
- 相关性检验
- 偏相关检验
- 分组数据的相关性检验
- - 两组数据
  - 多组数据
图形表示
- 轮廓图
- 星图(雷达图、蜘蛛图)
- 调和曲线图

写在前面

总结学习R语言的笔记，这次的主要学习内容是：多元数据的数据特征、独立性检验、相关分析、相关性检验与图形表示。由于使用R Markdown编写，所以在导出为.md文件时直接将运行结果也导出了，显得有点不美观，见谅。

独立性检验

原假设：未发生；
备择假设：发生了。

p-value大于0.050.050.05则不拒绝原假设，认为两变量不具有相关关系；

p-value小于0.050.050.05则拒绝原假设，认为两变量具有相关关系。

数值设置不绝对，也可选取KaTeX parse error: Undefined control sequence: \mbox at position 5: 0.01\̲m̲b̲o̲x̲{或者}0.1，要根据具体数据的精度来进行调整。

χ2\chi^2χ2独立性检验

使用chisq.test()函数进行χ2\chi^2χ2独立性检验：
(交换两变量的顺序，结果不变)

# 加载数据包
library(vcd)

## Loading required package: grid

mytable <- table(Arthritis$Treatment, Arthritis$Improved)
# 进行卡方独立性检验(p-value小于0.05，具有相关关系)
chisq.test(mytable)

##
##  Pearson's Chi-squared test
##
## data:  mytable
## X-squared = 13.055, df = 2, p-value = 0.001463

mytable <- table(Arthritis$Improved, Arthritis$Sex)
# 进行卡方独立性检验(p-value大于0.05，不具有相关关系)
chisq.test(mytable)

##
##  Pearson's Chi-squared test
##
## data:  mytable
## X-squared = 4.8407, df = 2, p-value = 0.08889

Fisher独立性检验

使用fisherq.test()函数进行FisherFisherFisher独立性检验：
(交换两变量的顺序，结果不变)

# 加载数据包
library(vcd)
mytable <- table(Arthritis$Treatment, Arthritis$Improved)
# 进行Fisher独立性检验
fisher.test(mytable)

##
##  Fisher's Exact Test for Count Data
##
## data:  mytable
## p-value = 0.001393
## alternative hypothesis: two.sided

mytable <- table(Arthritis$Sex, Arthritis$Improved)
# 进行Fisher独立性检验
fisher.test(mytable)

##
##  Fisher's Exact Test for Count Data
##
## data:  mytable
## p-value = 0.1094
## alternative hypothesis: two.sided

Cochran-Mantel-Haenszel χ2\chi^2χ2独立性检验

使用mantelhaen.test()函数进行Cochran-Mantel-Haenszel χ2\chi^2χ2独立性检验：
(变量的顺序会影响p-value的值)

# 加载数据包
library(vcd)
# 三个变量列联表
mytable <- xtabs(~Treatment+Improved+Sex, data = Arthritis)
# 三个变量进行Cochran-Mantel-Haenszel 卡方独立性检验
mantelhaen.test(mytable)

##
##  Cochran-Mantel-Haenszel test
##
## data:  mytable
## Cochran-Mantel-Haenszel M^2 = 14.632, df = 2, p-value = 0.0006647

mytable <- xtabs(~Treatment+Sex+Improved, data = Arthritis)
# 三个变量进行Cochran-Mantel-Haenszel 卡方独立性检验
mantelhaen.test(mytable)

##
##  Mantel-Haenszel chi-squared test with continuity correction
##
## data:  mytable
## Mantel-Haenszel X-squared = 2.0863, df = 1, p-value = 0.1486
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.8566711 8.0070521
## sample estimates:
## common odds ratio
##          2.619048

相关性分析

指对两个或多个具备相关性的变量元素进行分析，从而衡量两个变量因素的相关密切程度。

包括：Pearson相关系数、Spearman相关系数、Kendall相关系数等。

# 使用state.x77数据集，推测谋杀率与哪些因素有关
state.x77

##                Population Income Illiteracy Life Exp Murder HS Grad Frost
## Alabama              3615   3624        2.1    69.05   15.1    41.3    20
## Alaska                365   6315        1.5    69.31   11.3    66.7   152
## Arizona              2212   4530        1.8    70.55    7.8    58.1    15
## Arkansas             2110   3378        1.9    70.66   10.1    39.9    65
## California          21198   5114        1.1    71.71   10.3    62.6    20
## Colorado             2541   4884        0.7    72.06    6.8    63.9   166
## Connecticut          3100   5348        1.1    72.48    3.1    56.0   139
## Delaware              579   4809        0.9    70.06    6.2    54.6   103
## Florida              8277   4815        1.3    70.66   10.7    52.6    11
## Georgia              4931   4091        2.0    68.54   13.9    40.6    60
## Hawaii                868   4963        1.9    73.60    6.2    61.9     0
## Idaho                 813   4119        0.6    71.87    5.3    59.5   126
## Illinois            11197   5107        0.9    70.14   10.3    52.6   127
## Indiana              5313   4458        0.7    70.88    7.1    52.9   122
## Iowa                 2861   4628        0.5    72.56    2.3    59.0   140
## Kansas               2280   4669        0.6    72.58    4.5    59.9   114
## Kentucky             3387   3712        1.6    70.10   10.6    38.5    95
## Louisiana            3806   3545        2.8    68.76   13.2    42.2    12
## Maine                1058   3694        0.7    70.39    2.7    54.7   161
## Maryland             4122   5299        0.9    70.22    8.5    52.3   101
## Massachusetts        5814   4755        1.1    71.83    3.3    58.5   103
## Michigan             9111   4751        0.9    70.63   11.1    52.8   125
## Minnesota            3921   4675        0.6    72.96    2.3    57.6   160
## Mississippi          2341   3098        2.4    68.09   12.5    41.0    50
## Missouri             4767   4254        0.8    70.69    9.3    48.8   108
## Montana               746   4347        0.6    70.56    5.0    59.2   155
## Nebraska             1544   4508        0.6    72.60    2.9    59.3   139
## Nevada                590   5149        0.5    69.03   11.5    65.2   188
## New Hampshire         812   4281        0.7    71.23    3.3    57.6   174
## New Jersey           7333   5237        1.1    70.93    5.2    52.5   115
## New Mexico           1144   3601        2.2    70.32    9.7    55.2   120
## New York            18076   4903        1.4    70.55   10.9    52.7    82
## North Carolina       5441   3875        1.8    69.21   11.1    38.5    80
## North Dakota          637   5087        0.8    72.78    1.4    50.3   186
## Ohio                10735   4561        0.8    70.82    7.4    53.2   124
## Oklahoma             2715   3983        1.1    71.42    6.4    51.6    82
## Oregon               2284   4660        0.6    72.13    4.2    60.0    44
## Pennsylvania        11860   4449        1.0    70.43    6.1    50.2   126
## Rhode Island          931   4558        1.3    71.90    2.4    46.4   127
## South Carolina       2816   3635        2.3    67.96   11.6    37.8    65
## South Dakota          681   4167        0.5    72.08    1.7    53.3   172
## Tennessee            4173   3821        1.7    70.11   11.0    41.8    70
## Texas               12237   4188        2.2    70.90   12.2    47.4    35
## Utah                 1203   4022        0.6    72.90    4.5    67.3   137
## Vermont               472   3907        0.6    71.64    5.5    57.1   168
## Virginia             4981   4701        1.4    70.08    9.5    47.8    85
## Washington           3559   4864        0.6    71.72    4.3    63.5    32
## West Virginia        1799   3617        1.4    69.48    6.7    41.6   100
## Wisconsin            4589   4468        0.7    72.48    3.0    54.5   149
## Wyoming               376   4566        0.6    70.29    6.9    62.9   173
##                  Area
## Alabama         50708
## Alaska         566432
## Arizona        113417
## Arkansas        51945
## California     156361
## Colorado       103766
## Connecticut      4862
## Delaware         1982
## Florida         54090
## Georgia         58073
## Hawaii           6425
## Idaho           82677
## Illinois        55748
## Indiana         36097
## Iowa            55941
## Kansas          81787
## Kentucky        39650
## Louisiana       44930
## Maine           30920
## Maryland         9891
## Massachusetts    7826
## Michigan        56817
## Minnesota       79289
## Mississippi     47296
## Missouri        68995
## Montana        145587
## Nebraska        76483
## Nevada         109889
## New Hampshire    9027
## New Jersey       7521
## New Mexico     121412
## New York        47831
## North Carolina  48798
## North Dakota    69273
## Ohio            40975
## Oklahoma        68782
## Oregon          96184
## Pennsylvania    44966
## Rhode Island     1049
## South Carolina  30225
## South Dakota    75955
## Tennessee       41328
## Texas          262134
## Utah            82096
## Vermont          9267
## Virginia        39780
## Washington      66570
## West Virginia   24070
## Wisconsin       54464
## Wyoming         97203

# 计算相关矩阵（对角矩阵）
cor(state.x77)

##             Population     Income  Illiteracy    Life Exp     Murder
## Population  1.00000000  0.2082276  0.10762237 -0.06805195  0.3436428
## Income      0.20822756  1.0000000 -0.43707519  0.34025534 -0.2300776
## Illiteracy  0.10762237 -0.4370752  1.00000000 -0.58847793  0.7029752
## Life Exp   -0.06805195  0.3402553 -0.58847793  1.00000000 -0.7808458
## Murder      0.34364275 -0.2300776  0.70297520 -0.78084575  1.0000000
## HS Grad    -0.09848975  0.6199323 -0.65718861  0.58221620 -0.4879710
## Frost      -0.33215245  0.2262822 -0.67194697  0.26206801 -0.5388834
## Area        0.02254384  0.3633154  0.07726113 -0.10733194  0.2283902
##                HS Grad      Frost        Area
## Population -0.09848975 -0.3321525  0.02254384
## Income      0.61993232  0.2262822  0.36331544
## Illiteracy -0.65718861 -0.6719470  0.07726113
## Life Exp    0.58221620  0.2620680 -0.10733194
## Murder     -0.48797102 -0.5388834  0.22839021
## HS Grad     1.00000000  0.3667797  0.33354187
## Frost       0.36677970  1.0000000  0.05922910
## Area        0.33354187  0.0592291  1.00000000

# 计算协方差矩阵
cov(state.x77)

##               Population        Income   Illiteracy      Life Exp       Murder
## Population 19931683.7588   571229.7796  292.8679592 -4.078425e+02  5663.523714
## Income       571229.7796   377573.3061 -163.7020408  2.806632e+02  -521.894286
## Illiteracy      292.8680     -163.7020    0.3715306 -4.815122e-01     1.581776
## Life Exp       -407.8425      280.6632   -0.4815122  1.802020e+00    -3.869480
## Murder         5663.5237     -521.8943    1.5817755 -3.869480e+00    13.627465
## HS Grad       -3551.5096     3076.7690   -3.2354694  6.312685e+00   -14.549616
## Frost        -77081.9727     7227.6041  -21.2900000  1.828678e+01  -103.406000
## Area        8587916.9494 19049013.7510 4018.3371429 -1.229410e+04 71940.429959
##                  HS Grad        Frost          Area
## Population  -3551.509551 -77081.97265  8.587917e+06
## Income       3076.768980   7227.60408  1.904901e+07
## Illiteracy     -3.235469    -21.29000  4.018337e+03
## Life Exp        6.312685     18.28678 -1.229410e+04
## Murder        -14.549616   -103.40600  7.194043e+04
## HS Grad        65.237894    153.99216  2.298732e+05
## Frost         153.992163   2702.00857  2.627039e+05
## Area       229873.192816 262703.89306  7.280748e+09

colnames(state.x77)

## [1] "Population" "Income"     "Illiteracy" "Life Exp"   "Murder"
## [6] "HS Grad"    "Frost"      "Area"

x <- state.x77[, c(1, 2, 3, 6)]
y <- state.x77[, c(4, 5)]
head(x)

##            Population Income Illiteracy HS Grad
## Alabama          3615   3624        2.1    41.3
## Alaska            365   6315        1.5    66.7
## Arizona          2212   4530        1.8    58.1
## Arkansas         2110   3378        1.9    39.9
## California      21198   5114        1.1    62.6
## Colorado         2541   4884        0.7    63.9

head(y)

##            Life Exp Murder
## Alabama       69.05   15.1
## Alaska        69.31   11.3
## Arizona       70.55    7.8
## Arkansas      70.66   10.1
## California    71.71   10.3
## Colorado      72.06    6.8

# 计算变量x与y之间的相关性
cor(x, y)

##               Life Exp     Murder
## Population -0.06805195  0.3436428
## Income      0.34025534 -0.2300776
## Illiteracy -0.58847793  0.7029752
## HS Grad     0.58221620 -0.4879710

# 使用ggm外部包中的pcor()函数计算偏相关系数
library(ggm)
colnames(state.x77)

## [1] "Population" "Income"     "Illiteracy" "Life Exp"   "Murder"
## [6] "HS Grad"    "Frost"      "Area"

pcor(c(1, 5, 2, 3), cov(state.x77))

## [1] 0.3621683

相关性检验

使用cor.test()函数进行相关性的检验

cor.test(state.x77[, 3], state.x77[, 5])

##
##  Pearson's product-moment correlation
##
## data:  state.x77[, 3] and state.x77[, 5]
## t = 6.8479, df = 48, p-value = 1.258e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.5279280 0.8207295
## sample estimates:
##       cor
## 0.7029752

# 给出p值、相关系数与置信区间（概率可能发生的范围）

使用psych外部包的corr.test()函数进行多个变量的相关性检验

library(psych)
print(corr.test(state.x77), short = F)

## Call:corr.test(x = state.x77)
## Correlation matrix
##            Population Income Illiteracy Life Exp Murder HS Grad Frost  Area
## Population       1.00   0.21       0.11    -0.07   0.34   -0.10 -0.33  0.02
## Income           0.21   1.00      -0.44     0.34  -0.23    0.62  0.23  0.36
## Illiteracy       0.11  -0.44       1.00    -0.59   0.70   -0.66 -0.67  0.08
## Life Exp        -0.07   0.34      -0.59     1.00  -0.78    0.58  0.26 -0.11
## Murder           0.34  -0.23       0.70    -0.78   1.00   -0.49 -0.54  0.23
## HS Grad         -0.10   0.62      -0.66     0.58  -0.49    1.00  0.37  0.33
## Frost           -0.33   0.23      -0.67     0.26  -0.54    0.37  1.00  0.06
## Area             0.02   0.36       0.08    -0.11   0.23    0.33  0.06  1.00
## Sample Size
## [1] 50
## Probability values (Entries above the diagonal are adjusted for multiple tests.)
##            Population Income Illiteracy Life Exp Murder HS Grad Frost Area
## Population       0.00   1.00       1.00     1.00   0.23    1.00  0.25 1.00
## Income           0.15   0.00       0.03     0.23   1.00    0.00  1.00 0.16
## Illiteracy       0.46   0.00       0.00     0.00   0.00    0.00  0.00 1.00
## Life Exp         0.64   0.02       0.00     0.00   0.00    0.00  0.79 1.00
## Murder           0.01   0.11       0.00     0.00   0.00    0.01  0.00 1.00
## HS Grad          0.50   0.00       0.00     0.00   0.00    0.00  0.16 0.25
## Frost            0.02   0.11       0.00     0.07   0.00    0.01  0.00 1.00
## Area             0.88   0.01       0.59     0.46   0.11    0.02  0.68 0.00
##
##  Confidence intervals based upon normal theory.  To get bootstrapped values, try cor.ci
##             raw.lower raw.r raw.upper raw.p lower.adj upper.adj
## Ppltn-Incom     -0.07  0.21      0.46  0.15     -0.19      0.54
## Ppltn-Illtr     -0.18  0.11      0.37  0.46     -0.28      0.46
## Ppltn-LfExp     -0.34 -0.07      0.21  0.64     -0.39      0.27
## Ppltn-Murdr      0.07  0.34      0.57  0.01     -0.07      0.66
## Ppltn-HSGrd     -0.37 -0.10      0.18  0.50     -0.44      0.27
## Ppltn-Frost     -0.56 -0.33     -0.06  0.02     -0.65      0.08
## Ppltn-Area      -0.26  0.02      0.30  0.88     -0.26      0.30
## Incom-Illtr     -0.64 -0.44     -0.18  0.00     -0.72     -0.03
## Incom-LfExp      0.07  0.34      0.57  0.02     -0.07      0.65
## Incom-Murdr     -0.48 -0.23      0.05  0.11     -0.57      0.18
## Incom-HSGrd      0.41  0.62      0.77  0.00      0.27      0.83
## Incom-Frost     -0.06  0.23      0.47  0.11     -0.17      0.56
## Incom-Area       0.09  0.36      0.58  0.01     -0.05      0.67
## Illtr-LfExp     -0.74 -0.59     -0.37  0.00     -0.81     -0.22
## Illtr-Murdr      0.53  0.70      0.82  0.00      0.40      0.87
## Illtr-HSGrd     -0.79 -0.66     -0.46  0.00     -0.85     -0.32
## Illtr-Frost     -0.80 -0.67     -0.48  0.00     -0.85     -0.35
## Illtr-Area      -0.21  0.08      0.35  0.59     -0.28      0.42
## LfExp-Murdr     -0.87 -0.78     -0.64  0.00     -0.91     -0.53
## LfExp-HSGrd      0.36  0.58      0.74  0.00      0.22      0.80
## LfExp-Frost     -0.02  0.26      0.50  0.07     -0.15      0.60
## LfExp-Area      -0.37 -0.11      0.18  0.46     -0.46      0.27
## Murdr-HSGrd     -0.67 -0.49     -0.24  0.00     -0.75     -0.09
## Murdr-Frost     -0.71 -0.54     -0.31  0.00     -0.78     -0.16
## Murdr-Area      -0.05  0.23      0.48  0.11     -0.18      0.57
## HSGrd-Frost      0.10  0.37      0.59  0.01     -0.05      0.68
## HSGrd-Area       0.06  0.33      0.56  0.02     -0.08      0.65
## Frost-Area      -0.22  0.06      0.33  0.68     -0.26      0.37

偏相关检验

使用ggm外部包中的pcor.test()函数进行偏相关的检验(与pcor()函数对应)

library(ggm)
x <- pcor(c(1, 5, 2, 3, 6), cov(state.x77))
# 需要三个值：`pcor()`函数计算出的偏相关系数，变量个数与样本数
pcor.test(x, 3, n=50) # 输出t检验、自由度和p值

## $tval
## [1] 2.476049
##
## $df
## [1] 45
##
## $pvalue
## [1] 0.01711252

分组数据的相关性检验

两组数据

student-t检验

主要用于样本数较小(<30)、总体标准差未知的数据

# 导入数据集
library(MASS)
UScrime

##      M So  Ed Po1 Po2  LF  M.F Pop  NW  U1 U2 GDP Ineq     Prob    Time    y
## 1  151  1  91  58  56 510  950  33 301 108 41 394  261 0.084602 26.2011  791
## 2  143  0 113 103  95 583 1012  13 102  96 36 557  194 0.029599 25.2999 1635
## 3  142  1  89  45  44 533  969  18 219  94 33 318  250 0.083401 24.3006  578
## 4  136  0 121 149 141 577  994 157  80 102 39 673  167 0.015801 29.9012 1969
## 5  141  0 121 109 101 591  985  18  30  91 20 578  174 0.041399 21.2998 1234
## 6  121  0 110 118 115 547  964  25  44  84 29 689  126 0.034201 20.9995  682
## 7  127  1 111  82  79 519  982   4 139  97 38 620  168 0.042100 20.6993  963
## 8  131  1 109 115 109 542  969  50 179  79 35 472  206 0.040099 24.5988 1555
## 9  157  1  90  65  62 553  955  39 286  81 28 421  239 0.071697 29.4001  856
## 10 140  0 118  71  68 632 1029   7  15 100 24 526  174 0.044498 19.5994  705
## 11 124  0 105 121 116 580  966 101 106  77 35 657  170 0.016201 41.6000 1674
## 12 134  0 108  75  71 595  972  47  59  83 31 580  172 0.031201 34.2984  849
## 13 128  0 113  67  60 624  972  28  10  77 25 507  206 0.045302 36.2993  511
## 14 135  0 117  62  61 595  986  22  46  77 27 529  190 0.053200 21.5010  664
## 15 152  1  87  57  53 530  986  30  72  92 43 405  264 0.069100 22.7008  798
## 16 142  1  88  81  77 497  956  33 321 116 47 427  247 0.052099 26.0991  946
## 17 143  0 110  66  63 537  977  10   6 114 35 487  166 0.076299 19.1002  539
## 18 135  1 104 123 115 537  978  31 170  89 34 631  165 0.119804 18.1996  929
## 19 130  0 116 128 128 536  934  51  24  78 34 627  135 0.019099 24.9008  750
## 20 125  0 108 113 105 567  985  78  94 130 58 626  166 0.034801 26.4010 1225
## 21 126  0 108  74  67 602  984  34  12 102 33 557  195 0.022800 37.5998  742
## 22 157  1  89  47  44 512  962  22 423  97 34 288  276 0.089502 37.0994  439
## 23 132  0  96  87  83 564  953  43  92  83 32 513  227 0.030700 25.1989 1216
## 24 131  0 116  78  73 574 1038   7  36 142 42 540  176 0.041598 17.6000  968
## 25 130  0 116  63  57 641  984  14  26  70 21 486  196 0.069197 21.9003  523
## 26 131  0 121 160 143 631 1071   3  77 102 41 674  152 0.041698 22.1005 1993
## 27 135  0 109  69  71 540  965   6   4  80 22 564  139 0.036099 28.4999  342
## 28 152  0 112  82  76 571 1018  10  79 103 28 537  215 0.038201 25.8006 1216
## 29 119  0 107 166 157 521  938 168  89  92 36 637  154 0.023400 36.7009 1043
## 30 166  1  89  58  54 521  973  46 254  72 26 396  237 0.075298 28.3011  696
## 31 140  0  93  55  54 535 1045   6  20 135 40 453  200 0.041999 21.7998  373
## 32 125  0 109  90  81 586  964  97  82 105 43 617  163 0.042698 30.9014  754
## 33 147  1 104  63  64 560  972  23  95  76 24 462  233 0.049499 25.5005 1072
## 34 126  0 118  97  97 542  990  18  21 102 35 589  166 0.040799 21.6997  923
## 35 123  0 102  97  87 526  948 113  76 124 50 572  158 0.020700 37.4011  653
## 36 150  0 100 109  98 531  964   9  24  87 38 559  153 0.006900 44.0004 1272
## 37 177  1  87  58  56 638  974  24 349  76 28 382  254 0.045198 31.6995  831
## 38 133  0 104  51  47 599 1024   7  40  99 27 425  225 0.053998 16.6999  566
## 39 149  1  88  61  54 515  953  36 165  86 35 395  251 0.047099 27.3004  826
## 40 145  1 104  82  74 560  981  96 126  88 31 488  228 0.038801 29.3004 1151
## 41 148  0 122  72  66 601  998   9  19  84 20 590  144 0.025100 30.0001  880
## 42 141  0 109  56  54 523  968   4   2 107 37 489  170 0.088904 12.1996  542
## 43 162  1  99  75  70 522  996  40 208  73 27 496  224 0.054902 31.9989  823
## 44 136  0 121  95  96 574 1012  29  36 111 37 622  162 0.028100 30.0001 1030
## 45 139  1  88  46  41 480  968  19  49 135 53 457  249 0.056202 32.5996  455
## 46 126  0 104 106  97 599  989  40  24  78 25 593  171 0.046598 16.6999  508
## 47 130  0 121  90  91 623 1049   3  22 113 40 588  160 0.052802 16.0997  849

# 独立样本的t检验
# 参数格式为y ~ x；y为数值型变量，x为二分型变量
t.test(Prob ~ So, data = UScrime)

##
##  Welch Two Sample t-test
##
## data:  Prob by So
## t = -3.8954, df = 24.925, p-value = 0.0006506
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.03852569 -0.01187439
## sample estimates:
## mean in group 0 mean in group 1
##      0.03851265      0.06371269

多组数据

已知样本分布：方差分析
未知样本分布：非参数检验
⋯\cdots⋯

图形表示

轮廓图

需要编写函数

# 编写轮廓绘制函数
outline <- function(x, txt = TRUE) {# 数据转换为矩阵形式if (is.data.frame(x) == TRUE)x <- as.matrix(x)# 读取矩阵的行数、列数m <- nrow(x); n <- ncol(x)# 绘制图形的轮廓plot(c(1, n), c(min(x), max(x)), type = "n", main = "The outline graph of Data",xlab = "Number", ylab = "Value")# 遍历样本，依次绘制轮廓线for (i in 1:m) {lines(x[i, ], col = i)if (txt == TRUE) {k <- dimnames(x)[[1]][i]text(1 + (i - 1) %% n, x[i, 1 + (i-1) %% n], k)}}
}
# 读入数据(数据框格式)
X <- read.table("test.data")
# 轮廓图绘制
outline(X)

星图(雷达图、蜘蛛图)

stars(mtcars, full = F, cex=0.6, col.segments = 2:6, draw.segments = T, xpd = T, key.loc = c(13, .5), mar = c(1, 0, 0, 0))

调和曲线图

# 构造绘制调和曲线图的函数
unison <- function(x){if (is.data.frame(x) == TRUE)x <- as.matrix(x)t <- seq(-pi, pi, pi/30)# m为观测数据总数# n为数据的维数m <- nrow(x); n<-ncol(x)f <- array(0, c(m, length(t)))for (i in 1:m){# 设定循环初始值f[i,] <- x[i,1] / sqrt(2)for (j in 2:n) {if (j %% 2 == 0)f[i, ] <- f[i, ] + x[i, j] * sin(j / 2 * t)elsef[i, ] <- f[i, ] + x[i, j] * cos(j %/% 2 * t)}}# 绘制图形的轮廓以及图形参数的调整plot(c(-pi,pi), c(min(f), max(f)), type = "n",main = "The Unison graph of Data",xlab = "t", ylab = "f(t)")# 低水平绘图，添加曲线for(i in 1:m) lines(t, f[i,] , col = i)
}
# 读入数据
X <- read.table("course.data")
# 调和曲线图绘制
unison(X)

R语言学习笔记（三）多元数据的数据特征、相关分析与图形表示相关推荐

R语言学习笔记三：两独立样本t检验
三:两独立样本ttt检验前文介绍了有关ttt检验的相关知识. 在实际运用中,两独立样本的ttt检验是运用较为广泛的. 1.数据准备这里使用iris3数据集,这是一个三位数组,我们将使用iris3[ ...
R语言学习笔记——入门篇：第三章-图形初阶
R语言 R语言学习笔记--入门篇:第三章-图形初阶文章目录 R语言一.使用图形 1.1.基础绘图函数:plot( ) 1.2.图形控制函数:dev( ) 补充--直方图函数:hist( ) 补充- ...
R语言学习笔记——高级篇：第十四章-主成分分析和因子分析
R语言 R语言学习笔记--高级篇:第十四章-主成分分析和因子分析文章目录 R语言前言一.R中的主成分和因子分析二.主成分分析 2.1.判断主成分的个数 2.2.提取主成分 2.3.主成分旋转 ...
R语言学习笔记（1~3）
R语言学习笔记(1~3) 一.R语言介绍 x <- rnorm(5) 创建了一个名为x的向量对象,它包含5个来自标准正态分布的随机偏差. 1.1 注释由符号#开头. #函数c()以向量的形式输 ...
r语言c函数怎么用,R语言学习笔记——C#中如何使用R语言setwd()函数
在R语言编译器中,设置当前工作文件夹可以用setwd()函数. > setwd("e://桌面//") > setwd("e:\桌面\") > ...
R语言学习笔记——入门篇：第一章-R语言介绍
R语言 R语言学习笔记--入门篇:第一章-R语言介绍文章目录 R语言一.R语言简介 1.1.R语言的应用方向 1.2.R语言的特点二.R软件的安装 2.1.Windows/Mac 2.2.Lin ...
R语言学习笔记 06 岭回归、lasso回归
R语言学习笔记文章目录 R语言学习笔记比较lm.ridge和glmnet函数画岭迹图图6-4 <统计学习导论基于R语言的应用>P182 图6-6<统计学习导论基于R语言的 ...
R语言学习笔记 07 Probit、Logistic回归
R语言学习笔记文章目录 R语言学习笔记 probit回归 factor()和as.factor() relevel() 案例11.4复刻 glm函数整理变量回归:Logistic和Probit- ...
R语言学习笔记（八）--读写文件与网络爬虫
R语言学习笔记(八) 1 工作路径 2 保存R对象 3 Scan函数 3-1 从控制台读取数据 3-2 从txt文件读取数据 3-3 从url读取数据 4 按行读写文本文件 5 读取文本文件(txt. ...

R语言学习笔记（三）多元数据的数据特征、相关分析与图形表示

文章目录

写在前面

独立性检验

χ2\chi^2χ2独立性检验

Fisher独立性检验

Cochran-Mantel-Haenszel χ2\chi^2χ2独立性检验

相关性分析

相关性检验

相关性检验

偏相关检验

分组数据的相关性检验

两组数据

多组数据

图形表示

轮廓图

星图(雷达图、蜘蛛图)

调和曲线图

R语言学习笔记（三）多元数据的数据特征、相关分析与图形表示相关推荐

最新文章

热门文章