假设我们现在有两组数据,如下所示

x

y

55.24

1.2

59.03

1.19

47.27

1.38

52.94

0.94

55

1.81

54

1.75

55.69

1.42

48.85

3.05

63.72

1.28

48.66

1.88

45.33

1.13

40.56

1.92

43.57

2.08

37.38

2.47

54.49

2.55

46.16

2.7

41.48

2.52

46.81

1.45

57.3

1.34

55.06

2.15

63.88

2.2

56.89

2

48.93

2.23

47.18

3.12

44.76

1.75

47.34

2.81

44.81

1.92

48.98

2.35

49.73

2.13

43.47

1.72

66.18

2.08

47.09

1.42

53.09

2.4

63.24

1.84

49.52

2.21

73.48

6.8

78.85

2.93

79.08

2.3

58.29

2.38

39.22

1.25

40.29

1.3

56.72

3.4

53.35

1.46

52.84

1.45

60.55

2.34

58.61

2.25

55.96

1.95

54.73

2.05

58.15

1.75

55.28

4.5

63.04

2.72

44.81

1.29

67.42

3.05

67.12

5

55.87

2.51

60.59

3.06

52.06

1.02

57.35

2.78

57.57

3.02

47.14

0.8

50.58

0.95

66.7

1.72

71.8

2.9

42.48

1.65

42.92

2.62

61.77

6.8

56.31

4.28

57.47

1.42

45.85

3.08

53.03

2.53

78.08

3.45

63.2

2.23

56.79

3.05

66.77

3.53

50.36

2.81

53.45

2.2

56.18

3.4

52.82

3.9

39.14

2.25

43.11

0.98

64.28

3.02

66.13

2.83

60.15

2.9

62.91

5.6

60.95

2.42

48.9

0.73

49.23

2.02

61.73

2.15

47.56

1.68

48.11

1.38

51.5

2.28

54.71

2.3

55.79

1.68

69.41

3.45

67.19

3.08

40.59

1.31

62.63

2.95

39.93

0.73

46.59

1.8

51.94

2.48

现在使用R语言做相关性分析

1 使用函数的说明

这里进行主要使用R语言中的函数cor.test()函数进行相关性系数的计算和检验。

函数功能:对成对数据进行相关性检验。里面有3中方法可供使用,分别是Pearson检验、Kendall检验和Spearman检验。

函数的使用格式为:

cor.test(x, y, alternative = c(“two.sided”, “less”, “greater”), method = c("pearson", "kendall", "spearman"),conf.level = 0.95)

其中x,y是供检验的样本;alternative指定是双侧检验还是单侧检验;method为检验的方法;conf.level为检验的置信水平。

2 数据的图形分析

执行下面的命令绘制散点图:

> data

read.table(file = "data.txt",header = TRUE)

> plot(data$x,

data$y)

得到的图形为:

从图中可以看出,图形中的点的分布并不是非常集中于一条直线,而且散落范围比较大。此时从图形中不能判断二者是否具有相关性。而且由于点的分散,下面将使用三种方法分别对其进行检验,检验中使用双侧检验,即alternative

= “two.sided”。

3 pearson检验

输入下面的命令实现检验

> cor.test(data$x, data$y,alternative = "two.sided",method =

"pearson",conf.level = 0.95)

结果为

Pearson's product-moment correlation

data: data$x and data$y

t = 5.0618, df = 98, p-value = 1.946e-06

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

0.2842595 0.5981865

sample estimates:

cor

0.4552588

从中可以看出二者的相关性系数为0.4552588,检验p值为1.946e-06<0.05。故x和y是有相关性的,但相关性并不是太大。

4 kendall检验

输入下面的代码进行检验

> cor.test(data$x, data$y,alternative = "two.sided",method =

"kendall", conf.level = 0.95)

结果为

Kendall's rank correlation tau

data: data$x and data$y

z = 4.572, p-value = 4.83e-06

alternative hypothesis: true tau is not equal to 0

sample estimates:

tau

0.3110132

从中可以看出二者的相关性度量值为0.3110132,检验p值为4.83e-06<0.05。故x和y是有相关性的,但相关性也并不是太大。

5 spearman检验

输入下面的代码进行检验

> cor.test(data$x, data$y,alternative = "two.sided",method =

"spearman",conf.level = 0.95)

结果为

Spearman's rank correlation rho

data: data$x and data$y

S = 90673.21, p-value = 1.874e-06

alternative hypothesis: true rho is not equal to 0

sample estimates:

rho

0.4559064

从中可以看出二者的相关性度量值为0.4559064,检验p值为1.874e-06<0.05。故x和y是有相关性的,但相关性也并不是太大。

6 综合分析

从上面的三种检验可以看出,虽然三种检验的结果都显示x与y具有相关性,但从相关性系数方面来看相关性并不是太高。

r语言kendall协和系数_使用R语言函数cor.test()做相关性计算和检验相关推荐

  1. r语言kendall协和系数_数据挖掘|R相关性分析及检验

    相关系数可以用来描述定量变量之间的关系.结果的正负号分别表明正相关或负相关,数值的大小则表示相关关系的强弱程度. R可以计算多种相关系数,今天主要介绍常见的三种:Pearson相关系数.Spearma ...

  2. r语言kendall协和系数_关于Kendall协和系数的理解

    1. 引言 变量之间相关程度的度量,在参数统计中最常用的是Pearson矩相关系数.在非参数统计 [1] 中,Spearman秩相关系数和Kendall-τ相关系数是常用的方法.但是它们只适用于两个变 ...

  3. r语言kendall协和系数_列联表篇之十一:有序数据的Kendall协和系数

    上一篇<列联表篇之十:属性相同双向有序表的Kappa分析>中提到,"Fleiss' Kappa(也包含Cohen's Kappa)可以用于二分类数据或名义尺度的评价,但不适用与顺 ...

  4. r语言kendall协和系数_R语言之并行计算(kendall相关系数篇)

    对于属性较多的数据,我们一般都会去计算两两属性之间的相关性,用以探讨属性之间的关系. 相对于皮尔森相关系数,我们更喜欢使用spearman和kendall相关系数,因为作为非参数相关系数,稳定性更好. ...

  5. r语言kendall协和系数_R语言-相关系数计算(一)

    应用R语言完成相关性检验,相关性矩阵及相关性可视化 首先安装相应的R包 require(ggpubr) ## Loading required package: ggpubr ## Loading r ...

  6. r语言查找是否存在空值_关于R包安装你知道多少?

    在R语言的学习过程中离不了各种R包的安装与使用,要使用某个R包首先得学会如何安装该R包.对于R包的安装你知道的有多少?你知道如何指定安装路径吗?为何你每次重新打开R绘画都需要重新安装R包?今天小编带你 ...

  7. r语言抓取网页数据_使用R进行网页抓取的简介

    r语言抓取网页数据 by Hiren Patel 希伦·帕特尔(Hiren Patel) 使用R进行网页抓取的简介 (An introduction to web scraping using R) ...

  8. c语言设计程序实现顺序冒泡_计算机C语言编程设计专业知识题库汇总

    下列关于栈叙述正确的是(). A.算法就是程序 B.设计算法时只需要考虑数据结构的设计 C.设计算法时只需要考虑结果的可靠性 D.以上三种说法都不对 答案:D 下列叙述中正确的是(). A.有一个以上 ...

  9. c语言操作空间怎么打开_学好C语言,离大神更近一步,C环境的安装

    我们先来说说为什么要学习C语言: 首先,就现在的几大系统而言,我们看看使用它的都有多少.Windows系统刚出现的时候就是用的C语言,后来才使用了C++和C#等.Linux的底层也是使用C语言编写的, ...

最新文章

  1. 盘点2018十大科技丑闻,IT相关两项
  2. java txt中文乱码,JAVA读取TXT文件 可解决中文乱码问题
  3. FPGA基础知识极简教程(8)详解三态缓冲器
  4. vs添加码云远程_项目git步骤,将项目托管到码云。git本地分支推送到远程分支...
  5. Crawler:反爬虫机制之基于urllib库+伪装浏览器+代理访问(代理地址随机选取)+实现下载某网址上所有的图片到指定文件夹
  6. @ 在 C# string 中的用法
  7. C#中使用OpenGL(API)创建OpenGL渲染环境
  8. 如何在log4j.properties文件中使用相对路径
  9. python编程 迷你世界_迷你编程下载-迷你世界迷你编程下载 v1.0官方版--pc6下载站...
  10. java 判断图片损坏_如何在Java中检测损坏的图像(PNG,JPG)
  11. (转)Spring对注解(Annotation)处理源码分析1——扫描和读取Bean定义
  12. 网络是怎样连接的笔记第5章 防火墙,缓存服务器
  13. 在线计算CAN波特率参数
  14. 问题解决逻辑:深度和广度谁应该优先?
  15. 【PTA-python】第4章-15 换硬币 (20 分)
  16. 计算机网络连接图标在哪,电脑网络连接图标不见了
  17. Google Bazel简介
  18. 从零开始的计网学习——计算机网络概述(计网入门就看这篇!)
  19. 码率/比特率完整介绍
  20. 腾讯海外计费系统架构演进

热门文章

  1. 1007 of dp
  2. leaflet加载各类图层
  3. 【NLP】一文了解命名实体识别
  4. 美最新弗吉尼亚级核潜艇可能部署关岛威胁中国
  5. 云桌面几大应用场景,你需要的都在这里
  6. su user oracle does not exist,【案例】Linux文件系统无法mount 由superblock损坏导致
  7. 最新信息安全毕设选题题目推荐
  8. 美股史考特证券开户教程
  9. 这个年均开销3500万美元的 FBI 机密部门,将结合面部识别与大数据技术来调查案件...
  10. Matlab不规则区域渐变色填充及注意事项