r语言kendall协和系数_使用R语言函数cor.test()做相关性计算和检验
假设我们现在有两组数据,如下所示
x
y
55.24
1.2
59.03
1.19
47.27
1.38
52.94
0.94
55
1.81
54
1.75
55.69
1.42
48.85
3.05
63.72
1.28
48.66
1.88
45.33
1.13
40.56
1.92
43.57
2.08
37.38
2.47
54.49
2.55
46.16
2.7
41.48
2.52
46.81
1.45
57.3
1.34
55.06
2.15
63.88
2.2
56.89
2
48.93
2.23
47.18
3.12
44.76
1.75
47.34
2.81
44.81
1.92
48.98
2.35
49.73
2.13
43.47
1.72
66.18
2.08
47.09
1.42
53.09
2.4
63.24
1.84
49.52
2.21
73.48
6.8
78.85
2.93
79.08
2.3
58.29
2.38
39.22
1.25
40.29
1.3
56.72
3.4
53.35
1.46
52.84
1.45
60.55
2.34
58.61
2.25
55.96
1.95
54.73
2.05
58.15
1.75
55.28
4.5
63.04
2.72
44.81
1.29
67.42
3.05
67.12
5
55.87
2.51
60.59
3.06
52.06
1.02
57.35
2.78
57.57
3.02
47.14
0.8
50.58
0.95
66.7
1.72
71.8
2.9
42.48
1.65
42.92
2.62
61.77
6.8
56.31
4.28
57.47
1.42
45.85
3.08
53.03
2.53
78.08
3.45
63.2
2.23
56.79
3.05
66.77
3.53
50.36
2.81
53.45
2.2
56.18
3.4
52.82
3.9
39.14
2.25
43.11
0.98
64.28
3.02
66.13
2.83
60.15
2.9
62.91
5.6
60.95
2.42
48.9
0.73
49.23
2.02
61.73
2.15
47.56
1.68
48.11
1.38
51.5
2.28
54.71
2.3
55.79
1.68
69.41
3.45
67.19
3.08
40.59
1.31
62.63
2.95
39.93
0.73
46.59
1.8
51.94
2.48
现在使用R语言做相关性分析
1 使用函数的说明
这里进行主要使用R语言中的函数cor.test()函数进行相关性系数的计算和检验。
函数功能:对成对数据进行相关性检验。里面有3中方法可供使用,分别是Pearson检验、Kendall检验和Spearman检验。
函数的使用格式为:
cor.test(x, y, alternative = c(“two.sided”, “less”, “greater”), method = c("pearson", "kendall", "spearman"),conf.level = 0.95)
其中x,y是供检验的样本;alternative指定是双侧检验还是单侧检验;method为检验的方法;conf.level为检验的置信水平。
2 数据的图形分析
执行下面的命令绘制散点图:
> data
read.table(file = "data.txt",header = TRUE)
> plot(data$x,
data$y)
得到的图形为:
从图中可以看出,图形中的点的分布并不是非常集中于一条直线,而且散落范围比较大。此时从图形中不能判断二者是否具有相关性。而且由于点的分散,下面将使用三种方法分别对其进行检验,检验中使用双侧检验,即alternative
= “two.sided”。
3 pearson检验
输入下面的命令实现检验
> cor.test(data$x, data$y,alternative = "two.sided",method =
"pearson",conf.level = 0.95)
结果为
Pearson's product-moment correlation
data: data$x and data$y
t = 5.0618, df = 98, p-value = 1.946e-06
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.2842595 0.5981865
sample estimates:
cor
0.4552588
从中可以看出二者的相关性系数为0.4552588,检验p值为1.946e-06<0.05。故x和y是有相关性的,但相关性并不是太大。
4 kendall检验
输入下面的代码进行检验
> cor.test(data$x, data$y,alternative = "two.sided",method =
"kendall", conf.level = 0.95)
结果为
Kendall's rank correlation tau
data: data$x and data$y
z = 4.572, p-value = 4.83e-06
alternative hypothesis: true tau is not equal to 0
sample estimates:
tau
0.3110132
从中可以看出二者的相关性度量值为0.3110132,检验p值为4.83e-06<0.05。故x和y是有相关性的,但相关性也并不是太大。
5 spearman检验
输入下面的代码进行检验
> cor.test(data$x, data$y,alternative = "two.sided",method =
"spearman",conf.level = 0.95)
结果为
Spearman's rank correlation rho
data: data$x and data$y
S = 90673.21, p-value = 1.874e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.4559064
从中可以看出二者的相关性度量值为0.4559064,检验p值为1.874e-06<0.05。故x和y是有相关性的,但相关性也并不是太大。
6 综合分析
从上面的三种检验可以看出,虽然三种检验的结果都显示x与y具有相关性,但从相关性系数方面来看相关性并不是太高。
r语言kendall协和系数_使用R语言函数cor.test()做相关性计算和检验相关推荐
- r语言kendall协和系数_数据挖掘|R相关性分析及检验
相关系数可以用来描述定量变量之间的关系.结果的正负号分别表明正相关或负相关,数值的大小则表示相关关系的强弱程度. R可以计算多种相关系数,今天主要介绍常见的三种:Pearson相关系数.Spearma ...
- r语言kendall协和系数_关于Kendall协和系数的理解
1. 引言 变量之间相关程度的度量,在参数统计中最常用的是Pearson矩相关系数.在非参数统计 [1] 中,Spearman秩相关系数和Kendall-τ相关系数是常用的方法.但是它们只适用于两个变 ...
- r语言kendall协和系数_列联表篇之十一:有序数据的Kendall协和系数
上一篇<列联表篇之十:属性相同双向有序表的Kappa分析>中提到,"Fleiss' Kappa(也包含Cohen's Kappa)可以用于二分类数据或名义尺度的评价,但不适用与顺 ...
- r语言kendall协和系数_R语言之并行计算(kendall相关系数篇)
对于属性较多的数据,我们一般都会去计算两两属性之间的相关性,用以探讨属性之间的关系. 相对于皮尔森相关系数,我们更喜欢使用spearman和kendall相关系数,因为作为非参数相关系数,稳定性更好. ...
- r语言kendall协和系数_R语言-相关系数计算(一)
应用R语言完成相关性检验,相关性矩阵及相关性可视化 首先安装相应的R包 require(ggpubr) ## Loading required package: ggpubr ## Loading r ...
- r语言查找是否存在空值_关于R包安装你知道多少?
在R语言的学习过程中离不了各种R包的安装与使用,要使用某个R包首先得学会如何安装该R包.对于R包的安装你知道的有多少?你知道如何指定安装路径吗?为何你每次重新打开R绘画都需要重新安装R包?今天小编带你 ...
- r语言抓取网页数据_使用R进行网页抓取的简介
r语言抓取网页数据 by Hiren Patel 希伦·帕特尔(Hiren Patel) 使用R进行网页抓取的简介 (An introduction to web scraping using R) ...
- c语言设计程序实现顺序冒泡_计算机C语言编程设计专业知识题库汇总
下列关于栈叙述正确的是(). A.算法就是程序 B.设计算法时只需要考虑数据结构的设计 C.设计算法时只需要考虑结果的可靠性 D.以上三种说法都不对 答案:D 下列叙述中正确的是(). A.有一个以上 ...
- c语言操作空间怎么打开_学好C语言,离大神更近一步,C环境的安装
我们先来说说为什么要学习C语言: 首先,就现在的几大系统而言,我们看看使用它的都有多少.Windows系统刚出现的时候就是用的C语言,后来才使用了C++和C#等.Linux的底层也是使用C语言编写的, ...
最新文章
- 盘点2018十大科技丑闻,IT相关两项
- java txt中文乱码,JAVA读取TXT文件 可解决中文乱码问题
- FPGA基础知识极简教程(8)详解三态缓冲器
- vs添加码云远程_项目git步骤,将项目托管到码云。git本地分支推送到远程分支...
- Crawler:反爬虫机制之基于urllib库+伪装浏览器+代理访问(代理地址随机选取)+实现下载某网址上所有的图片到指定文件夹
- @ 在 C# string 中的用法
- C#中使用OpenGL(API)创建OpenGL渲染环境
- 如何在log4j.properties文件中使用相对路径
- python编程 迷你世界_迷你编程下载-迷你世界迷你编程下载 v1.0官方版--pc6下载站...
- java 判断图片损坏_如何在Java中检测损坏的图像(PNG,JPG)
- (转)Spring对注解(Annotation)处理源码分析1——扫描和读取Bean定义
- 网络是怎样连接的笔记第5章 防火墙,缓存服务器
- 在线计算CAN波特率参数
- 问题解决逻辑:深度和广度谁应该优先?
- 【PTA-python】第4章-15 换硬币 (20 分)
- 计算机网络连接图标在哪,电脑网络连接图标不见了
- Google Bazel简介
- 从零开始的计网学习——计算机网络概述(计网入门就看这篇!)
- 码率/比特率完整介绍
- 腾讯海外计费系统架构演进