【R语言】读懂Pearson相关分析结果

2018-09-14

1.数据说明

这里我对R语言的自带的数据包中states.x77(关于美国50个州的某些数据)第1至6列的50份数据从统计的角度以及R语言的角度进行分析,看看R语言是怎么做相关分析的,同时怎么看分析出的结果

首先我们观察一下states.x77中第1至6列的数据及其意义

列名 解释 单位

Population 人口 人

Income 人均收入 美元/人

Illiteracy 文盲率 %

Life Exp 预期寿命 年

Murder 谋杀率 %(每100,000人)

HS Grad 高中毕业率 %

2.统计学的计算过程

(1)我们拿出文盲率(设为x)和预期寿命(设为y)来从统计的角度计算相关系数r以及显著性水平α:

首先,我们假设文盲率和预期寿命符合计算Pearson相关系数的变量要求:

①两变量相互独立

②两变量为连续变量

③两变量的分布遵循正态分布

④两变量呈线性关系

换句话来说,当你选择的变量符合上要求的时候,可以选择使用Pearson相关系数来求两个变量间的相关关系

(2)按照上一篇文章对相关分析的解说,计算Pearson相关系数的时候,有两个步骤:

①计算相关系数r

②计算显著性水平α

因此这里作出简单的讲解:

①计算相关系数r

Pearson的相关系数r的公式为:

那么把数据代入到公式中计算

#state.x77第3列为文盲率x

2

3

4

5

6

7

8

9

10

11

12

13

14

这个时候我们根据1977年发布的美国50个州的states.x77样本中的数据算出了相关系数r=-0.5884779,因为样本states.x77只是从总体(设为总体A)抽出来的数据(总体应该是这么多年来美国各个州的文盲率和预期寿命的数据),那么这个states.77样本中算出的相关系数r并不一定能代表总体A的相关系数ρ

②计算显著性水平α

设想一下,如果我们的总体A的相关系数ρ实际上为0的(也就是说总体上文盲率和预期寿命没有相关关系),因为误差或者抽样偏差的关系,抽样所得的states.x77的文盲率和预期寿命数据计算出来的相关系数r并不为0(也就是说样本上显示文盲率和预期寿命有相关关系),因此要进行显著性检验:

提出假设:

H0:总体A的相关系数ρ=0(也就是说假设总体上文盲率和预期寿命没有相关关系)

H1:总体A的相关系数ρ≠0(也就是说总体上文盲率和预期寿命有相关关系)

计算检验的统计量:

查表确定显著性水平α

把数据代入公式中计算:

T

2

3

得出T=-5.042706

3.R语言应用以及观察结果

在R语言中,有直接的函数cor( )计算出Pearson相关系数

同样是两个步骤:

计算文盲率和预期寿命之间的相关系数r:

r

2

3

和我们使用计算Pearson系数计算出的结果一致

进行显著性检验

#使用cor.test()函数计算文盲率和预期寿命的相关关系,默认方法为Pearson相关分析T

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

4.R语言扩展应用

当我们不仅仅需要计算文盲率和预期寿命的相关关系,而是计算state.x77中各个数据之间的相关关系,使用cor()也是可以做到的:

再次按照相关分析的步骤:

①计算相关系数r(两两变量间的相关系数)

> cor(state.x77[1:6) Population Income Illiteracy Life Exp Population 1.00000000 0.2082276 0.10762237 -0.06805195 Income 0.20822756 1.0000000 -0.43707519 0.34025534 Illiteracy 0.10762237 -0.4370752 1.00000000 -0.58847793 Life Exp -0.06805195 0.3402553 -0.58847793 1.00000000 Murder 0.34364275 -0.2300776 0.70297520 -0.78084575 HS Grad -0.09848975 0.6199323 -0.65718861 0.58221620 Frost -0.33215245 0.2262822 -0.67194697 0.26206801 Area 0.02254384 0.3633154 0.07726113 -0.10733194 Murder HS Grad0.3436428 -0.09848975-0.2300776 0.619932320.7029752 -0.65718861-0.7808458 0.582216201.0000000 -0.48797102-0.4879710 1.00000000 -0.5388834 0.36677970 0.2283902 0.333541871

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

②计算显著性水平α

> #赋值state.x77中第1至6列的数据给states> states #执行对states中的缺失值进行行删除的显著性检验> corr.test(states, adjust = "none", use = "complete")Call:corr.test(x = states, use = "complete", adjust = "none")Correlation matrix #进行Pearson相关系数计算 Population Income Illiteracy Life Exp Murder HS GradPopulation 1.00 0.21 0.11 -0.07 0.34 -0.10Income 0.21 1.00 -0.44 0.34 -0.23 0.62Illiteracy 0.11 -0.44 1.00 -0.59 0.70 -0.66Life Exp -0.07 0.34 -0.59 1.00 -0.78 0.58Murder 0.34 -0.23 0.70 -0.78 1.00 -0.49HS Grad -0.10 0.62 -0.66 0.58 -0.49 1.00#样本数Sample Size [1] 50#进行显著性检验Probability values (Entries above the diagonal are adjusted for multiple tests.) Population Income Illiteracy Life Exp Murder HS GradPopulation 0.00 0.15 0.46 0.64 0.01 0.5Income 0.15 0.00 0.00 0.02 0.11 0.0Illiteracy 0.46 0.00 0.00 0.00 0.00 0.0Life Exp 0.64 0.02 0.00 0.00 0.00 0.0Murder 0.01 0.11 0.00 0.00 0.00 0.0HS Grad 0.50 0.00 0.00 0.00 0.00 0.0 To see confidence intervals of the correlations, print with the short=FALSE option1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

从以上结果可以看出,具有显著性相关关系(设显著性水平为0.05,即超过95%的概率有相关关系)的两两变量有:

变量 P值 r值

Population,Murder 0.01 0.34

Income, Illiteracy 0.00 -0.44

Income,Life Exp 0.02 0.34

Income, HS Grad 0.00 0.62

Illiteracy, Life Exp 0.00 -0.59

Illiteracy, Murder 0.00 0.70

Illiteracy, HS Grad 0.00 -0.66

Life Exp, HS Grad 0.00 0.58

Life Exp, Murder 0.00 -0.78

Murder, HS Grad 0.00 -0.49

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。

http://www.pinlue.com/style/images/nopic.gif

皮尔森 统计学相关性分析_【R语言】读懂Pearson相关分析结果相关推荐

  1. 数学建模--线性回归和线性相关性分析基于R语言

    线性相关性分析: x=c(171,175,159,155,152,158,154,164,168,166,159,164) y=c(57,64,41,38,35,44,41,51,57,49,47,4 ...

  2. GSEA文件准备及表达相关性分析(R语言)

    GSEA文件准备 setwd("F:\\GEO\\GEO芯片数据/")##下载好的载入 load('GSE35896_eSet.Rdata') a=gset[[1]] ##取出第一 ...

  3. oracle sql 执行计划分析_《真正读懂Oracle SQL执行计划》

    maclean_0071人评论1235人阅读2013-10-25 15:18:12 [视频教学:性能优化]Maclean Liu的Oracle性能优化讲座第一回<真正读懂Oracle SQL执行 ...

  4. 皮尔森 统计学相关性分析_pearson相关系数和spearman相关系数的区别

    展开全部 区别: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有62616964757a686964616fe78988e69d83 ...

  5. r语言实现岭回归_预测分析:R语言实现

    预测分析:R语言实现 作者:(希)鲁伊·米格尔·福特(Rui Miguel Forte) 著 出版日期:2016年10月 文件大小:53.55M 支持设备: ¥40.00仅供试读 适用客户端: 言商书 ...

  6. 宏转录组方法_高级转录组分析和R语言数据可视化第十二期 (线上线下同时开课)...

    "福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析.宏基因组.Python课程线上直播课.报名参加线上直播课的老师可在1年内选择参加同课程的一次线下 ...

  7. 宏转录组方法_最后一周|高级转录组分析和R语言数据可视化第十二期 (线上线下同时开课)...

    "福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析.宏基因组.Python课程线上直播课.报名参加线上直播课的老师可在1年内选择参加同课程的一次线下 ...

  8. R计算两列数据的相关系数_数据相关性分析 correlation - R实现

    相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度.相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析. 有时候多组数据需要分析其关联性(是否有正向 ...

  9. spearman相关性分析_「同学交大经金考研」西安交通大学432统计学-必考简答题4:spearman等级相关系数...

    我们是西安交大经金学院的直系学长学姐,我们想通过自己的微薄之力,为大家提供更好的复习方法和复习模式,让每一位考交大经金的同学以最高效的方法备考.21交大经金学院考研QQ群:235794121 备考资料 ...

  10. 预测分析:R语言实现1.3 预测建模的过程

    1.3 预测建模的过程 通过观察模型的某些不同特征,我们已经对预测建模过程的各种步骤有所了解.在本节,我们要顺序讲解这些步骤,并理解每个步骤是如何对该任务的整体成功起作用的. 1.3.1 定义模型的目 ...

最新文章

  1. oracle glogin.sql sql _user,为什么我的login.sql不执行?
  2. NRF51 BOOTLOADER 编译注意事项
  3. C++利用访函数进行选择排序
  4. 便携式不锈钢管道焊接机器人_为什么越来越多的不锈钢管件用不锈钢焊管制作...
  5. 操作系统上机作业--多线程排序
  6. 关于数据库,程序员应该了解的那些事
  7. 简便无刷新文件上传系统
  8. SQLite学习笔记(三)--创建内存数据库
  9. 关于Java锁机制面试官会怎么问,深刻易懂
  10. AI人工智能基础自学(一)
  11. java 奇数trun_N26-博客作业-week15
  12. 【.NET】IQueryable扩展方法实现复杂查询条件
  13. PPT文件不能编辑的情况总结
  14. linux用shell编写猜数字,Shell猜数字游戏
  15. 新页微NY7503S无线充芯片10w
  16. 使用sqlyog导入数据表到MySql中
  17. ipa文件包获取服务器地址,ipa文件包获取服务器地址
  18. vue组件化的理解与定义
  19. 制作 win10 u 盘安装盘
  20. POI在sax模式下读取xlsx报错 Characters larger than 4 bytes are not supported解决办法

热门文章

  1. 亲测美团打车聚合服务:要做出行服务的天猫?
  2. 第五模块 常用邮件沟通场景(1):求职信
  3. CSS 引入的三种方式
  4. Lvs之NAT、DR、TUN三种模式的应用配置案例
  5. 生活中有趣的6个数学小故事
  6. Error executing DDL
  7. Executing an update/delete query
  8. 链接与自定义函数名同名的库函数
  9. thing JS笔记
  10. 平面设计文字排版方式有哪些?设计师们收藏——黎乙丙