相关性及相关性的显著性检验
文章目录
- 1. 相关性:
- 1.1例子1
- 1.2 例子2
- 2.相关性的显著性检验:
- 2.1 例1.1的显著性检验
- 2.2 例1.2的显著性检验
看了一些统计学的书,关于相关性,假设检验等的问题,想写一点自己的理解
1. 相关性:
相关性是指两个变量的关联程度。两个变量的的相关性可分为正相关,负相关,不相关
- 简而言之,相关性是指两个变量的变化趋势的异同,相同则为正相关,反之则为负相关。(用正负号 表示)
- 相关程度的大小,用数字表示,(绝对值的取值范围为[0,1])
- 相关性不是指两个变量具有的某种关系
1.1例子1
以r
语言中自带的数据为例:
# 以为车辆的两种信息为例,验证其相关性
# 每加仑汽油行驶英里数(mpg) 和 汽缸数(cyl)
> mtcars$mpg[1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3
[14] 15.2 10.4 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3
[27] 26.0 30.4 15.8 19.7 15.0 21.4
> mtcars$cyl[1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> cor(mtcars$mpg, mtcars$cyl)
[1] -0.852162 # 结果为负相关,数字表示相关的程度大小
1.2 例子2
# (disp) 排量(立方英寸):发动机气缸的总容积
> mtcars$disp[1] 160.0 160.0 108.0 258.0 360.0 225.0 360.0 146.7 140.8 167.6 167.6
[12] 275.8 275.8 275.8 472.0 460.0 440.0 78.7 75.7 71.1 120.1 318.0
[23] 304.0 350.0 400.0 79.0 120.3 95.1 351.0 145.0 301.0 121.0
> mtcars$cyl[1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
> cor(mtcars$disp, mtcars$cyl)
[1] 0.9020329 # 结果为正相关,且正相关的程度很大
# 很明显气缸数量跟排量成正相关
2.相关性的显著性检验:
所谓统计假设检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理。
也就是说,假如在一次样本实验中,两组数据的相关性为0.7,那么100次实验中,或者1000次实验中,出现相关性为0.7或者小于、大于0.7的概率是多少。从而验证我们求出的相关性的值有多大可能是符合总体数据的相关性的。
相关性的显著性检验:简单来说,就是检验这一次样本数据求得的相关性的值是否可靠。
2.1 例1.1的显著性检验
使用cor.test()
进行显著性检验,默认方法为pearson
,想要了解更多,可以参考r
中的方法参数
> cor.test(mtcars$mpg, mtcars$cyl)Pearson's product-moment correlationdata: mtcars$mpg and mtcars$cyl
t = -8.9197, df = 30, p-value = 6.113e-10
alternative hypothesis: true correlation is not equal to 095 percent confidence interval:-0.9257694 -0.7163171
sample estimates:cor
-0.852162
结果:
- 首先我们探讨的问题是:两组变量是否相关,所以假设检验的零假设为:两组变量不相关(约定俗成),备择假设为:两组变量相关。
- 一般p值给出两个显著水平:0.05:显著水平;0.01:极显著水平;p-value = 6.113e-10<0.01,达到极显著水平,也就是说应该否定零假设,得出两组变量相关的的结果。
- p值的解析:。假设总体的相关度为0,则预计在几十亿次中只会有少于一次的机会见到-0.852162 这样的样本相关度(即p=6.113e-10) 。也就是说在零假设的情况下,几十亿分之一的概率基本不会发生,所以就可以拒绝零(原)假设,接受备择假设 。
2.2 例1.2的显著性检验
> cor.test(mtcars$disp, mtcars$cyl)Pearson's product-moment correlationdata: mtcars$disp and mtcars$cyl
t = 11.445, df = 30, p-value = 1.803e-12
alternative hypothesis: true correlation is not equal to 095 percent confidence interval:0.8072442 0.9514607
sample estimates:cor
0.9020329
结果:
- 同样的分析,如2.1
- 只是这次的p值更小,那么否定零假设的可信度也就越大。
相关性及相关性的显著性检验相关推荐
- python相关性分析模型,相关性分析原理及Python实战
本文阅读时间大概在8分钟. 相关性分析 我们常说的相关性分析是分析两个变量之间线性相关程度的方法,其相关性强度的度量即为相关性系数.现实中很多事物间都拥有或多或少的相关性,例如,房屋面积对价格的影响, ...
- python 计算TIFF图像相关性 根据相关性筛选特征 使用PCA提取主要特征
import os import shutil import imageio import numpy as np from osgeo import gdal from sklearn.decomp ...
- R语言描述性统计分析:相关性分析
R语言描述性统计分析:相关性分析 相关性分析:pearson.spearman.kendall 相关性系数的显著性检验: 偏相关性分析: library(ISwR) attach(thuesen) c ...
- R绘图|相关性系数图
数据是使用的是CK.LG.MG和HG四个放牧处理表层微生物扩增子数据,计算群落各微生物属丰度之间以及其与放牧.生物量等的相关性. # 1. 设置工作路径及调用R包 #knitr::opts_knit$ ...
- 基于matlab-arcgis求栅格数据的相关性和显著性分析
clc; clear; %栅格相关性分析 [a,R]=geotiffread('C:\Users\smv16\Desktop\栅格数据\ndvi\2001_modis1.tif'); info=geo ...
- 深入理解ElasticSearch(六)排序与相关性
排序与相关性 默认情况下,返回的结果是按照 相关性 进行排序的--最相关的文档排在最前. 在本章的后面部分,我们会解释 相关性 意味着什么以及它是如何计算的, 不过让我们首先看看 sort 参数以及如 ...
- 这一新的可视化方法教你优雅地探索相关性
一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长.不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集大量数据的需求.减少输入变量的一种方法是鉴 ...
- 【论文翻译】HeteSim:异构网络中相关性度量的通用框架
原文链接:https://blog.csdn.net/Mrong1013967/article/details/115330139 HeteSim:异构网络中相关性度量的通用框架 摘要 相似性搜索是许 ...
- 一个优雅地探索相关性的新可视化方法
一个古老的诅咒一直萦绕着数据分析:我们用来改进模型的变量越多,那么我们需要的数据就会出现指数级的增长.不过,我们通过关注重要的变量就可以避免欠拟合以及降低收集大量数据的需求.减少输入变量的一种方法是鉴 ...
最新文章
- Oracle中的 IN, NOT IN和 EXISTS, NOT EXISTS的區別
- Xamarin 2017.11.9更新
- 在融通一年多来,海哥一直在分享看过的比较不错的文章,借花献佛下
- ITK:在保留边缘的同时使图像平滑
- 『飞秋』小项目心得交流
- 第一个cocos2d-x 项目
- 软件行业资本论[前言,第一节]
- UVA 10765 Doves and bombs 割点
- amd cpu排行_2020英特尔cpu排行_2019 cpu天梯图 intel和amd cpu性能排行
- SQL(07)_INSERT INTO SELECT
- 3229: 硬币组合
- CET-4 week9 阅读 写译
- 程序猿生存指南-57 故友来京
- 国科大学习资料--人工智能原理与算法-2021年期末考试题解析(学长整理)
- 如何在 Mac 上录制屏幕
- 深度学习平台——百度AI Studio线上构建
- 迷宫算法(JAVA实现)
- 华为“阳阴面”:阳面是镜子 阴面是体系上的霉斑
- Java 程序员开发常用的工具(全)
- 使用系统默认声音、震动
热门文章
- FlashFXP如何保持FTP连接不中断?
- ajax能用sesssion,解决Ajax应用中的session过期问题
- 前端vue项目-关于下载文件pdf/excel
- 写给透明加密驱动开发的探索者
- MyBatis驼峰命名规则
- 爱奇艺缓存的视频qsv怎样转mp4
- OPENCV420版本CV_INTER_LINEAR
- shellexecute 执行完成_用ShellExecute执行cmd命令遇到的问题总结
- 「Git」- git rev-parse returned status code 128 @20210317
- java fault_java-无法捕获AxisFault异常