第7章 Stata相关性分析
目录
7.1简单相关分析
7.2偏相关分析
在得到相关数据资料后,我们要对这些数据进行分析,研究各个变量之间的关系。相关分析是应用非常广泛的一种方法。它是不考虑变量之间的因果关系而只研究分析变量之间的相关关系的一种统计分析方法,常用的相关分析包括简单相关分析、偏相关分析等。
7.1简单相关分析
数据(案例7.1)
对数据的月份、温度、日照时间三个变量进行简单相关性分析,命令如下:
correlate month tem hour
结果如图所示,我们可以看到有12个样本参与了分析(obs=12)然后可以看到变量之间的相关系数,其中month与tem的相关系数是0.3206,month与hour的的相关系数是0.0536,tem与hour的相关系数是0.7578。这个相关系数越大说明两个变量之间的关系越紧密,也就是说平均温度和日照时间具有比较高的相关性。
案例延伸:
1.获得变量的协方差矩阵
correlate month tem hour,covariance
结果如图所示,我们可以看到变量的协方差矩阵,其中month的方差是13,tem的方差是77.7027,hour的方差是2341.01,month与tem的协方差是10.1909,month与hour的协方差是9.34546,tem与hour的协方差是323.211。这个两个变量之间的协方差也是代表了两个变量之间的相关性,值越高相关性越高。
2.获得相关性的显著性检验
pwcorr month tem hour,sig
结果如图所示,其中,month与tem之间的相关性显著性P值是0.3096,month与hour之间的相关性显著性P值是0.8687,tem与hour的相关性显著性P值是0.0043。显著性检验在前面的章节也说过,在这我们假设他们是相关性不大,P值大于0.05则支持了咱们的假设,P值小于0.05则推翻假设。这里明显看出tem与hour推翻假设说明两个变量之间相关性很强。
此外还有一种更为精准的sidak方法。命令如下
pwcorr month tem hour,sidak sig
这个同上个结论相同这里不多赘述了。只不过是更加精确了而已。
3.获得相关性的显著性检验,并进行标注
很多时候我们希望能够一目了然的看出变量相关在不同置信水平上是否显著例如置信水平为99%的时候,对应命令如下
pwcorr month tem hour ,sidak sig star(0.01)
置信水平为90%的时候,对应命令如下
pwcorr month tem hour ,sidak sig star(0.1)
结果就不再过多赘述了。
7.2偏相关分析
很多情况下,需要进行相关分析的变量的取值会同时收到其他变量的影响,这时就需要把其他变量控制住,然后输出控制其他变量影响后的相关系数。
数据(案例7.2)
pcorr YW SX IQ
结果如图所示,我们可以看出一共有12个样本参与了方差分析,在控制住IQ变量的情况下,语文成绩和数学成绩的偏相关系数(Paertial Corr)是0.8933--系数越大说明两个变量之间影响越小,显著性水平(Significance Value)是0.0002--小于0.05说明两个变量之间影响越大,大于0.05说明两个变量之间影响越小。此外,该结果还给出了控制数学成绩变量的情况下,语文成绩和IQ之间的偏相关关系,他们的偏相关系数是-0.1196,显著性水平是0.7261。在这个数据中可以看出数学成绩和语文成绩在控制IQ变量的情况下相关性还是很强的(可能现实不是那样但是这个数据中就是如此)。
案例延伸
1.部分数据进行偏相关分析
pcorr YW SX IQ if IQ>100
结果如图所示,与上述结果有所不同,在控制了IQ>100的前提下我们可以看到语文成绩和数学成绩之间的相关性很弱。
第7章 Stata相关性分析相关推荐
- 用spss做多组两两相关性分析_两独立样本T检验及如何利用SPSS实现其操作
上一篇文章我们讲解了有关单样本T检验的相关内容(如何使用SPSS进行单样本检验),其实论文中除了常用到的单样本T检验以外,还有另外一种T检验的方法也是经常用到的统计方法,也就是两独立样本T检验 说到T ...
- UA MATH571A 一元线性回归III 方差分析与相关性分析
UA MATH571A 一元线性回归III 方差分析与相关性分析 ANOVA Table F检验 回归系数的F检验 F检验与t检验等价 广义线性检验方法 R2R^2R2 数值例子:女性肌肉量与年龄的关 ...
- 统计机器学习相关性分析
在我们进行数据分析或者是机器学习模型建立的时候我们往往忽略数据处理的一个过程-----相关性分析.诚然,数据相互之间可能会存在一些联系,这些关系可能正相关,或者是负相关,也可能无关. 设X1,X2,X ...
- 毕设论文数据分析记录-part2:相关性分析
20220225-相关性分析 polyfit线性拟合后进行t检验判断线性关系显著水平-一阶差分去趋势 a=xlsread('gai-maizey.xls','gai-maizey'); a1=a(:, ...
- python线性回归分析看相关性_机器学习入门:相关性分析之线性回归
一.前言 机器学习--特征与标签 : 输入模型的属性是"特征",输出的是"标签" 机器学习的核心是"使用算法解析数据,从中学习,然后对世界上的某件事情 ...
- 精通Web Analytics 2.0 (13) 第十一章:变身分析忍者的指导原则
精通Web Analytics 2.0 (13) 第十一章:变身分析忍者的指导原则 精通Web Analytics 2.0 : 用户中心科学与在线统计艺术 第十一章:变身分析忍者的指导原则 这个激动人 ...
- 基于SPSS的中国消费者信心指数影响因素分析-----相关性分析
说明:本案例基于spss数据分析与挖掘实战案例精粹----第10章 案例背景:对受访者的背景资料对消费者信心指数的影响加以研究,并进一步考察其内部的详细作用方式: 分析方法:使用方差分析对自变量进行筛 ...
- 计量经济学及Stata应用 第二章 Stata入门
第二章 Stata入门 2.3 Stata操作实例 打开数据文件 use file_path,clear (clear用于清空内存中的数据) 审视数据 观看数据集中的变量名.标签等 describe ...
- 数据分析实训第8章企业所得税预测分析
数据分析实训第8章企业所得税预测分析(无警告.无报错.分析很齐全) 前言 这些天抽空把数据挖掘再重温了一遍,再次做这题时,查看网上的答案发现,很多都存在着一些问题,因此自己特意写了一下,代码无一 ...
最新文章
- 【PHP+JS】uploadify3.2 和 Ueditor 修改上传文件 大小!!
- 骑摩托的蒙娜丽莎 - 曼妙风骚的花式慢跑算法
- jittor和pytorch生成网络对比之dragan
- 推荐一款让你纵横Github的读码神器
- python下载安装教程mac-Anaconda2 Mac版下载
- 从程序员到项目经理(十一):每个人都是管理者
- 年龄测试计算器软件,抖音很火的年龄计算器
- 描述java源程序构成_2.1 Java程序的构成
- Linux 关闭桌面方法
- 程序员难以攻克的十大难题
- html5手机端三级联动城市选择代码,省市县三级联动(jQuery手机端收货地址选择地区代码)...
- Arrays类的排序(sort、parallelsort)
- STM32CubeMX的安装
- 计算机四级网络工程师(操作系统单选)- 知识点
- [渝粤教育] 苏州农业职业技术学院 日语会话基础 参考 资料
- 学生管理系统-C++版
- DeepBrain Chain 深脑链——将区块链与AI相结合的前沿科技
- Mapgis 到ArcGis 双向转换
- 2021湖南耒阳二中高考成绩查询,来自耒阳各校的高考喜报
- 当代大学生的生活痛点
热门文章
- 计算机冯诺伊曼体系结构和哈佛体系结构区别和处理器性能评判标准
- SQL经典语句大全及应用示例汇总
- 迭代、原型、螺旋、敏捷模型之间的区别
- 红色彼岸花计算机谱子,ceecceec
- mongodb php auth,mongodb 3.0改变了authMechanism
- YOLOV3论文详解
- EnlightenGAN: Deep Light Enhancement without Paired Supervision
- 使用PreTranslateMessage(MSG* pMsg)截获键盘数字键
- 【OpenCV C++】照片换底
- 苹果手机语音备忘录在哪_苹果手机备忘录被家里宝宝误删了如何恢复呢?