在回归分析中,解释变量的回归系数p值和方程的R方哪个更重要?有人说,我们领域的研究似乎更看重p值,而不管R方这种说法值得商榷。

在统计上,回归系数的p值很重要,它是前提。但当涉及理论解释时,R方就更重要了。R方反映的是自变量对因变量方差的解释比例,显然,如果影响因变量的全部因素或者“主要因素”、“重要因素”都捕捉到的话,R方就会是比较大的,说明研究模型考虑到了多数重要的影响因素。如果R方很小,比如低于0.2,那说明研究模型只是抓住了影响因变量的次要因素而已,模型遗漏了其他更重要的因素。那什么样的影响因素是主要因素、重要因素?从统计上来看,那些重要因素、主要因素对因变量的标准化回归系数(绝对值)必然是比较大的,因为标准化回归系数反映变量间关系的强弱程度。在一元回归分析中,回归系数的平方就是R方,所以,回归系数小,R方一定小,回归系数大,R方一定大——转换成理论的解释就是,X与Y的关系紧密、相关性越强,R方越大。所以,追求高的R方实际上就是追求相关性高、联系紧密的影响因素。

那p值呢?p值一方面和变量间的关系(相关系数)有关,另一方面还和样本量有关,我们往往忽视了样本量的影响,认为p值越显著,影响就越大,这个说法其实是不当的。一元回归分析中,X-Y的相关系数即便很小,在大样本的情况下p值也会很显著,这种情况下就会出现,p值很显著(如p<0.001)但R方却很小的情况。在大型数据中,我们一定要警惕这种现象,例如医学等大型调查数据中,很容易发现很多变量都有显著影响,可是标准化回归系数却非常低(例如0.07),这么小的回归系数导致的R方必然很小很小,其结论的理论意义不大。

那如何取舍呢?个人认为,回归系数的p值显著是前提,不显著的结论是不可靠的(但对进一步的研究仍有预示价值);其次,P值显著的同时还要看标准化回归系数和R方,回归系数小、R方比较低的话,模型拟合度差,此时就要小心说明自变量与因变量的关系问题。此外,要注意效应量的评估,当回归系数比较大或者R方比较大而回归系数不显著时,如果是样本量的问题则可以参考效应量(可查看效应量相关文献),但也可能是共线性的问题,因为共线性会歪曲回归系数的估计。

回归分析中的p值和R方哪个更重要?相关推荐

  1. 一文搞定R语言拟合p值、R方...

    R:ggplot2拟合,我推荐geom_smooth绘制拟合和ggpmisc添加统计信息. 几行代码就可以搞定了,对新手非常友好. 线性拟合 library(tidyverse) library(re ...

  2. 生活中回归分析实际例子_回归分析中R方和调整R方的区别

    介绍 当我开始我的数据科学之旅时,我探索的第一个算法是线性回归. 在理解了线性回归的概念和算法的工作原理之后,我非常兴奋地使用它并在问题陈述中做出预测.我相信你们大多数人也会这么做的.但是一旦我们建立 ...

  3. 回归分析中R方和调整R方的区别

    作者|ANIRUDDHA BHANDARI 编译|VK 来源|Analytics Vidhya 概述 理解R方和调整R方的概念 了解R方和调整R方之间的关键区别 介绍 当我开始我的数据科学之旅时,我探 ...

  4. 二次拟合r方_回归分析中R方和调整R方的区别

    作者|ANIRUDDHA BHANDARI 编译|VK 来源|Analytics Vidhya 概述 理解R方和调整R方的概念 了解R方和调整R方之间的关键区别 介绍 当我开始我的数据科学之旅时,我探 ...

  5. 调整的R方_如何选择回归模型

    sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&a ...

  6. R语言使用lm构建线性回归模型、并将目标变量对数化(log10)实战:可视化模型预测输出与实际值对比图、可视化模型的残差、模型预测中系统误差的一个例子 、自定义函数计算R方指标和均方根误差RMSE

    R语言使用lm构建线性回归模型.并将目标变量对数化(log10)实战:可视化模型预测输出与实际值对比图.可视化模型的残差.模型预测中系统误差的一个例子 .自定义函数计算R方指标和均方根误差RMSE 目 ...

  7. matlab中多项式拟合如何给出r方,matlap拟合函数后r^2怎么求

    matlab拟合函数 求助 尝试用二次多项式拟合: clearall; x=2:2:20; y=[0.31.232.416.267.958.529.049.179.299.37]; scatter(x ...

  8. 机器学习对回归模型的评价指标:均方误差、可解释方差和R方值

    学习过概率与统计的同学们都知道,对于线性回归及其他的回归模型来说,评价连续性可拟合的数据就不能使用离散二分类器的评价指标对回归模型进行评价.因此我们引入了均方误差(mean squared error ...

  9. R语言计算资本资产定价模型(CAPM)中的Beta值和可视化

    原文链接:http://tecdat.cn/?p=22588 今天我们将计算投资组合收益的CAPM贝塔.这需要拟合一个线性模型,得到可视化,从资产收益的角度考虑我们的结果的意义. 简单的背景介绍,资本 ...

最新文章

  1. TalkingData大规模机器学习的应用
  2. java中注解动态传参_SpringMVC之注解、传参、返回值及拦截器
  3. 数据中心缩小是因为外包和云计算吗
  4. caffe下matlab、python的配置和faster RCNN的运行
  5. Kali Linux 和 渗透测试
  6. javascript 数字精度问题
  7. 计算机中丢失了ll是什么意思,丢失了ntoskrnl.exe和hal.ll
  8. Maven环境搭建和介绍
  9. Leetcode 742.二叉树最近的叶子结点
  10. python+pytest单元测试框架之在Jenkins上生成Allure测试报告
  11. tinyxml初体验
  12. Python解释器【转载】
  13. Python实现截图AI文字识字小工具
  14. 项目管理中的变更管理是什么?
  15. 烧烤摊如何走O2O之路 微博微信运营案例分享
  16. msvcr100.dll丢失的解决方法?哪种解决方法方便点
  17. windows7系统的时间服务器,win7系统搭建ntp服务器的操作方法
  18. 无线路由器的AP、Client、WDS、WISP使用功能图解(清晰明了)
  19. PhalAPI学习笔记 ——— 第三章细致讲解使用PSR-4规范自定义你的命名空间
  20. Bresenham改进算法结合wu反走样算法画直线

热门文章

  1. Dep包管理的主要机制
  2. linux下硬件检测工具,Linux硬件检测工具
  3. Dreaming to distill(Deep Inversion, data free distill)
  4. ora.eons offline
  5. 解析ARM中OS_CPU_A.S(中断级方式)
  6. 下载文件、根据链接生成二维码
  7. java判断200以内的素数_java判断101-200之间的素数并输出
  8. 如何将多个txt快速合并
  9. P1598 垂直柱状图(模拟)
  10. 佛罗里达大学计算机科学,佛罗里达大学计算机工程硕士专业排名最全内幕详尽分析...