读文献时,有时求相关系数,有时求拟合优度,到底都是什么呢?
先给结论,RRR与R2R^2R2没有关系,就如同标准差与标准误差没有关系一样。

1. 相关系数(R)

定义:变量之间线性相关的度量。分三种,spearman, pearson, kendall
公式:
ρ=Cov(X,Y)σXσY\rho = \frac{Cov(X,Y)}{\sigma_X\sigma_Y}ρ=σX​σY​Cov(X,Y)​
解释:自变量X和因变量Y的协方差/标准差的乘积。

  • 协方差:两个变量变化是同方向的还是异方向的。X高Y也高,协方差就是正,相反,则是负。
  • 为什么要除标准差:标准化。即消除了X和Y自身变化的影响,只讨论两者之间关系。
  • 因此,相关系数是一种特殊的协方差。

2. 决定系数(R^2)

定义:对模型进行线性回归后,评价回归模型系数拟合优度。

公式:R2=SSR/SST=1-SSE/SST
SST (total sum of squares):总平方和
SSR (regression sum of squares):回归平方和
SSE (error sum of squares) :残差平方和。

解释:残差(residual):实际值与观察值之间的差异

在一组数据中,采用平均值做基线模型(图中黑线)
我们的模型(蓝线)都与这个黑线比较,来判断模型的好坏
var=sum(i-mean)^2

结论:R^2=81%,因变量Y的81%变化由我们的自变量X来解释。
R^2 的缺陷:当我们人为的向系统中添加过多的自变量,SSE会减少,从而R^2变大。因此我们采用校正R方,惩罚了过多无意义的自变量:

统计-R(相关系数)与R^2(决定系数)傻傻分不清相关推荐

  1. 国防大学计算机学院,国防大学和国防科技大学是同一所学校吗?很多人傻傻都分不清!...

    国防大学和国防科技大学,这两所大学名字相近,极易混淆,在很多网站搜索"国防大学录取分数线",出来的全是国防科技大学的的高考录取分数线,所以给广大考生带来了很大困惑,难道国防大学和国 ...

  2. 《统计学习导论》R语言代码整理

    <统计学习导论>R语言代码整理 一.特殊函数 二.基本函数 三.画图 一些函数 一些参数 type pch (plotting character) lty(line types) 特定问 ...

  3. 【医学信息学】《统计学习导论-基于r应用》的学习总结

    以下仅为笔者在学习<统计学习导论-基于r应用>过程中的理解总结,如有错误,敬请指正 统计学习导论概述 什么是统计学习? 对一系列观测值(自变量/预测变量/X,因变量/响应变量/Y)之间的关 ...

  4. dataframe第二列 r语言_123.R简介和统计绘图

    123R简介和统计绘图 本节作者:刘永鑫 中国科学院遗传与发育生物学研究所:陈同 中国中医科学院 版本1.0.2,更新日期:2020年8月31日 本项目永久地址:https://github.com/ ...

  5. 统计学习导论之R语言应用(四):分类算法R语言代码实战

    统计学习导论之R语言应用(ISLR) 参考资料: The Elements of Statistical Learning An Introduction to Statistical Learnin ...

  6. 统计学习导论之R语言应用(三):线性回归R语言代码实战

    统计学习导论(ISLR) 参考资料 The Elements of Statistical Learning An Introduction to Statistical Learning 统计学习导 ...

  7. 统计学习导论 - 基于R的应用 学习笔记1

    统计学习导论 - 基于R的应用 学习笔记 Chapter 1 导论 统计学习是什么: 关于估计ƒ的一系列方法 Y=f(x)+ξ f:X 提供给 Y 的系统信息,是 x 的函数 ξ:随机误差项:均值为0 ...

  8. ISLR统计学习导论之R语言应用(五):R语言实现交叉验证和bootstrap

    统计学习导论(ISLR) 小编大四统计在读,目前保研到统计学top3高校继续攻读统计研究生. 参考资料: The Elements of Statistical Learning An Introdu ...

  9. 最优化理论c语言代码,《统计学习导论基于R应用》PDF代码导图+《最优化理论与算法第2版》PDF习题指导...

    要想深入理解机器学习,或者对人工智能的某个领域有所研究,都必须掌握统计学.最优化.矩阵及其应用等知识. 推荐<统计学习导论:基于R应用>,适合运用统计学习前沿技术分析数据的人士.读起来不费 ...

  10. ISLR统计学习导论之R语言应用(六):R语言实现变量选择和岭回归

    ISLR统计学习导论之R语言应用(六):R语言实现变量选择和岭回归

最新文章

  1. 68款大规模机器学习数据集,涵盖CV、语音、NLP | 十年资源集
  2. 安装目录opencv for android 教程(环境搭建篇)
  3. 将Excle数据导入到数据库
  4. 2020年泰国物联网五大部门中 制造业物联网市值为13亿美元
  5. 数据结构之基于Java的顺序栈实现
  6. java gui中文变方块_150道Java面试基础题(含答案)
  7. 使用perl连接oracle数据库
  8. VC中TabControl控件使用方法(转载)
  9. mysql 分区表 限制_Mysql分区表使用的一些限制和需要注意的地方-阿里云开发者社区...
  10. 虚拟机vmware硬盘扩容方法
  11. alpha因子常见问题_因子体系(一):从因子确定到ALPHA和风险的界定
  12. ping服务器时显示的ttl是什么意思,运行PING本机IP的时候显示TTL=64是什么意思啊?这个数值? 爱问知识人...
  13. 360 html快捷,360极速浏览器如何设置键盘快捷键?
  14. 【英语语法入门】 第31讲 [被动语态 (1)]被动态的构成和含义
  15. ros2 topic 源码解析
  16. 本科毕业论文怎么避免查重?
  17. android去掉最上面的app名字(标题栏,抬头)
  18. 分布式WLAN全双工链路加权调度算法
  19. 旷视科技2022提前批校园招聘已经开启啦!
  20. 华为云计算之双活容灾

热门文章

  1. “弹出USB大容量存储设备时出问题”的解决方法
  2. C#单位档案信息管理系统源码
  3. 如何将cocos、spine等骨骼文件转换成Egret引擎使用的 dragonbones的骨骼文件
  4. 疾病研究:我是一名34岁的进行性肌营养不良症患者
  5. libvlc 裁剪及编译
  6. linux管理员最大密码长度,【最新】电信光猫超级管理员账户密码获取方法
  7. Ansible中的jinjia2模板
  8. gmoj 6841. 【2020.11.5提高组模拟】淘淘蓝蓝之树林
  9. STM32开发环境的搭建及使用——STM32CubeMX
  10. uva 10246(最短路变形)