回归拟合中的基本概念和公式汇编(SSE, MSE, RMSE, RMS, STD, 方差, SSR, SST, R-square, Adjusted_R-squ, 相关度)
1、概念
- SSE(和方差、残差平方和) :The sum of squares due to error,该统计参数计算的是拟合数据和原始数据对应点的误差的平方和。SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。
- MSE(均方误差):Mean squared error,该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别。
- RMSE(均方根误差):Root mean squared error,该统计参数,也叫回归系统的拟合标准差,是MSE的平方根。
- SSR(回归平方和):Sum of squares of the regression,即预测数据与原始数据均值之差的平方和。
- SST(离差平方和):Total sum of squares,即原始数据和均值之差的平方和。
- R-square(确定系数):Coefficient of determination,通过数据的变化来表征一个拟合的好坏。“确定系数”的正常取值范围为[0 1],越接近1,表明方程的变量对 y 的解释能力越强,这个模型对数据拟合的也较好。
- 相关度:相关度又叫 皮尔逊相关系数 (Pearson Correlation Coefficient),衡量两个值线性相关强度的量 取值范围 [-1, 1]: 正向相关: >0, 负向相关:<0, 无相关性:=0
- 调整的R方:Adjusted R-Square,调整R方的解释与R方类似,不同的是:调整R方同时考虑了样本量(n)和回归中自变量的个数(k)的影响,这使得调整R方永远小于R方,而且调整R方的值不会由于回归中自变量个数的增加而越来越接近1。
- 方差:variance,统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
- STD(标准差):Standard Deviation,方差的算数平方根。
因为在模型中,增加多个变量,即使事实上无关的变量,也会小幅度提高R平方的值,简单地说就是,用r_square的时候,不断添加变量能让模型的效果提升,而这种提升是虚假的。
如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R方也会变大。因此,为避免增加自变量而高估R方,利用adjusted r square,能对添加的非显著变量给出惩罚,也就是说随意添加一个变量不一定能让模型拟合度上升。
注:这篇博文中涉及的,均方误差和方差是一样的,实际上它们两者是有区别的,具体可参看:
https://blog.csdn.net/Gou_Hailong/article/details/114896740
下面列个表格
简称 | 中文名字 | 计算公式 |
---|---|---|
SSE | 和方差、残差平方和 | |
MSE | 均方误差、方差 | |
RMSE | 均方根误差、标准差 | |
SSR | 回归平方和 | |
SST | 离差平方和 | |
R-square | 确定系数 | |
Adjusted R-Square | 调整R方 | |
ρ \rho ρ | 相关度 |
上述公式中w 是权重,一般都是1,调整R 方中的p 是number of predictors,
2、例子
下面整个简单例子,有这样两组变量:
X | Y |
---|---|
1 | 10 |
3 | 12 |
8 | 24 |
7 | 21 |
9 | 34 |
于是,n=5,w=1,p=1,,为啥是1,现在不太清楚。
Matlab代码:
X=[1;3;8;7;9];
Y=[10;12;24;21;34];
X_mean=mean(X);%5.6
Y_mean=mean(Y);%20.2
X_var=var(X,1);%9.44
Y_var=var(Y,1);%Y的方差,即Y_SST/n 75.36
XY_cov=cov(X,Y,1);%XY的协方差矩阵,对角线上是方差,其他是协方差 25.08
corrcoef(X,Y);%算相关系数,1, 0.9403
之后点
然后得出结果:
关于这个RMSE,不知道Matlab咋算的,其他数据还行。
excle 版本的:
X | Y | Y_hat | SSE | SSR | SST | R^2 |
---|---|---|---|---|---|---|
1 | 10 | 7.9788 | 4.08524944 | 149.3577294 | 104.04 | |
3 | 12 | 13.2924 | 1.67029776 | 47.71493776 | 67.24 | |
8 | 24 | 26.5764 | 6.63783696 | 40.65847696 | 14.44 | |
7 | 21 | 23.9196 | 8.52406416 | 13.83542416 | 0.64 | MSE=8.728 |
9 | 34 | 29.2332 | 22.72238224 | 81.59870224 | 190.44 | RMSE=2.9543 |
43.63983056 | 333.1652706 | 376.8 | 0.884196578 |
参考文章
https://jingyan.baidu.com/article/67508eb40d47b09cca1ce4ce.html
https://blog.csdn.net/l18930738887/article/details/50629409
https://blog.csdn.net/YEN_CSDN/article/details/79105846
回归拟合中的基本概念和公式汇编(SSE, MSE, RMSE, RMS, STD, 方差, SSR, SST, R-square, Adjusted_R-squ, 相关度)相关推荐
- java的mape_深度学习-回归问题的评估指标:MAE, MAPE, MSE, RMSE, R2_Score
回归问题常用的评估指标 回归问题常用的评估指标包括:MAE, MAPE, MSE, RMSE, R2_Score等. 这些评价指标基本都在 sklearn 包中都封装好了,可直接调用. 安装 skle ...
- matlab中rmse是什么意思,matlab sse和rmse
索引日期:2016-06-30 23:28:26 SSE,MSE,RMSE,R-square(转)_粽子_新浪博客 使用过Matlab的拟合.优化和统计等工具箱的网友,会经常___SSE,MSE,RM ...
- 互斥事件的概念和公式_统计学中的基本概念和重要公式(一)
统计学中的基本概念和重要公式 一.基本概念 二.重要公式 一.基本概念 1.描述统计学 2.推断统计学 3.数据的几种尺度和类型 4.条形图 5.直方图 6.茎叶图 7.箱线图 8.累积频数 9.累积 ...
- 混淆矩阵(confusion matrix)是什么?以及能从混淆矩阵中衍生出来的指标FPR、TPR、FDR、ACC、PPV、NPV分别是什么?对应的概念及公式是什么?
混淆矩阵(confusion matrix)是什么?以及能从混淆矩阵中衍生出来的指标FPR.TPR.FDR.ACC.PPV.NPV分别是什么?对应的概念及公式是什么? 目录
- matlab做横截面回归,matlab - 将横截面表面轮廓拟合到通用的已知公式以获得系数并对表面进行数学建模 - 堆栈内存溢出...
假设您有一个离散的r数组,并且该数组的每个值z(r) . 您想拟合曲线以估计非球面透镜的参数. 我将使用lmfit提到这里展现做到这一点使用python的一种方式. 导入用于此的模块: import ...
- 逻辑回归(Logistic regression)详解-并用scikit-learn训练逻辑回归拟合Iris数据集
这篇文章主要介绍逻辑回归背后的一些概率概念,给你一些直观感觉关于它的代价函数的由来.并且我也介绍了关于最大似然估计(maximum likelihood)的概念,用这个强大的工具来导出逻辑回归的cos ...
- 机器学习之数学基础(四)~Lasso Regression回归, L1、L2 Regularization正则化, 回归问题中的损失函数
目录 1. Lasso回归 1.1 概念 1.2 正则化 1.3 Lasso回归模型 1.4 为什么Lasso Regression可以做降维? 1.5 参数求解 (1)坐标轴下降法 (2)最小角回归 ...
- 最优化:**回归/拟合方法总结
回归分析是建模和分析数据的重要工具.本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归.逻辑回归.多项式回归.逐步回归.岭回归.套索回归Lasso Regression.ElasticNe ...
- python 一元回归拟合(含幂函数,对数,S函数,指数函数,一次、二次、三次,逆函数,生长、复合函数)
提示 目录 因为工作最近需要对数据进行拟合生成指标 一.最后的成果 二.导入数据 三.将数据中的自变量因变量都抽出来,进行九种回归拟合 1.代码如下: 2.这里补充下变换知识 三 对数据进行绘图,画出 ...
最新文章
- 群晖NAS百度云Docker客户端下载目录没有权限的问题解决
- Linux开发环境搭建之Java开发环境JDK安装配置
- python官网没有中文-python 检查是否为中文字符串的方法
- win7下如何开启远程桌面服务
- python写元旦快乐_用Python在00:00给微信好友发元旦祝福语
- 小试牛刀Matplotlib
- 20170204-py
- cadence原理图封装pin名称重复_Cadence原理图库文件引脚名重复处理方法介绍
- Spring的异步方法
- WEB消息推送-comet4j
- C语言物流管理运输系统
- Django models Fild详解
- 金融零售图谱-反欺诈关联图谱
- sonar代码审查问题分析
- 元器件封装标准IPC-7351及电子开发论坛集合
- Android获取SD卡总容量,可用大小,机身内存总容量及可用大小的系统方法
- 高中物理应用计算机教学心得,信息技术在物理教学中运用教学心得
- java script基础入门·2
- 当婚纱摄影邂逅超级表格|流程监控
- android 蓝牙搜索不到Ble设备