决定系数 均方误差mse_回归模型评价指标 SSE, MSE、RMSE、MAE、R-SQUARED
分类问题的评价指标是准确率,
常见回归算法的评价指标有SSE, MSE,RMSE,MAE、R-Squared。
误差平方和 SSE(Sum of Squares due to Error)
该统计参数计算的是拟合数据和原始数据对应点的误差的平方和
公式如下:
SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样
补充:
计算公式如下:
同样的数据集的情况下,SSE越小,误差越小,模型效果越好
缺点:
SSE数值大小本身没有意义,随着样本增加,SSE必然增加,也就是说,不同的数据集的情况下,SSE比较没有意义
均方误差 MSE(Mean Squared Error)
公式如下:
该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别
均方根误差 RMSE(Root Mean Squard Error)
公式如下:
回归系统的拟合标准差,是MSE的平方根,用于数据更好的描述。
例如:要做房价预测,每平方是万元(真贵),我们预测结果也是万元。那么差值的平方单位应该是 千万级别的。那我们不太好描述自己做的模型效果。怎么说呢?我们的模型误差是 多少千万?。。。。。。于是干脆就开个根号就好了。我们误差的结果就跟我们数据是一个级别的可,在描述模型的时候就说,我们模型的误差是多少万元。
平均绝对误差 MAE(Mean Absolute Error)
上面公式为了避免误差出现正负抵消的情况,采用计算差值的平方。还有一种公式也可以起到同样效果,就是计算差值的绝对值:
公式如下:
上面几个模型解决了样本数量 n 和 量纲的影响。但是它们都存在一个相同的问题:当量纲不同时,难以衡量模型效果好坏。
举个例子,模型在一份房价数据集上预测得到的误差 RMSE 是 5 万元, 在另一份学生成绩数据集上得到误差是 10 分。凭这两个值,很难知道模型到底在哪个数据集上效果好。
那如何比较不同量纲下模型的效果好坏呢?这就需要用到回归模型的第四个评价指标:R-平方。它的含义就是,既然不同数据集的量纲不同,很难通过上面的三种方式去比较,那么不妨找一个第三者作为参照,根据参照计算 R方值,就可以比较模型的好坏了。
这个参照是什么呢,就是均值模型。我们知道一份数据集是有均值的,房价数据集有房价均值,学生成绩有成绩均值。现在我们把这个均值当成一个基准参照模型,也叫 baseline model。这个均值模型对任何数据的预测值都是一样的,可以想象该模型效果自然很差。基于此我们才会想从数据集中寻找规律,建立更好的模型。
R-平方 R Squared
在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sum of squares of the regression
即预测数据与原始数据均值之差的平方和,公式如下:
(2)SST:Total sum of squares
即原始数据和均值之差的平方和,公式如下:
我们的“确定系数”是定义为SSR和SST的比值,故
其实“确定系数”是通过数据的变化来表征一个拟合的好坏。由上面的表达式可以知道“确定系数”的正常取值范围为[0 1],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好
————————————————————————————————————————
对于回归模型效果的判断指标经过了几个过程,从SSE到R-square再到Ajusted R-square, 是一个完善的过程:
SSE(误差平方和):The sum of squares due to error
R-square(决定系数):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination
下面我对以上几个名词进行详细的解释下,相信能给大家带来一定的帮助!!
一、SSE(误差平方和)
计算公式如下:
同样的数据集的情况下,SSE越小,误差越小,模型效果越好
缺点:
SSE数值大小本身没有意义,随着样本增加,SSE必然增加,也就是说,不同的数据集的情况下,SSE比较没有意义
二、R-square(决定系数)
数学理解: 分母理解为原始数据的离散程度,分子为预测数据和原始数据的误差,二者相除可以消除原始数据离散程度的影响
其实“决定系数”是通过数据的变化来表征一个拟合的好坏。
理论上取值范围(-∞,1], 正常取值范围为[0 1] ------实际操作中通常会选择拟合较好的曲线计算R²,因此很少出现-∞
越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好
越接近0,表明模型拟合的越差
经验值:>0.4, 拟合效果好
缺点:
数据集的样本越大,R²越大,因此,不同数据集的模型结果比较会有一定的误差
三、Adjusted R-Square (校正决定系数)
n为样本数量,p为特征数量
消除了样本数量和特征数量的影响
————————————————
决定系数 均方误差mse_回归模型评价指标 SSE, MSE、RMSE、MAE、R-SQUARED相关推荐
- 回归模型评价指标:MSE、RMSE、MAE、R2 score
回归模型评价指标:MSE.RMSE.MAE. R 2 R^2 R2 score 回归模型评价指标:MSE.RMSE.MAE.R2 score 前言 平均绝对误差(MAE) 均方误差(MSE) 均方根误 ...
- ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介、使用方法、代码实现、案例应用之详细攻略
ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介.使用方法.代码实现.案例应用之详细攻略 目录 回归预测问题中评价指标简介 RMSE 标准差SD MSE函数
- 预测评价指标:MSE,RMSE,MAE,MAPE,SMAPE
目录 前言 MSE RMSE MAPE SMAPE Python程序 前言 分类问题的评价指标是准确率,回归算法的评价指标是MSE,RMSE,MAE.测试数据集中的点,距离模型的平均距离越小,该模型越 ...
- 回归模型评价指标-SST、SSR、SSE、R-square
本文介绍了回归模型在模型选择上的常见评估指标:SST.SSR.SSE和R-square. SST:The sum of squares total SSR:The sum of squares reg ...
- 【机器学习】回归模型评价指标原理与基于sklearn的实现
1 前言 回归任务是机器学习中常见的任务,特别是涉及到具体的发电量预测.风力预测等工业任务时,有非常多的应用场景.回归任务不同于分类任务,回归任务的预测值一般是连续的数,分类任务的预测值则是离散的值( ...
- 决定系数 均方误差mse_【机器学习】回归误差:MSE、RMSE、MAE、R2、Adjusted R2 +方差、协方差、标准差(标准偏差/均方差)、均方误差、均方根误差(标准误差)、均方根解释...
我们通常采用MSE.RMSE.MAE.R2来评价回归预测算法. 1.均方误差:MSE(Mean Squared Error) 其中, 为测试集上真实值-预测值. def rms(y_test, y): ...
- 决定系数 均方误差mse_误差分析计算公式及其 matlab 代码实现(mse、mape、rmse等)...
Loading... ## 残差平方和(SSE) ### 计算公式: ![sse](https://lpg-it.gitee.io/image/img/other/sse.png) ### 代码实现: ...
- 回归拟合中的基本概念和公式汇编(SSE, MSE, RMSE, RMS, STD, 方差, SSR, SST, R-square, Adjusted_R-squ, 相关度)
1.概念 SSE(和方差.残差平方和) :The sum of squares due to error,该统计参数计算的是拟合数据和原始数据对应点的误差的平方和.SSE越接近于0,说明模型选择和拟合 ...
- SSE,MSE,RMSE,R-square指标讲解
from: https://blog.csdn.net/danmeng8068/article/details/80143306 SSE(和方差.误差平方和):The sum of squares d ...
最新文章
- 关于笔记本键盘错乱的原因及解决办法
- Matlab中disp、fprintf和sprintf
- python 终端打印表格--------pylsy 源码
- business man
- mysql 从库 read only_mysql salve从库设置read only 属性
- python文本筛选html_python 正则表达式过滤文本中的html标签 源代码解析
- Android 中的拿来主义(编译,反编译,AXMLPrinter2,smali,baksmali)!
- 50道Java线程面试题分析及答案
- LeetCode 201. 数字范围按位与
- 傅盛希望定义AI时代的机器人产品,2年交出这份可落地答卷
- Kubernetes详解(十九)——Kubernetes Pod控制器
- 小程序消息订阅发送功能教程
- 英语语法特殊句型刷题总结
- 工业物联网企业logo设计思路分析
- 基于vivado实现FFT/IFFT
- 简单静态web页面+动画(小案例)
- Android开发之保存图片到相册的三种方法详解
- java计算机毕业设计校园环境保护监督系统源程序+mysql+系统+lw文档+远程调试
- 产品经理必懂的技术那点事儿(中)
- 在Linux系统下玩《炉石传说:魔兽英雄传》
热门文章
- UML中符号的意义(转)
- IE7的web标准之道——7:(修正)float双倍margin bug
- 安装VM虚拟机提示 尝试创建目录 C:\Public\documents\SharedVirtual Machines 时发生错误解决方法
- jQuery使用blur()方法触发两次的解决方法
- 如何在不使用任何图像或跨度标签的情况下通过CSS在UL / LI html列表中设置子弹颜色[复制]
- 如何在现有的ul中添加li?
- 测试嵌套JavaScript对象键的存在
- Objective-C中的复制忍者卡卡西---NSProxy
- rsync同步操作 、 发布rsync共享 、 inotify实时同步 、 Split分离解析
- Truncate a string