分类问题的评价指标是准确率,

常见回归算法的评价指标有SSE, MSE,RMSE,MAE、R-Squared。

误差平方和 SSE(Sum of Squares due to Error)

该统计参数计算的是拟合数据和原始数据对应点的误差的平方和

公式如下:

SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样

补充:

计算公式如下:

同样的数据集的情况下,SSE越小,误差越小,模型效果越好

缺点:

SSE数值大小本身没有意义,随着样本增加,SSE必然增加,也就是说,不同的数据集的情况下,SSE比较没有意义

均方误差 MSE(Mean Squared Error)

公式如下:

该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别

均方根误差 RMSE(Root Mean Squard Error)

公式如下:

回归系统的拟合标准差,是MSE的平方根,用于数据更好的描述。

例如:要做房价预测,每平方是万元(真贵),我们预测结果也是万元。那么差值的平方单位应该是 千万级别的。那我们不太好描述自己做的模型效果。怎么说呢?我们的模型误差是 多少千万?。。。。。。于是干脆就开个根号就好了。我们误差的结果就跟我们数据是一个级别的可,在描述模型的时候就说,我们模型的误差是多少万元。

平均绝对误差 MAE(Mean Absolute Error)

上面公式为了避免误差出现正负抵消的情况,采用计算差值的平方。还有一种公式也可以起到同样效果,就是计算差值的绝对值:

公式如下:

上面几个模型解决了样本数量 n 和 量纲的影响。但是它们都存在一个相同的问题:当量纲不同时,难以衡量模型效果好坏。

举个例子,模型在一份房价数据集上预测得到的误差 RMSE 是 5 万元, 在另一份学生成绩数据集上得到误差是 10 分。凭这两个值,很难知道模型到底在哪个数据集上效果好。

那如何比较不同量纲下模型的效果好坏呢?这就需要用到回归模型的第四个评价指标:R-平方。它的含义就是,既然不同数据集的量纲不同,很难通过上面的三种方式去比较,那么不妨找一个第三者作为参照,根据参照计算 R方值,就可以比较模型的好坏了。

这个参照是什么呢,就是均值模型。我们知道一份数据集是有均值的,房价数据集有房价均值,学生成绩有成绩均值。现在我们把这个均值当成一个基准参照模型,也叫 baseline model。这个均值模型对任何数据的预测值都是一样的,可以想象该模型效果自然很差。基于此我们才会想从数据集中寻找规律,建立更好的模型。

R-平方 R Squared

在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的

(1)SSR:Sum of squares of the regression

即预测数据与原始数据均值之差的平方和,公式如下:

(2)SST:Total sum of squares

即原始数据和均值之差的平方和,公式如下:

我们的“确定系数”是定义为SSR和SST的比值,故

其实“确定系数”是通过数据的变化来表征一个拟合的好坏。由上面的表达式可以知道“确定系数”的正常取值范围为[0 1],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好

————————————————————————————————————————

对于回归模型效果的判断指标经过了几个过程,从SSE到R-square再到Ajusted R-square, 是一个完善的过程:

SSE(误差平方和):The sum of squares due to error

R-square(决定系数):Coefficient of determination

Adjusted R-square:Degree-of-freedom adjusted coefficient of determination

下面我对以上几个名词进行详细的解释下,相信能给大家带来一定的帮助!!

一、SSE(误差平方和)

计算公式如下:

同样的数据集的情况下,SSE越小,误差越小,模型效果越好

缺点:

SSE数值大小本身没有意义,随着样本增加,SSE必然增加,也就是说,不同的数据集的情况下,SSE比较没有意义

二、R-square(决定系数)

数学理解: 分母理解为原始数据的离散程度,分子为预测数据和原始数据的误差,二者相除可以消除原始数据离散程度的影响

其实“决定系数”是通过数据的变化来表征一个拟合的好坏。

理论上取值范围(-∞,1], 正常取值范围为[0 1] ------实际操作中通常会选择拟合较好的曲线计算R²,因此很少出现-∞

越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好

越接近0,表明模型拟合的越差

经验值:>0.4, 拟合效果好

缺点:

数据集的样本越大,R²越大,因此,不同数据集的模型结果比较会有一定的误差

三、Adjusted R-Square (校正决定系数)

n为样本数量,p为特征数量

消除了样本数量和特征数量的影响

————————————————

决定系数 均方误差mse_回归模型评价指标 SSE, MSE、RMSE、MAE、R-SQUARED相关推荐

  1. 回归模型评价指标:MSE、RMSE、MAE、R2 score

    回归模型评价指标:MSE.RMSE.MAE. R 2 R^2 R2 score 回归模型评价指标:MSE.RMSE.MAE.R2 score 前言 平均绝对误差(MAE) 均方误差(MSE) 均方根误 ...

  2. ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介、使用方法、代码实现、案例应用之详细攻略

    ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介.使用方法.代码实现.案例应用之详细攻略 目录 回归预测问题中评价指标简介 RMSE 标准差SD MSE函数

  3. 预测评价指标:MSE,RMSE,MAE,MAPE,SMAPE

    目录 前言 MSE RMSE MAPE SMAPE Python程序 前言 分类问题的评价指标是准确率,回归算法的评价指标是MSE,RMSE,MAE.测试数据集中的点,距离模型的平均距离越小,该模型越 ...

  4. 回归模型评价指标-SST、SSR、SSE、R-square

    本文介绍了回归模型在模型选择上的常见评估指标:SST.SSR.SSE和R-square. SST:The sum of squares total SSR:The sum of squares reg ...

  5. 【机器学习】回归模型评价指标原理与基于sklearn的实现

    1 前言 回归任务是机器学习中常见的任务,特别是涉及到具体的发电量预测.风力预测等工业任务时,有非常多的应用场景.回归任务不同于分类任务,回归任务的预测值一般是连续的数,分类任务的预测值则是离散的值( ...

  6. 决定系数 均方误差mse_【机器学习】回归误差:MSE、RMSE、MAE、R2、Adjusted R2 +方差、协方差、标准差(标准偏差/均方差)、均方误差、均方根误差(标准误差)、均方根解释...

    我们通常采用MSE.RMSE.MAE.R2来评价回归预测算法. 1.均方误差:MSE(Mean Squared Error) 其中, 为测试集上真实值-预测值. def rms(y_test, y): ...

  7. 决定系数 均方误差mse_误差分析计算公式及其 matlab 代码实现(mse、mape、rmse等)...

    Loading... ## 残差平方和(SSE) ### 计算公式: ![sse](https://lpg-it.gitee.io/image/img/other/sse.png) ### 代码实现: ...

  8. 回归拟合中的基本概念和公式汇编(SSE, MSE, RMSE, RMS, STD, 方差, SSR, SST, R-square, Adjusted_R-squ, 相关度)

    1.概念 SSE(和方差.残差平方和) :The sum of squares due to error,该统计参数计算的是拟合数据和原始数据对应点的误差的平方和.SSE越接近于0,说明模型选择和拟合 ...

  9. SSE,MSE,RMSE,R-square指标讲解

    from: https://blog.csdn.net/danmeng8068/article/details/80143306 SSE(和方差.误差平方和):The sum of squares d ...

最新文章

  1. 关于笔记本键盘错乱的原因及解决办法
  2. Matlab中disp、fprintf和sprintf
  3. python 终端打印表格--------pylsy 源码
  4. business man
  5. mysql 从库 read only_mysql salve从库设置read only 属性
  6. python文本筛选html_python 正则表达式过滤文本中的html标签 源代码解析
  7. Android 中的拿来主义(编译,反编译,AXMLPrinter2,smali,baksmali)!
  8. 50道Java线程面试题分析及答案
  9. LeetCode 201. 数字范围按位与
  10. 傅盛希望定义AI时代的机器人产品,2年交出这份可落地答卷
  11. Kubernetes详解(十九)——Kubernetes Pod控制器
  12. 小程序消息订阅发送功能教程
  13. 英语语法特殊句型刷题总结
  14. 工业物联网企业logo设计思路分析
  15. 基于vivado实现FFT/IFFT
  16. 简单静态web页面+动画(小案例)
  17. Android开发之保存图片到相册的三种方法详解
  18. java计算机毕业设计校园环境保护监督系统源程序+mysql+系统+lw文档+远程调试
  19. 产品经理必懂的技术那点事儿(中)
  20. 在Linux系统下玩《炉石传说:魔兽英雄传》

热门文章

  1. UML中符号的意义(转)
  2. IE7的web标准之道——7:(修正)float双倍margin bug
  3. 安装VM虚拟机提示 尝试创建目录 C:\Public\documents\SharedVirtual Machines 时发生错误解决方法
  4. jQuery使用blur()方法触发两次的解决方法
  5. 如何在不使用任何图像或跨度标签的情况下通过CSS在UL / LI html列表中设置子弹颜色[复制]
  6. 如何在现有的ul中添加li?
  7. 测试嵌套JavaScript对象键的存在
  8. Objective-C中的复制忍者卡卡西---NSProxy
  9. rsync同步操作 、 发布rsync共享 、 inotify实时同步 、 Split分离解析
  10. Truncate a string