一个房价预测的任务,老板说你看看这个模型咋样?
我们先绘制一个坐标轴: Y 轴为房价,X 轴为年份。将过去房价数据绘制为绿色,回归模型绘制为蓝色。
关键问题是,怎么知道这个模型的好坏呢?

为了评估该模型的效果,一般会有几个指标:

一、平均绝对误差 Mean Absolute Error,MAE

平均绝对误差 MAE,也叫平均绝对离差。
这个指标在计算时,先对真实值与预测值的距离(橙色线段长度)求和,再取平均值。

用公式表示:
MAE=1m∑i=1m∣f(xi)−yi∣MAE=\frac{1}{m}\sum_{i=1}^{m}|f(x_i)-y_i|MAE=m1​∑i=1m​∣f(xi​)−yi​∣
其中,

  • f(xi)f(x_i)f(xi​):预测值
  • yiy_iyi​:真实值
  • mmm:数据量

平均绝对误差可以准确地反映实际预测误差的大小,但是,MAE 有个致命的缺点。
我们现在把左边的 Y 轴缩小 1000 倍,也就是 从 1000 -> 1。
接下来,计算 MAE:

  • 数据集范围大会计算获得较大的 MAE。
  • 数据集范围小会计算获得较小的 MAE。


可以看到,回归模型拟合没有变化,但是MAE 会随着数据的范围有较大的变化,也就说 MAE 指标不能显示回归模型拟合是优还是劣。

二、平均绝对百分误差 Mean Absolute Percentage Error,MAPE

为了解决以上问题,**平均绝对百分误差 **对 MAE 改进后,通过计算真实值与预测的误差百分比避免了数据范围大小的影响:
MAPE=100m∑i=1m∣yi−f(xi)yi∣MAPE=\frac{100}{m}\sum_{i=1}{m}|\frac{y_i-f(x_i)}{y_i}|MAPE=m100​∑i=1​m∣yi​yi​−f(xi​)​∣
该指标可以用于评估回归模型的性能优劣,常用于衡量预测准确性指标,一般 MAPE < 10 认为是较好的模型。
但是,如果真实值有 0,那么 MAPE 无法正确计算。

三、均方误差 MSE

现在对平均绝对误差求平方根,就能得到均方误差Mean Square Error,MSE)。
这个指标在计算时,先对真实值与预测值的距离平方(橙色面积)后求和,再取平均值。

公式表示:
MSE=1m∑i=1m(f(xi)−yi)2MSE=\frac{1}{m}\sum_{i=1}^{m}(f(x_i)-y_i)^2MSE=m1​∑i=1m​(f(xi​)−yi​)2

该指标避免了 MAE 的绝对值导致函数不能求导的问题,因此均方误差常用于线性回归的损失函数。
另一方面,均方误差可以通过平方来放大预测偏差较大的值,提高了检测灵敏度。

四、均方根误差 Root-Mean-Square Error,RMSE

均方根误差,也称标准误差,是在均方误差的基础上进行开方运算,常用于衡量观测值与真实值间的偏差。

以上提到的 MAE、MSE、MAPE,RMSE 都会计算均值,它可以消除样本数量对评价指标的影响,使得评估指标的大小不会太依赖于样本数量,而是更多地反映模型的误差。

五、决定系数R2ScoreR^2 ScoreR2Score

该指标需要了解另外三个指标:

Sum of Squares of the Regression,SSR

计算预测数据与真实数据均值之差的平方和,反映的是模型数据相对真实数据均值的离散程度
SSR=∑i=1m(f(xi)−y‾)2SSR=\sum_{i=1}^{m}(f(x_i)-\overline y)^2SSR=∑i=1m​(f(xi​)−y​)2

Total Sum of Squares,SST

计算真实数据和其均值之差的平方和,反映的是真实数据相对均值的离散程度

SST=∑i=1m(yi−y‾)2SST=\sum_{i=1}^{m}(y_i-\overline y)^2SST=∑i=1m​(yi​−y​)2

Sum of Squares for Error,SSE

真实数据和预测数据之差的平方和
SSE=∑i=1m(f(xi)−yi)2SSE=\sum_{i=1}^{m}(f(x_i)-y_i)^2SSE=∑i=1m​(f(xi​)−yi​)2
细心的小伙伴可能注意到,SST = SSR + SSE

决定系数R2R^2R2

决定系数R2R^2R2通过计算SSR 与 SST的比值,反应因变量 y 的全部变异能通过回归模型被自变量 x 解释的比例。比如,R2R^2R2为0.9,则表示回归关系可以解释因变量 90% 的变异。

  • 决定系数R2越高,越接近于1,模型的拟合效果就越好
  • 决定系数R2越接近于0,回归直线拟合效果越差。

R2R^2R2虽然可以评价回归模型效果,但会随着自变量数量的不断增加而改变。

六、校正决定系数

校正决定系数在决定系数R平方的基础上考虑了样本数量和特征数量的影响。自变量越多,校正决定系数就会对自变量进行处罚,所以一般校正决定系数小于决定系数。

R‾2=1−(1−R2)(m−1)m−n−1\overline R^2 = 1- \frac{(1-R^2)(m-1)}{m-n-1}R2=1−m−n−1(1−R2)(m−1)​
其中,

  • m 表示样本量
  • n 表示解释变量总数

需要注意的是,决定系数和矫正决定系数都是基于均值进行计算,如果数据集中有异常点存在,会对该指标有较大的影响。也就是说,这两个指标对异常点较敏感,因此它们更适用于噪声较少的数据集。
对于噪声较多的数据集可以考虑 MAE,MAPE 来作为评估指标。

图解机器学习之回归模型性能评估指标相关推荐

  1. [机器学习与scikit-learn-51]:模型评估-图解回归模型的评估指标MSE、MAE、RMSE、R2、RSS与代码示例

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

  2. R语言使用xgboost包拟合xgboost回归模型、使用predict函数和训练好的模型进行预测推理、计算回归模型的评估指标MAE、MSE、RMSE

    R语言使用xgboost包拟合xgboost回归模型.使用predict函数和训练好的模型进行预测推理.计算回归模型的评估指标MAE.MSE.RMSE 目录

  3. R语言使用lm函数拟合多项式回归模型:使用predict函数和训练好的模型进行预测推理、计算回归模型的评估指标MAE、MSE、RMSE、R方等指标

    R语言使用lm函数拟合多项式回归模型:使用predict函数和训练好的模型进行预测推理.计算回归模型的评估指标MAE.MSE.RMSE.R方等指标 目录

  4. 回归和分类模型性能评估指标MSE,MAE,PR,ROC,AUC

    文章目录 0. 模型评估是什么,为什么 1. 不同类型问题的评估指标 1.1 回归问题 1.2 分类问题 1.2.1 准确率和错误率 1.2.2 精确率和召回率 1.2.3 PR曲线图 1.2.4 F ...

  5. 常用于评价回归模型优劣的统计量包括( )。_第四十一讲 R-判断回归模型性能的指标...

    当回归模型建立好以后,如何评价该回归模型是否与另一个回归模型有区别,如何比较两个回归模型的性能?这一讲中,我们将给大家介绍几个评价回归模型性能的统计指标. 1. 模型性能指标 在回归模型中,最常用的评 ...

  6. 【理论 | 代码】机器学习分类与回归性能评估指标大全

    一.回归指标 1.1 均方误差(Mean Squared Error, MSE) MSE 称为均方误差,又被称为 L2 范数损失,该统计参数是预测数据和原始数据对应点误差的平方和的均值,公式如下: M ...

  7. R语言构建logistic回归模型并评估模型:构建基于混淆矩阵计算分类评估指标的自定义函数、阳性样本比例(垃圾邮件比例)变化对应的分类器性能的变化、基于数据阳性样本比例选择合适的分类评估指标

    R语言构建logistic回归模型并评估模型:构建基于混淆矩阵计算分类评估指标的自定义函数.阳性样本比例(垃圾邮件比例)变化对应的分类器性能的变化.基于数据阳性样本比例选择合适的分类评估指标 目录

  8. 机器学习性能评估指标汇总

    机器学习性能评估指标汇总 Accuracy:准确率 Precision:精确率 / 查准率 Recall:召回率 / 查全率 F1 score:F1 值 PR:查准率.查全率曲线 ROC:真正率.假正 ...

  9. 机器学习 模型性能评估_如何评估机器学习模型的性能

    机器学习 模型性能评估 Table of contents: 目录: Why evaluation is necessary?为什么需要评估? Confusion Matrix混淆矩阵 Accurac ...

最新文章

  1. BT:大豆皮堆肥过程中的物质转化、微生物群落组成和代谢功能演替
  2. 实现虚拟xp与主机xp之间的文件共享
  3. 5G:4G到5G的演进,整体网络架构的主要区别。
  4. 以操作系统的角度述说线程与进程
  5. 常见的误解:这会创建多少个对象?
  6. shopify在哪里填写html,[Shopify开店教程]添加嵌入代码
  7. (08)Verilog HDL同步复位
  8. flutter 的gradle下载不了怎么办
  9. Nugine: Rust 性能调优
  10. cognos 10 oracle,Cognos10.2.1安装配置手册.docx
  11. Verilog4选1数据选择器与2选1数据选择器仿真波形对比
  12. 【谷粒商城】全网最全笔记(1/4)
  13. 两个路由器的有线桥接与无线桥接
  14. 【项目二、蜂巢检测项目】二、模型改进:YOLOv5s-ShuffleNetV2
  15. 简历中的工作经历要怎么写?
  16. 在一个子组件中调用另一个子组件的方法
  17. 【03月13日】建筑材料行业的估值高度排名
  18. 智能路灯引路冰蓄冷替空调
  19. 中国大学MOOC第10周编程题在线测试
  20. 【34个PMP项目实战案例5】如何提高团队的配合度

热门文章

  1. 3D中的方位和角位移(8)
  2. 在史蒂夫传中寻找现实扭曲力场2
  3. 35K入职华为Java岗那天,我哭了:这5个月做的一切都值了
  4. 【WIN10系统重装】重装WIN10的32位、64位系统
  5. Redis缓存(二)缓存淘汰策略,脏数据/脏页,缓存污染
  6. 解决windws 2003系统上网站不能访问, IIS 403 404问题
  7. 擅自修改金蝶k 3服务器密码,金蝶k3登陆常见问题.docx
  8. TCP/IP协议——TCP/IP协议栈及框架
  9. 矩阵的秩和图像的秩的一些了解
  10. 向量相似度的计算和向量夹角余旋的关系