回归问题的典型性能指标是均方根误差(RMSE),它测量的是预测过程中,预测错误的标准偏差(标准偏差是方差的算术平方根,而方差是离均平方差的平均数)。

例如,RMSE等于50000就意味着,系统的预测值中约68%落在50000美元之内,约95%落在100000美元之内(一种常见的特征分布是呈钟形态的分布,称为正态分布(也叫高斯分布),“68-95-99.7”的规则是指:大约68%的值落在1σ\sigmaσ,95%落在2σ\sigmaσ,99.7%落在3σ\sigmaσ内)。

RMSE的数学计算公式为RMSE(X,h)=1m∑i=1m(h(Xi)−yi)2RMSE(X,h)=\sqrt{\frac{1}{m}\sum_{i=1}^m(h(X^{i})-y^{i})^2}RMSE(X,h)=m1​i=1∑m​(h(Xi)−yi)2​即使RMSE通常是回归任务的首选性能衡量指标,但在某些情况下,其它函数可能会更适合。例如,当有很多离群区域时,你可以考虑使用平均绝对误差(也称为平均绝对偏差,公式如下所示)MAE(X,h)=1m∑i=1m∣h(xi)−yi∣MAE(X,h)=\frac{1}{m}\sum_{i=1}^m|h(x^{i})-y^{i}|MAE(X,h)=m1​i=1∑m​∣h(xi)−yi∣

均方根误差和平均绝对误差两种方法都是测量两个向量之间的距离:预测向量和目标值向量。距离或者范数的测度可能有多种:

  • 计算平方和的根(RMSE)对应欧几里得范数,也称为ι2\iota _2ι2​范数,记作∣∣⋅∣∣2||\cdot ||_2∣∣⋅∣∣2​(或者∣∣⋅∣∣||\cdot ||∣∣⋅∣∣)。
  • 计算绝对值的总和(MAE)对应ι1\iota_1ι1​范数,记作∣∣⋅∣∣1||\cdot||_1∣∣⋅∣∣1​。有时它也被称为曼哈顿距离,因为它在测量一个城市的两点之间的距离时,只能沿着正交的城市街区行走。
  • 更笼统地说,包含n个元素的向量vkv_kvk​的范数可以定义为∣∣v∣∣k=(∣v0∣k+∣v1∣k+...+∣vn∣k)1k||v||_k=(|v_0|^k+|v_1|^k+...+|v_n|^k)^{\frac{1}{k}}∣∣v∣∣k​=(∣v0​∣k+∣v1​∣k+...+∣vn​∣k)k1​。
  • 范数指数越高,则越关注大的价值,忽视小的价值。这就是为什么RMSE比MAE对异常值更敏感。但是当异常值非常稀少(例如钟形曲线)时,RMSE的表现优异,通常作为首选。

机器学习中回归问题的性能衡量指标相关推荐

  1. ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介、使用方法、代码实现、案例应用之详细攻略

    ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介.使用方法.代码实现.案例应用之详细攻略 目录 回归预测问题中评价指标简介 RMSE 标准差SD MSE函数

  2. Mysql性能衡量指标

    性能衡量指标 TPS Transactions Per Second(每秒传输的事务处理个数),这里指服务器每秒处理的事务数,支持事务的存储引擎如InnoDB等特有的一个性能指标. QPS Queri ...

  3. 性能衡量指标-吞吐量与响应时间

    吞吐量(Throughput) 吞吐量用来衡量系统总体性能.对于事务处理系统来说,吞吐量通常通过TPS(每秒事务数)或TPM(每分钟事务数)来衡量. 根据定义可以看到通过数量反应问题一个指标. 吞吐量 ...

  4. 软件程序性能衡量指标

    如果抛开所有的内部技术因素,我们只看应用程序的性能指标,那么一般来说,程序的性能大体可以通过以下几个方面来衡量. n 响应时间:系统对用户行为或者事件做出响应的时间.响应时间越短,性能一定越好,所以我 ...

  5. 机器学习中ROC曲线和AUC评估指标

    目录 1.真正例率(TPR )与 假正例率(FPR)定义 2.ROC曲线(接受者操作特性曲线,receiver operating characteristic curve) 3.AUC(ROC曲线下 ...

  6. 机器学习中的三对性能度量参数

    文章目录 1 分类结果混淆矩阵 2 错误率和精度 3 查准率P和查全率R 4 真正例率TPR和假正例率FPR 1 分类结果混淆矩阵 2 错误率和精度 错误率:分类错误的样本数占样本总数的比例 精度:分 ...

  7. 网络性能衡量指标总结

  8. 机器学习中的数学意义

    机器学习中的用于声称性能的指标标准很少被讨论.由于在这个问题上似乎没有一个明确的.广泛的共识,因此我认为提供我一直在倡导并尽可能遵循的标准可能会很有趣.它源于这个简单的前提,这是我的科学老师从中学开始 ...

  9. 【理论 | 代码】机器学习分类与回归性能评估指标大全

    一.回归指标 1.1 均方误差(Mean Squared Error, MSE) MSE 称为均方误差,又被称为 L2 范数损失,该统计参数是预测数据和原始数据对应点误差的平方和的均值,公式如下: M ...

最新文章

  1. java 线程相关的属性介绍
  2. 2021阿里全球数学竞赛获奖名单出炉!北大获奖人数最多!
  3. 机构押注ABS云平台 融资成本下降1%~3%
  4. C# 3.0入门系列
  5. NOIP2018退役记
  6. 【atcoder】GP 2 [agc036C]
  7. 论文笔记(3)-Extracting and Composing Robust Features with Denoising Autoencoders
  8. MySQL工作笔记-解决导入外部sql中文乱码问题
  9. Developer's Guide to Microsoft Enterprise Library, C# Edition
  10. 洛谷 P4017 最大食物链计数
  11. EF+MYSQL 闪退
  12. 思科路由器IOS备份和恢复
  13. 【Java】java.lang.Object
  14. 模拟NAND FLASH 读写BCH ECC校验
  15. 基于STM32的RGB调色器——STM32程序和Qt上位机全开源
  16. TCP/IP五层模型详解
  17. 基于飞凌FETA40i-C核心板在光时域反射仪中的应用原理
  18. 设置linux 自动定时重启
  19. RISC-V基金会董事谭章熹:RISC-V,从边缘逐渐向中央扩展
  20. 公众号话题标签怎样添加

热门文章

  1. 你解决的问题比你编写的代码更重要! 1
  2. NodeJS管理利器 - pm2常用命令
  3. Java面试 - List和Set比较,各自的子类比较
  4. 安利几款语音识别软件
  5. 现代计算机模型要求程序在执行,大学计算机基础考试考点.doc
  6. Git 的安装及配置
  7. 为什么我们需要Q#?
  8. C#LeetCode刷题之#342-4的幂(Power of Four)
  9. 静态页面实现include
  10. Mac下matplotlib中文显示