机器学习中回归问题的性能衡量指标
回归问题的典型性能指标是均方根误差(RMSE),它测量的是预测过程中,预测错误的标准偏差(标准偏差是方差的算术平方根,而方差是离均平方差的平均数)。
例如,RMSE等于50000就意味着,系统的预测值中约68%落在50000美元之内,约95%落在100000美元之内(一种常见的特征分布是呈钟形态的分布,称为正态分布(也叫高斯分布),“68-95-99.7”的规则是指:大约68%的值落在1σ\sigmaσ,95%落在2σ\sigmaσ,99.7%落在3σ\sigmaσ内)。
RMSE的数学计算公式为RMSE(X,h)=1m∑i=1m(h(Xi)−yi)2RMSE(X,h)=\sqrt{\frac{1}{m}\sum_{i=1}^m(h(X^{i})-y^{i})^2}RMSE(X,h)=m1i=1∑m(h(Xi)−yi)2即使RMSE通常是回归任务的首选性能衡量指标,但在某些情况下,其它函数可能会更适合。例如,当有很多离群区域时,你可以考虑使用平均绝对误差(也称为平均绝对偏差,公式如下所示)MAE(X,h)=1m∑i=1m∣h(xi)−yi∣MAE(X,h)=\frac{1}{m}\sum_{i=1}^m|h(x^{i})-y^{i}|MAE(X,h)=m1i=1∑m∣h(xi)−yi∣
均方根误差和平均绝对误差两种方法都是测量两个向量之间的距离:预测向量和目标值向量。距离或者范数的测度可能有多种:
- 计算平方和的根(RMSE)对应欧几里得范数,也称为ι2\iota _2ι2范数,记作∣∣⋅∣∣2||\cdot ||_2∣∣⋅∣∣2(或者∣∣⋅∣∣||\cdot ||∣∣⋅∣∣)。
- 计算绝对值的总和(MAE)对应ι1\iota_1ι1范数,记作∣∣⋅∣∣1||\cdot||_1∣∣⋅∣∣1。有时它也被称为曼哈顿距离,因为它在测量一个城市的两点之间的距离时,只能沿着正交的城市街区行走。
- 更笼统地说,包含n个元素的向量vkv_kvk的范数可以定义为∣∣v∣∣k=(∣v0∣k+∣v1∣k+...+∣vn∣k)1k||v||_k=(|v_0|^k+|v_1|^k+...+|v_n|^k)^{\frac{1}{k}}∣∣v∣∣k=(∣v0∣k+∣v1∣k+...+∣vn∣k)k1。
- 范数指数越高,则越关注大的价值,忽视小的价值。这就是为什么RMSE比MAE对异常值更敏感。但是当异常值非常稀少(例如钟形曲线)时,RMSE的表现优异,通常作为首选。
机器学习中回归问题的性能衡量指标相关推荐
- ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介、使用方法、代码实现、案例应用之详细攻略
ML之ME/LF:机器学习中回归预测模型评估指标(MSE/RMSE/MAE)简介.使用方法.代码实现.案例应用之详细攻略 目录 回归预测问题中评价指标简介 RMSE 标准差SD MSE函数
- Mysql性能衡量指标
性能衡量指标 TPS Transactions Per Second(每秒传输的事务处理个数),这里指服务器每秒处理的事务数,支持事务的存储引擎如InnoDB等特有的一个性能指标. QPS Queri ...
- 性能衡量指标-吞吐量与响应时间
吞吐量(Throughput) 吞吐量用来衡量系统总体性能.对于事务处理系统来说,吞吐量通常通过TPS(每秒事务数)或TPM(每分钟事务数)来衡量. 根据定义可以看到通过数量反应问题一个指标. 吞吐量 ...
- 软件程序性能衡量指标
如果抛开所有的内部技术因素,我们只看应用程序的性能指标,那么一般来说,程序的性能大体可以通过以下几个方面来衡量. n 响应时间:系统对用户行为或者事件做出响应的时间.响应时间越短,性能一定越好,所以我 ...
- 机器学习中ROC曲线和AUC评估指标
目录 1.真正例率(TPR )与 假正例率(FPR)定义 2.ROC曲线(接受者操作特性曲线,receiver operating characteristic curve) 3.AUC(ROC曲线下 ...
- 机器学习中的三对性能度量参数
文章目录 1 分类结果混淆矩阵 2 错误率和精度 3 查准率P和查全率R 4 真正例率TPR和假正例率FPR 1 分类结果混淆矩阵 2 错误率和精度 错误率:分类错误的样本数占样本总数的比例 精度:分 ...
- 网络性能衡量指标总结
- 机器学习中的数学意义
机器学习中的用于声称性能的指标标准很少被讨论.由于在这个问题上似乎没有一个明确的.广泛的共识,因此我认为提供我一直在倡导并尽可能遵循的标准可能会很有趣.它源于这个简单的前提,这是我的科学老师从中学开始 ...
- 【理论 | 代码】机器学习分类与回归性能评估指标大全
一.回归指标 1.1 均方误差(Mean Squared Error, MSE) MSE 称为均方误差,又被称为 L2 范数损失,该统计参数是预测数据和原始数据对应点误差的平方和的均值,公式如下: M ...
最新文章
- java 线程相关的属性介绍
- 2021阿里全球数学竞赛获奖名单出炉!北大获奖人数最多!
- 机构押注ABS云平台 融资成本下降1%~3%
- C# 3.0入门系列
- NOIP2018退役记
- 【atcoder】GP 2 [agc036C]
- 论文笔记(3)-Extracting and Composing Robust Features with Denoising Autoencoders
- MySQL工作笔记-解决导入外部sql中文乱码问题
- Developer's Guide to Microsoft Enterprise Library, C# Edition
- 洛谷 P4017 最大食物链计数
- EF+MYSQL 闪退
- 思科路由器IOS备份和恢复
- 【Java】java.lang.Object
- 模拟NAND FLASH 读写BCH ECC校验
- 基于STM32的RGB调色器——STM32程序和Qt上位机全开源
- TCP/IP五层模型详解
- 基于飞凌FETA40i-C核心板在光时域反射仪中的应用原理
- 设置linux 自动定时重启
- RISC-V基金会董事谭章熹:RISC-V,从边缘逐渐向中央扩展
- 公众号话题标签怎样添加