混淆矩阵

混淆矩阵是一种特定的矩阵用来呈现算法性能的可视化效果,通常用于二分类模型。其每一列代表预测值,每一行代表的是实际的类别。

其实就是把所有类别的预测结果与真实结果按类别放置到了同一个表里,在这个表格中我们可以清楚看到每个类别正确识别的数量和错误识别的数量。

TP :预测为正样本,实际也是正样本。
FP :预测为正样本,实际是负样本。
FN :预测为负样本,实际是正样本。
TN :预测为负样本,实际也是负样本。

准确率

准确率是指我们的模型预测正确的结果所占的比例。

精确率

所有预测为正样本的集合中预测正确的比例,精确度告诉我们,实际上有多少正确预测的案例是肯定的。

召回率

召回率告诉我们可以使用模型正确预测多少实际阳性病例。

F1 值

实际上,当我们尝试提高模型的精度时,召回率会下降,反之亦然。F1分数以单个值捕获了两种趋势。F1得分是Precision和Recall的谐波平均值,因此它给出了关于这两个指标的组合思想。当Precision等于Recall时,最大值。

ROC & AUC


对于预测出的概率值和它们的真实label,当取不同阈值时,会得到很多的坐标 (x,y),把这些点都连接起来就是ROC曲线。

auc值是roc曲线下的面积,从定义就能看出,对于同一个 x,我们希望 y 越大越好,也就是说,在 FP 固定的时候,模型中 TP 越高 AUC 值就越高,所以 AUC 值很在乎正样本的准确率,当数据比例不平衡时,我们的模型很可能偏向预测样本数更多的负样本,虽然这时准确率和 log损失 看着都不错,可是 AUC 值却不理想。

log损失

log损失反映了样本的平均偏差,经常作为模型的损失函数来做优化,可是,当训练数据正负样本不平衡时,比如我们经常会遇到正样本很少,负样本很多的情况,我们更希望在控制 FP 的情况下检出更多的正样本,若不做任何处理,则降低LogLoss会倾向于偏向负样本一方,此时LogLoss很低,可正样本的检出效果却并不理想。

MAE

平均绝对误差(Mean Absolute Error),观测值与真实值的误差绝对值的平均值。

MSE

均方误差(MSE)是最常用的回归损失函数,计算方法是求预测值与真实值之间距离的平方和。

MAE对于异常值比MSE更稳定,相对于使用MAE计算损失,使用MSE的模型会赋予异常点更大的权重。如果异常点代表在商业中很重要的异常情况,并且需要被检测出来,则应选用MSE损失函数。相反,如果只把异常值当作受损数据,则应选用MAE损失函数。

R方

RMSE和MAE有局限性:同一个算法模型,解决不同的问题,不能体现此模型针对不同问题所表现的优劣。因为不同实际应用中,数据的量纲不同,无法直接比较预测值,因此无法判断模型更适合预测哪个问题。方案:将预测结果转换为准确度,结果都在[0, 1]之间,针对不同问题的预测准确度,可以比较并来判断此模型更适合预测哪个问题;

机器学习:模型评价指标总结相关推荐

  1. 混淆矩阵评价指标_机器学习模型评价指标 -- 混淆矩阵

    机器学习模型评价指标 – 混淆矩阵 在机器学习领域中,混淆矩阵(confusion matrix)是一种评价分类模型好坏的形象化展示工具.其中,矩阵的每一列表示的是模型预测的样本情况:矩阵的每一行表示 ...

  2. 机器学习模型评价指标 -- 混淆矩阵

    机器学习模型评价指标 – 混淆矩阵 在机器学习领域中,混淆矩阵(confusion matrix)是一种评价分类模型好坏的形象化展示工具.其中,矩阵的每一列表示的是模型预测的样本情况:矩阵的每一行表示 ...

  3. 机器学习模型评价指标及拟合概念

    机器学习模型评价指标及拟合概念 一.机器学习模型评价指标 回归问题等连续值的差值的判断 1) MAE平均绝对误差: 2)MSE均方误差: 3)RMSE均方根误差: 4)R平方: 分类问题 1)混淆矩阵 ...

  4. 机器学习模型评价指标一览

    本文有Mcgill大学本科,waterloo大学硕士生林羿在圣一信息技术有限公司实习时,所做的收集. 在这篇文档里,我们会介绍一些常用的机器学习模型评价指标.这些指标会根据模型的目标而分成以下两类: ...

  5. 机器学习模型评价指标及R实现

    1.ROC曲线 考虑一个二分问题,即将实例分成正类(positive)或负类(negative).对一个二分问题来说,会出现四种情况.如果一个实例是正类并且也被 预测成正类,即为真正类(True po ...

  6. R语言︱机器学习模型评价指标+(转)模型出错的四大原因及如何纠错

    笔者寄语:机器学习中交叉验证的方式是主要的模型评价方法,交叉验证中用到了哪些指标呢? 交叉验证将数据分为训练数据集.测试数据集,然后通过训练数据集进行训练,通过测试数据集进行测试,验证集进行验证. 模 ...

  7. 机器学习模型评价指标+模型出错的四大原因及如何纠错

    笔者寄语:机器学习中交叉验证的方式是主要的模型评价方法,交叉验证中用到了哪些指标呢? 交叉验证将数据分为训练数据集.测试数据集,然后通过训练数据集进行训练,通过测试数据集进行测试,验证集进行验证. 模 ...

  8. 机器学习模型评价指标分析

    背景:近期主要是在ROC曲线上的问题,数据集是titanic.heart disease 以及python自带的数据集iris 参考链接1:混淆矩阵(https://blog.csdn.net/sea ...

  9. 机器学习模型评价指标:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线

    转自机器学习:准确率(Precision).召回率(Recall).F值(F-Measure).ROC曲线.PR曲线 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召 ...

  10. 机器学习分类模型评价指标之ROC 曲线、 ROC 的 AUC 、 ROI 和 KS

    前文回顾: 机器学习模型评价指标之混淆矩阵 机器学习模型评价指标之Accuracy.Precision.Recall.F-Score.P-R Curve.AUC.AP 和 mAP 图裂的话请参考:ht ...

最新文章

  1. Codeforces Round #539 (Div. 2) C. Sasha and a Bit of Relax
  2. jvm简单笔记(3)
  3. convex function
  4. IOS基础之绘图函数的使用
  5. hash进阶:使用字符串hash乱搞的姿势
  6. 微服务最佳实践 【已翻译100%】
  7. MDT捕捉镜像提示错误
  8. 使用Altium Designer绘制电路原理图
  9. Ubuntu 12 ssh 安装 终端命令 报软件依赖 错误(未解决)
  10. 杭州好玩景点攻略198
  11. oracle的执行图标不见了,开始菜单oracle集成管理工具的图标没了怎么办
  12. 托福百日冲刺—词汇(14)
  13. Python.习题六 字典与集合(上)
  14. .pdm打开软件powerdesigner良心文章
  15. 如何看待国企纷纷卸载微软Office改用金山WPS?
  16. 哈夫曼编码树的经典题目
  17. 计算机操作系统-文件管理
  18. 6.网络基础-Network Monitor和Httpwatch工具
  19. 魔法宝石(思维啊……)
  20. win7文件夹工作组指定计算机共享,Win7工作组局域网文件共享需启动的服务

热门文章

  1. opencart之购物车立即购买
  2. 【unity】性能优化之——视锥体剔除(Frustum Culling)(一)
  3. OpenHarmony编译系统
  4. 转载:主外键关联删除(on delete set null和on delete cascade)
  5. mysql 表锁和行锁
  6. 长春哪个学校可以学习计算机编程的,长春编程学习,长春学编程的学校,长春学编程自学好还是报班好 - IT教育频道...
  7. 地热井监测控制系统解决方案
  8. [Andoid][踩坑]CTS 11_r3开始出现的testBootClassPathAndSystemServerClasspath_nonDuplicateClasses FAIL问题分析
  9. 知三点求平面 || 点到平面的距离
  10. navicat 解析sql_使用 Navicat 查询分析器优化查询性能(第 2 部分)