转自:http://charleshm.github.io/2016/03/Model-Performance/

分类

混淆矩阵1

  • True Positive(真正, TP):将正类预测为正类数.
  • True Negative(真负 , TN):将负类预测为负类数.
  • False Positive(假正, FP):将负类预测为正类数 → 误报 (Type I error).
  • False Negative(假负 , FN):将正类预测为负类数 → 漏报 (Type II error).

精确率(precision)定义为:

P=TP / (TP+FP)

需要注意的是精确率(precision)和准确率(accuracy)是不一样的,

ACC=TP+TN/ (TP+TN+FP+FN)

在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点击)acc 也有 99% 以上,没有意义。

召回率(recall,sensitivity,true positive rate)定义为:

R=TP/TP+FN

此外,还有 F1 值,是精确率和召回率的调和均值

2 / F1=1 / P+1 / RF1=2TP/ (2TP+FP+FN)

精确率和准确率都高的情况下,F1 值也会高。


通俗版本

刚开始接触这两个概念的时候总搞混,时间一长就记不清了。

实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP)。

召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。


在信息检索领域,精确率和召回率又被称为查准率和查全率,

查准率=检索出的相关信息量检索出的信息总量查全率=检索出的相关信息量系统中的相关信息总量


ROC 曲线

我们先来看下维基百科的定义,

In signal detection theory, a receiver operating characteristic (ROC), or simply ROC curve, is a graphical plot which illustrates the performance of a binary classifier system as its discrimination threshold is varied.

比如在逻辑回归里面,我们会设一个阈值,大于这个值的为正类,小于这个值为负类。如果我们减小这个阀值,那么更多的样本会被识别为正类。这会提高正类的识别率,但同时也会使得更多的负类被错误识别为正类。为了形象化这一变化,在此引入 ROC ,ROC 曲线可以用于评价一个分类器好坏。

ROC 关注两个指标,

true positive rate:TPR=TP / TP+FNfalse positive rate:FPR=FP / FP+TN

直观上,TPR 代表能将正例分对的概率,FPR 代表将负例错分为正例的概率。在 ROC 空间中,每个点的横坐标是 FPR,纵坐标是 TPR,这也就描绘了分类器在 TP(真正率)和 FP(假正率)间的 trade-off2


AUC

AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。

The AUC value is equivalent to the probability that a randomly chosen positive example is ranked higher than a randomly chosen negative example.

翻译过来就是,随机挑选一个正样本以及一个负样本,分类器判定正样本的值高于负样本的概率就是 AUC 值。

简单说:AUC值越大的分类器,正确率越高3

  • AUC=1,完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测。绝大多数预测的场合,不存在完美分类器。
  • 0.5<AUC<1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
  • AUC=0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。
  • AUC<0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测,因此不存在 AUC<0.5 的情况。

既然已经这么多评价标准,为什么还要使用ROC和AUC呢?因为ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反)


回归4

平均绝对误差

平均绝对误差MAE(Mean Absolute Error)又被称为 l1 范数损失(l1-norm loss):

MAE(y,ˆy)=1nsamplesnsamples∑i=1|yi−ˆyi|


平均平方误差

平均平方误差 MSE(Mean Squared Error)又被称为 l2 范数损失(l2-norm loss):

MSE(y,ˆy)=1nsamplesnsamples∑i=1(yi−ˆyi)2


  1. 统计学习方法 ↩

  2. ROC和AUC介绍以及如何计算AUC ↩

  3. AUC与ROC - 衡量分类器的好坏 ↩

  4. 机器学习评价指标大汇总 ↩

机器学习性能评估指标(综合性总结)相关推荐

  1. 机器学习性能评估指标汇总

    机器学习性能评估指标汇总 Accuracy:准确率 Precision:精确率 / 查准率 Recall:召回率 / 查全率 F1 score:F1 值 PR:查准率.查全率曲线 ROC:真正率.假正 ...

  2. auuc 评估指标_机器学习性能评估指标汇总

    跑完分类模型(Logistic回归.决策树.神经网络等),我们经常面对一大堆模型评估的报表和指标,如ACC.ROC.AUC等,对以上提到的各个评估指标逐一点评,并力图表明: 指标分类 学习分类 性能指 ...

  3. 【理论 | 代码】机器学习分类与回归性能评估指标大全

    一.回归指标 1.1 均方误差(Mean Squared Error, MSE) MSE 称为均方误差,又被称为 L2 范数损失,该统计参数是预测数据和原始数据对应点误差的平方和的均值,公式如下: M ...

  4. auuc 评估指标_分类之性能评估指标

    本文主要介绍几种常用的用于分类的性能评估指标,同时介绍如何绘制ROC曲线以及计算AUC值的便捷方法.最后再附上一个绘制ROC曲线和计算AUC的Python源码实现. Precision和Recall ...

  5. 机器学习模型评估指标总结!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:太子长琴,Datawhale优秀学习者 本文对机器学习模型评估指标 ...

  6. 【机器学习基础】非常详细!机器学习模型评估指标总结!

    作者:太子长琴,Datawhale优秀学习者 本文对机器学习模型评估指标进行了完整总结.机器学习的数据集一般被划分为训练集和测试集,训练集用于训练模型,测试集则用于评估模型.针对不同的机器学习问题(分 ...

  7. 机器学习 | 分类评估指标

    文章目录 1. 分类评估指标 1.1 混淆矩阵 Confusion Matrix 1.1.1 scikit-learn 混淆矩阵函数接口 1.2 真阳性TP.假阳性FP.真阴性TN.假阴性FN 1.2 ...

  8. 机器学习模型评估指标ROC、AUC详解

    我是小z ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到).其实,理解它并不是非常难,但是好多朋友都遇到了一个相同的问题,那就是:每次看书的时候都很明白,但回过 ...

  9. 16_非监督学习、k-means 4阶段、kmeans API、Kmeans性能评估指标、案例

    1.聚类算法介绍 关于聚类算法,可以查看:常见的六大聚类算法 2.k-means 4阶段 K-means通常被称为劳埃德算法,这在数据聚类中是最经典的,也是相对容易理解的模型.算法执行的过程分为4个阶 ...

最新文章

  1. asp.net面试的代码题目
  2. Linux查看和剔除当前登录用户详细教程
  3. 【Nginx】 server 配置记录
  4. Eschool校园网平台介绍
  5. 一个没有好好的适应本土市场的失败的案例
  6. 当年我见过最烂的上网行为审计产品
  7. Flex 常见问题解答(from MM)
  8. 手动加载spring, ApplicationContext怎么销毁
  9. python书写风格_以下两种风格 Python 写法,请问大家倾向哪种:)
  10. 【Python】xlwt和xlrd模块写入和读取.xls版本EXCEL
  11. 网络中最常用的网络命令(5)-完整参数
  12. MyBatis Generator(MBG)设计哲学与致歉
  13. 使用TortoiseGit提交代码到github上
  14. HTML+CSS基础学习:HTML
  15. Vue+element ui+springboot实现用户头像修改
  16. [自我介绍]第一篇博客
  17. 世界坐标系、相机坐标系、图像平面坐标系
  18. WordPress和October
  19. 2014,为了梦想宁愿破釜沉舟
  20. unity3D中导出webgl并使用js进行交互

热门文章

  1. 【CF1344D】Résumé Review【数学】【二分】
  2. 思维--找规律--Codeforces Round #645 (Div. 2) c题
  3. Acwing 276. I-区域
  4. Codeforces Round #721 (Div. 2)
  5. 牛客题霸 [滑动窗口的最大值] C++题解/答案
  6. 笛卡尔树详解带建树模板及例题运用(Largest Submatrix of All 1’s,洗车 Myjnie,Removing Blocks,SPOJ PERIODNI)
  7. [NOI2021 day1]轻重边(树链剖分),路径交点(矩阵行列式)
  8. YBTOJ洛谷P2042:维护数列(平衡树)
  9. CF1286D-LCC【动态dp,数学期望】
  10. CF1556D-Take a Guess【交互】