分类评价指标概念辨析

  这些东西其实没什么难的,而且很多人肯定也是很早就接触过了,最大的问题在于时间长了记不住,所以就尽量解释的简单写,用于下次查阅使用。
  主要需要理解的就是二分类的指标。

  混淆矩阵中,横轴是样本真实标签,决定了样本是正例( P)还是负例(N),纵轴代表模型的估计标签。在辨析各种基本概念的时候,因为这些评价都是和真实标签进行对比。分类分对了就是真(T),分错了就是假(F),只需要把分对分错加到所分标签即可。分对了正例就叫TP,分对了负例就叫TN,显然分对了是矩阵对角线的元素。然后分类分错就叫F,分出来正例分错就叫FP,分出来负例分错了就叫FN。
  知道了这些概念就能很容易把概念和名字对应起来了,假阴(FN)率,真阳率(TP)。TPR自然就是真阳率,就是分对的正例占正例的比例。TPR=TP/PTPR=TP/PTPR=TP/P,假阳率虽然也有个阳,但是是假的,其实就是阴例,所以分母是所有的阴例,FPR=FP/NFPR=FP/NFPR=FP/N,这几个都是除以自己所在列的和。
  正确率就是分对的除总数,也就是T/T+FT/T+FT/T+F,总数也可以通过N+PN+PN+P计算,可以看到分对的其实就是主对角线。错误率就是分错的除总数,分错的就是副对角线。
  召回(Recall)率又叫查全率,意思就是分类正确的正例的占全部正例的比例,比例越高说明查的越全。Re=TP/(TP+FN)=TP/PRe=TP/(TP+FN)=TP/PRe=TP/(TP+FN)=TP/P。可以看到召回率又叫真阳率,又叫敏感度(Sensitive)。
  准确(Precision)率又叫查准率,就是看判别为正例的是否准确,Pr=TP/(TP+FP)=TP/YPr=TP/(TP+FP)=TP/YPr=TP/(TP+FP)=TP/Y。这里可以看到准确率和查全率的分子都是TP。
  在医学等相关行业会关注特异性(Specificity),所有负例被分对的比例,计算方式Sp=TN/TN+FP=TN/NSp=TN/TN+FP=TN/NSp=TN/TN+FP=TN/N。可以看到特异性又叫真阴率。
  如果把所有的样本逐个摊开,每次来一个样本,根据分类的结果算一次假阳(FP)率和真阳(TP)率,然后分别作为x,y轴描出一系列的点,这个时候就叫接受者操作特性(ROC)曲线(要注意两个指标的分母是不一样的,前者是F,后者是P)。然后这个曲线的面积就叫AUC(Area Under Curve)了,显然如果值越大,说明FPR和TPR都很好,通常这两者是矛盾的,如果都比较好,那模型基本是没问题了。

混淆矩阵及分类评价指标概念辨析相关推荐

  1. R语言使用randomForest包构建随机森林模型(Random forests)、使用importance函数查看特征重要度、使用table函数计算混淆矩阵评估分类模型性能、包外错误估计OOB

    R语言使用randomForest包中的randomForest函数构建随机森林模型(Random forests).使用importance函数查看特征重要度.使用table函数计算混淆矩阵评估分类 ...

  2. R语言使用rpart包构建决策树模型、使用prune函数进行树的剪枝、交叉验证预防过拟合、plotcp可视化复杂度、rpart.plot包可视化决策树、使用table函数计算混淆矩阵评估分类模型性能

    R语言使用rpart包构建决策树模型.使用prune函数进行树的剪枝.使用10折交叉验证选择预测误差最低的树来预防过拟合.plotcp可视化决策树复杂度.rpart.plot包可视化最终决策树.使用t ...

  3. R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型、分类预测器(分类变量)被自动替换为一组虚拟编码变量、summary函数查看检查模型、使用table函数计算混淆矩阵评估分类模型性能

    R语言使用R基础安装中的glm函数构建乳腺癌二分类预测逻辑回归模型(Logistic regression).分类预测器(分类变量)被自动替换为一组虚拟编码变量.summary函数查看检查模型.使用t ...

  4. R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵、并使用summary函数基于混淆矩阵输出分类模型评估的其它详细指标(kappa、npv等13个)

    R语言使用yardstick包的conf_mat函数计算多分类(Multiclass)模型的混淆矩阵(confusion matrix).并使用summary函数基于混淆矩阵输出分类模型评估的其它详细 ...

  5. java计算混淆矩阵(分类指标:查准率P,查全率R,P和R的调和均值F1,正确率A)

    [0]README 本文使用 java 计算混淆矩阵,并利用 混淆矩阵值计算 分类指标:通用分类指标有: 查准率,查全率,查准率和查全率的调和均值F1值,正确率, AOC, AUC等:本文计算前4个指 ...

  6. 混淆矩阵介绍以及评价指标(准确率,精确率,召回率,特异度,假警报率,G-mean,F1_score,KS值)

    混淆矩阵 混淆矩阵(Confusion Matrix),可以理解为就是一张表格.混淆这个名字还是很有内涵的,咳咳. 混淆矩阵是判断分类好坏程度的一种方法.另外还有ROC曲线和AUC曲线. 以分类模型中 ...

  7. 混淆矩阵及分类性能评估方法

    混淆矩阵: 公式:其中TPR又叫召回率Recall

  8. 机器学习(五)之评价指标:二分类指标、多分类指标、混淆矩阵、不确定性、ROC曲线、AUC、回归指标

    文章目录 0 本文简介 1 二分类指标 1.1 二分类时的错误类型 1.2 不平衡的数据 1.3 混淆矩阵 1.4 考虑不确定性 1.5 准确率-召回率曲线 1.6 ROC与AUC 2 多分类指标 3 ...

  9. 详细讲解分类模型评价指标(混淆矩阵)python示例

    前言 1.回归模型(regression): 对于回归模型的评估方法,通常会采用平均绝对误差(MAE).均方误差(MSE).平均绝对百分比误差(MAPE)等方法. 2.聚类模型(clustering) ...

最新文章

  1. Java-NIO(九):管道 (Pipe)
  2. location [=|$|最长原则|^~](nginx-1.4.4)
  3. Go 语言编程 — 项目布局规范
  4. 博客搬迁至网易博客 http://happyboy200032.blog.163.com
  5. 一个不错的资源共享微盘
  6. python字符串连接优先使用jion而非+
  7. JDK源码解析之 Java.lang.Short
  8. python判断文件是否打开_python如何判断一个文件是否处于打开状态?
  9. 在VB中使用Linq To SQLite注意事项
  10. Eclipse下设置github开发环境
  11. Delphi XE 10.2.3如何添加PDF阅读器组件
  12. python执行源程序的方式是_python源程序执行的方式
  13. uploadify php使用,如何在ThinkPHP中使用Uploadify对图片进行上传
  14. 计算机如何隐藏任务栏的程序,Win7隐藏任务栏
  15. 高一计算机课期中考试总结反思,期中考试总结与反思(精选25篇)
  16. 上海杉达学院计算机课程,上海杉达学院计算机科学与技术专业介绍
  17. php论坛搭建,PHP建设论坛:Discuz!论坛快速架设指南
  18. js:nodejs通过async异步提交事务数据
  19. 数值分析基础工具使用Matlab绘制双曲线
  20. 封装微信小程序api请求地址

热门文章

  1. Connection reset by peer解决方法
  2. 通过ES文件管理器用手机访问共享。
  3. 错误: 加载主类 时出现 LinkageError 解决办法
  4. ie11打不开吗html文件,ie11浏览器打不开怎么处理
  5. 左右箭头切换的tabs
  6. 更换NE40E-X16 的防尘网
  7. 新手上路,安全驾驶,做行车安全的第一责任人
  8. WORKNC 2022.1.2228_2022.10.30(免安装)
  9. 队列链式存储 - Java实现
  10. 论文阅读笔记 | On the Challenges of Geographical Avoidance for Tor(NDSS 2019)