在机器学习里面做一些分类任务时,经常会使用到一些评价指标,下面就一些常用的指标进行详细的说明。

上图表示为一个二分类的混淆矩阵(多分类同理,只需要把不属于当前类的其他类都考虑为负例),表格中的四个参数说明:

True Positive(TP):预测为正例,实际为正例

False Positive(FP):预测为正例,实际为负例

True Negative(TN):预测为负例,实际为负例

False Negative(FN):预测为负例,实际为正例

从这我们可以看出,TP和TN都是预测对了,FP和FN都是预测错了。

【计算公式】

【指标分析】
我们最容易搞混的就是accuracy和precision,好像两者都可以称为准确率,正确率,精度等等…其实我们不必要考究两者的中文称呼究竟是什么,搞清楚两者的含义自然就可以区分它们。首先,accuracy指的是正确预测的样本数占总预测样本数的比值,它不考虑预测的样本是正例还是负例。而precision指的是正确预测的正样本数占所有预测为正样本的数量的比值,也就是说所有预测为正样本的样本中有多少是真正的正样本。从这我们可以看出,precision只关注预测为正样本的部分,而accuracy考虑全部样本。

Recall可以称为召回率、查全率等等…我们也不考究如何翻译它,它指的是正确预测的正样本数占真实正样本总数的比值,也就是我能从这些样本中能够正确找出多少个正样本。

F-score相当于precision和recall的调和平均,用意是要参考两个指标。从公式我们可以看出,recall和precision任何一个数值减小,F-score都会减小,反之,亦然。

specificity指标平时见得不多,它是相对于sensitivity(recall)而言的,指的是正确预测的负样本数占真实负样本总数的比值,也就是我能从这些样本中能够正确找出多少个负样本。

【实例说明】
问题:假设某个学校有1000个王者荣耀玩家,其中有10个是王者段位,判断这个玩家是不是王者选手?

现在我有一个分类器,检测出来有20个王者选手,其中包含5个真正的王者选手。那么上述指标该如何计算呢?

分析:检测出来有20个王者选手,说明有980个选手被预测为非王者选手。这20个检测为王者选手包含5个真正的王者选手,说明另外15个实际为非王者选手,所以,

accuracy = (5+980-5) / 1000 = 0.98

precision = 5 / 20 = 0.25

recall = 5 / 10 = 0.5

F-score = 2 / (1/0.25 + 1/0.5) = 0.33

sensitivity = recall = 0.5

specificity = (980-5) / (1000-10) = 0.98

从这个案例我们可以发现,虽然分类器的accuracy可以达到98%,但是如果我的目的是尽可能的找出隐藏在这1000人中的王者选手,那么这个分类器的性能是不达标的,这也就是为什么要引入precision和recall以及F-score评价指标的原因。

【深度学习笔记】分类指标accuracy,recall,precision等的区别相关推荐

  1. HALCON 21.11:深度学习笔记---分类(10)

    HALCON 21.11:深度学习笔记---分类(10) HALCON 21.11.0.0中,实现了深度学习方法. 本章介绍了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

  2. 深度学习笔记(14) 评估指标

    深度学习笔记(14) 评估指标 1. 正交化 2. 单一数字评估指标 3. 满足和优化指标 4. 改变开发/测试集和指标 1. 正交化 搭建建立机器学习系统的挑战之一是,可以尝试和改变的东西太多太多了 ...

  3. HALCON 20.11:深度学习笔记(10)---分类

    HALCON 20.11:深度学习笔记(10)---分类 HALCON 20.11.0.0中,实现了深度学习方法. 本章解释了如何在训练和推理阶段使用基于深度学习的分类. 基于深度学习的分类是一种对一 ...

  4. 一文让你完全弄懂逻辑回归和分类问题实战《繁凡的深度学习笔记》第 3 章 分类问题与信息论基础(上)(DL笔记整理系列)

    好吧,只好拆分为上下两篇发布了>_< 终于肝出来了,今天就是除夕夜了,祝大家新快乐!^q^ <繁凡的深度学习笔记>第 3 章 分类问题与信息论基础 (上)(逻辑回归.Softm ...

  5. 深度学习笔记(13) Softmax分类

    深度学习笔记(13) Softmax分类 1. Softmax 回归 2. 练一个Softmax分类器 1. Softmax 回归 有一种logistic回归的一般形式,叫做 Softmax回归 能在 ...

  6. 深度学习笔记(45) 人脸验证与二分类

    深度学习笔记(45) 人脸验证与二分类 1. 二分类问题 2. 逻辑回归单元的处理 3. 计算技巧 1. 二分类问题 深度学习笔记(44) Triplet 损失 的Triplet loss是一个学习人 ...

  7. 吴恩达深度学习笔记——结构化机器学习项目(Structuring Machine Learning Projects)

    深度学习笔记导航 前言 传送门 结构化机器学习项目(Machine Learning Strategy) 机器学习策略概述 正交化(orthogonalization) 评价指标 数字评估指标的单一性 ...

  8. 深度学习模型评估指标

    深度学习模型评估指标 一个深度学习模型在各类任务中的表现都需要定量的指标进行评估,才能够进行横向的对比比较,包含了分类.回归.质量评估.生成模型中常用的指标. 一.分类评测指标 图像分类是计算机视觉中 ...

  9. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

  10. 深度学习笔记其七:计算机视觉和PYTORCH

    深度学习笔记其七:计算机视觉和PYTORCH 1. 图像增广 1.1 常用的图像增广方法 1.1.1 翻转和裁剪 1.1.2 改变颜色 1.1.3 结合多种图像增广方法 1.2 使用图像增广进行训练 ...

最新文章

  1. GitHub Draft Pull请求支持新的协作流程
  2. 一部手机失窃而揭露的黑色产业链
  3. 函数嵌套函数传递this值
  4. 读书狂想之《穷爸爸,富爸爸》财富观
  5. Javascript中最常用的61段经典代码
  6. tcc读写文本txt文件
  7. 用户认证-什么是认证
  8. 编写一个watchdog.sh脚本_五大原因!为何要将Jupyter Notebook转换为python脚本?
  9. Python学习11 继承
  10. 继承关系 c# 1613704854
  11. 关于div的定位属性问题
  12. 动态创建MySQL Group Replication的节点(r11笔记第84天)
  13. (转)苹果推送通知服务教程 Apple Push Notification Services Tutorial
  14. asp.net 旅游网站 源码+配置文档
  15. win10 企业版 2016长期服务版激活方法
  16. Java之图片添加文字
  17. richface 皮肤
  18. ctfshow七夕杯复现
  19. 赛门铁克Symantec SSL证书产品及服务
  20. 微信小程序版博客——开发汇总总结(附源码)

热门文章

  1. AsyncHttpServer 异步回调,并发
  2. python 多维数组(array)排序
  3. window7 64 VS2015下openCV3.4.0安装
  4. 目标跟踪算法三:Modeling and Propagating CNNs in a Tree Structure for Visual Tracking (VOT2016冠军)
  5. 海思3515,交叉编译opencv2.4.9
  6. munmap_chunk(): invalid pointer
  7. DELL 通过iDrac安装ESXI
  8. 计算机导论与计算机组成原理关系,计算机组成原理
  9. mysql 列转置_MySQL 行列转置
  10. mysql覆盖数据_理解MySQL数据库覆盖索引