在机器学习里面做一些分类任务时,经常会使用到一些评价指标,下面就一些常用的指标进行详细的说明。

上图表示为一个二分类的混淆矩阵(多分类同理,只需要把不属于当前类的其他类都考虑为负例),表格中的四个参数说明:

True Positive(TP):预测为正例,实际为正例

False Positive(FP):预测为正例,实际为负例

True Negative(TN):预测为负例,实际为负例

False Negative(FN):预测为负例,实际为正例

从这我们可以看出,TP和TN都是预测对了,FP和FN都是预测错了。

【计算公式】

【指标分析】

我们最容易搞混的就是accuracy和precision,好像两者都可以称为准确率,正确率,精度等等...其实我们不必要考究两者的中文称呼究竟是什么,搞清楚两者的含义自然就可以区分它们。首先,accuracy指的是正确预测的样本数占总预测样本数的比值,它不考虑预测的样本是正例还是负例。而precision指的是正确预测的正样本数占所有预测为正样本的数量的比值,也就是说所有预测为正样本的样本中有多少是真正的正样本。从这我们可以看出,precision只关注预测为正样本的部分,而accuracy考虑全部样本。

Recall可以称为召回率、查全率等等...我们也不考究如何翻译它,它指的是正确预测的正样本数占真实正样本总数的比值,也就是我能从这些样本中能够正确找出多少个正样本。

F-score相当于precision和recall的调和平均,用意是要参考两个指标。从公式我们可以看出,recall和precision任何一个数值减小,F-score都会减小,反之,亦然。

specificity指标平时见得不多,它是相对于sensitivity(recall)而言的,指的是正确预测的负样本数占真实负样本总数的比值,也就是我能从这些样本中能够正确找出多少个负样本。

【实例说明】

问题:假设某个学校有1000个王者荣耀玩家,其中有10个是王者段位,判断这个玩家是不是王者选手?

现在我有一个分类器,检测出来有20个王者选手,其中包含5个真正的王者选手。那么上述指标该如何计算呢?

分析:检测出来有20个王者选手,说明有980个选手被预测为非王者选手。这20个检测为王者选手包含5个真正的王者选手,说明另外15个实际为非王者选手,所以,

accuracy = (5+980-5) / 1000 = 0.98

precision = 5 / 20 = 0.25

recall = 5 / 10 = 0.5

F-score = 2 / (1/0.25 + 1/0.5) = 0.33

sensitivity = recall = 0.5

specificity = (980-5) / (1000-10) = 0.98

从这个案例我们可以发现,虽然分类器的accuracy可以达到98%,但是如果我的目的是尽可能的找出隐藏在这1000人中的王者选手,那么这个分类器的性能是不达标的,这也就是为什么要引入precision和recall以及F-score评价指标的原因。

【深度学习】分类指标accuracy,recall,precision等的区别相关推荐

  1. 深度学习分类任务常用评估指标

    摘要:这篇文章主要向大家介绍深度学习分类任务评价指标,主要内容包括基础应用.实用技巧.原理机制等方面,希望对大家有所帮助. 本文分享自华为云社区<深度学习分类任务常用评估指标>,原文作者: ...

  2. 使用深度学习分类猫狗图片

    使用深度学习分类猫狗图片 前言 一.下载数据 二.构建网络 三.数据预处理 四.使用数据增强 总结 前言 本文将介绍如何使用较少的数据从头开始训练一个新的深度学习模型.首先在一个2000个训练样本上训 ...

  3. 深度学习分类pytorch_pytorch使用转移学习的狗品种分类器

    深度学习分类pytorch So have you heard the word deep learning before? Or have you just started learning it? ...

  4. 卷积神经网络经典论文集合(深度学习分类篇)

    卷积神经网络经典论文集合 为方便撰写深度学习分类网络综述,现将近年以来经典论文做一个整理.文章时间大部分参考arXiv分享时间为准,小部分为期刊的出版日期. 下载地址 CSDN:https://dow ...

  5. 【深度学习笔记】分类指标accuracy,recall,precision等的区别

    在机器学习里面做一些分类任务时,经常会使用到一些评价指标,下面就一些常用的指标进行详细的说明. 上图表示为一个二分类的混淆矩阵(多分类同理,只需要把不属于当前类的其他类都考虑为负例),表格中的四个参数 ...

  6. 深度学习分类任务常用评估指标——总结(重点)

    一.分类模型指标 1 准确率和错误率(该指标评价的前提样本分布平衡) 准确率和错误率既可用于二分类也可用于多分类: 下述公式是准确率.错误率针对二分类情况时候的计算公式 1.1 准确率(该指标评价的前 ...

  7. 深度学习评估指标之目标检测——(yolov5 可视化训练结果以及result.txt解析)

    1.机器学习模型评估指标总结 机器学习的数据集一般被划分为训练集和测试集,训练集用于训练模型,测试集则用于评估模型.针对不同的机器学习问题(分类.回归.排序.序列预测等),评估指标决定了我们如何衡量模 ...

  8. pytorch-softmax解决分类问题,用fashion-mnist为例子,再走一遍数据获取到模型预测的流程。深度了解分类指标的递进关系

    softmax回归 线性回归模型适用于输出为连续值的情景.在另一类情景中,模型输出可以是一个像图像类别这样的离散值.对于这样的离散值预测问题,我们可以使用诸如softmax回归在内的分类模型.和线性回 ...

  9. 基于keras的深度学习——分类

    使用keras的深度学习来分类白葡萄酒还是红葡萄酒 首先介绍一下数据类型: 1.这个数据集包含了1599种红酒,4898种白酒: 2.输入数据特征: 1 - fixed acidity 2 - vol ...

  10. 深度学习分类类别不平衡_「图像分类」 关于图像分类中类别不平衡那些事

    作者&编辑 | 郭冰洋 1 简介 小伙伴们在利用公共数据集动手搭建图像分类模型时,有没有注意到这样一个问题呢--每个数据集不同类别的样本数目几乎都是一样的.这是因为不同类别的样例数目差异较小, ...

最新文章

  1. 非对称加密和证书总结
  2. Codeforces 611D New Year and Ancient Prophecy DP
  3. ad用户和计算机报错,AD常用排错工具
  4. 166. 分数到小数
  5. unitec理工学院 计算机,2020年新西兰留学Unitec理工学院计算机硕士课程全面解析...
  6. Mysql 基础命令
  7. eclipse打war包_jar包和war包的区别
  8. 总结Cnblogs支持的常用Markdown语法
  9. iOS精品源码,GHConsole图片浏览器圆形进度条音视频传输连击礼物弹出动画 1
  10. MySQL Shell 教程
  11. 视频教程-ThreeJS视频教程-JavaScript
  12. Transformer综述(A Survey on Vision Transformer) 阅读学习笔记(二)-- transformer在计算机视觉领域的发展和应用
  13. Hive架构及相关函数
  14. 分析Chrome的瀑布流(Waterfall)
  15. 工程师思维是什么?芯片工程师要有哪些思维习惯?
  16. 承认吧!你不是不行,你是不敢!
  17. java-Map接口
  18. 如何查看笔记本电脑固态硬盘接口与接口协议
  19. css firefox火狐浏览器下的兼容性问题
  20. 灰色关联度矩阵--基于Matlab

热门文章

  1. SICNU ACM新生第一次考核
  2. Exif的Orientation信息说明
  3. android打飞机游戏、MVP句子迷App、悬浮窗、RxJava+Retrofit、加载动画、定制计划App等源码
  4. [学习]18 SMART原则 如何科学的制定计划
  5. OS文件处理库python应用整理DIY
  6. 如何批量导出QQ空间相册到电脑中
  7. 推荐一款文献管理工具 Zotero |附使用教程和学习路径
  8. 计算机内打不开小米路由器,win7系统无法访问小米路由器的解决方法
  9. 用QEMU搭建arm开发环境之一:QEMU能干啥
  10. 正确划分音节——英语见字发音的秘诀