深度学习分类常见评价指标:accuracy recall precision specificity sensitivity AUC ROC 曲线
深度学习分类时常用到以下指标,这里做一个总结:
首先介绍一些指标的定义:
(1)若一个实例是正类,但是被预测成为正类,即为真正类(True Postive TP)
(2)若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)
(3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)
(4)若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)
这四个部分可以构成一个混淆矩阵:
而accuracy recall precision F1-score分别表示:
1.accuracy指的是正确预测的样本数占总预测样本数的比值,它不考虑预测的样本是正例还是负例:
2.recall指的是正确预测的正样本数占真实正样本总数的比值:
3.precision指的是正确预测的正样本数占所有预测为正样本数的比值:
4.为了能够评价不同算法的优劣,在Precision和Recall的基础上提出了F1值的概念,来对Precision和Recall进行整体评价。F1-score(均衡平均数)是综合考虑了模型查准率和查全率的计算结果,取值更偏向于取值较小的那个指标。F1的定义如下:
5.Sensitivity,我们常说“敏感性”,Sensitivity的值越大,说明“有病的被判断为有病的”越大,“漏检”(FN)越小。也叫做TPR:True positive rate
6. Specificity,我们常说“特异性”,Specificity的值越大,说明“健康的被判断为健康的”的越大,“误检”(FP)越小。也叫做
TNR:True negative rate:
接下来说一下ROC曲线及AUC:
ROC曲线:接收者操作特征曲线(receiver operating characteristic curve),是反映敏感性和特异性连续变量的综合指标,roc曲线上每个点反映着对同一信号刺激的感受性。对于分类器或者说分类算法,评价指标主要有precision,recall,F1 score等,以及这里要讨论的ROC和AUC。下图是一个ROC曲线的示例:
横轴FPR: FP/(FP+TN),FPR越大,预测正类中实际负类越多。
纵轴TPR:TP/(TP+FN),Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。
理想目标:TPR=1,FPR=0,即图中(0,1)点,故ROC曲线越靠拢(0,1)点,越偏离45度对角线越好,Sensitivity、Specificity越大效果越好。
在一个二分类模型中,假设采用逻辑回归分类器,其给出针对每个实例为正类的概率,那么通过设定一个阈值如0.6,概率大于等于0.6的为正类,小于0.6的为负类。对应的就可以算出一组(FPR,TPR),在平面中得到对应坐标点。随着阈值的逐渐减小,越来越多的实例被划分为正类,但是这些正类中同样也掺杂着真正的负实例,即TPR和FPR会同时增大。阈值最大时,对应坐标点为(0,0),阈值最小时,对应坐标点(1,1)。
AUC值的计算:
AUC (Area Under Curve) 被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围一般在0.5和1之间。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,对应AUC更大的分类器效果更好。
AUC的计算有两种方式,梯形法和ROC AUCH法,都是以逼近法求近似值,具体见wikipedia。
从AUC判断分类器(预测模型)优劣的标准:
- AUC = 1,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合,不存在完美分类器。
- 0.5 < AUC < 1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
- AUC = 0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。
- AUC < 0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测。
深度学习分类常见评价指标:accuracy recall precision specificity sensitivity AUC ROC 曲线相关推荐
- 深度学习分类任务常用评估指标
摘要:这篇文章主要向大家介绍深度学习分类任务评价指标,主要内容包括基础应用.实用技巧.原理机制等方面,希望对大家有所帮助. 本文分享自华为云社区<深度学习分类任务常用评估指标>,原文作者: ...
- 深度学习常用性能评价指标
深度学习常用性能评价指标 前言 基于准确度的指标 基于排名的指标 基于图数据的指标 前言 深度学习性能指标是用于评价深度学习模型性能的依据,是设计模型的重要依据. 基于准确度的指标 对于模型而言仅统计 ...
- 深度学习中常见的损失函数
文章来源于AI的那些事儿,作者黄鸿波 2018年我出版了<TensorFlow进阶指南 基础.算法与应用>这本书,今天我把这本书中关于常见的损失函数这一节的内容公开出来,希望能对大家有所帮 ...
- 深度学习分类pytorch_pytorch使用转移学习的狗品种分类器
深度学习分类pytorch So have you heard the word deep learning before? Or have you just started learning it? ...
- 使用深度学习分类猫狗图片
使用深度学习分类猫狗图片 前言 一.下载数据 二.构建网络 三.数据预处理 四.使用数据增强 总结 前言 本文将介绍如何使用较少的数据从头开始训练一个新的深度学习模型.首先在一个2000个训练样本上训 ...
- 卷积神经网络经典论文集合(深度学习分类篇)
卷积神经网络经典论文集合 为方便撰写深度学习分类网络综述,现将近年以来经典论文做一个整理.文章时间大部分参考arXiv分享时间为准,小部分为期刊的出版日期. 下载地址 CSDN:https://dow ...
- 上手!深度学习最常见的26个模型练习项目汇总
作者:沧笙踏歌 转载自AI部落联盟(id:AI_Tribe) 今天更新关于常见深度学习模型适合练手的项目.这些项目大部分是我之前整理的,基本上都看过,大概俩特点:代码不长,一般50-200行代码,建议 ...
- ML之模型文件:机器学习、深度学习中常见的模型文件(.h5、.keras)简介、h5模型文件下载集锦、使用方法之详细攻略
ML之模型文件:机器学习.深度学习中常见的模型文件(.h5..keras)简介.h5模型文件下载集锦.使用方法之详细攻略 目录 ML/DL中常见的模型文件(.h5..keras)简介及其使用方法 一. ...
- 深度学习中常见的打标签工具和数据集资源
深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...
- 视频|分类模型评估:精确率、召回率、ROC曲线、AUC与R语言生存分析时间依赖性ROC实现
最近我们被客户要求撰写关于分类模型的研究报告,包括一些图形和统计输出. 本文将帮助您回答以下问题: ROC曲线是什么? 曲线下的面积是多少? 二元分类的决策阈值是多少? 分类模型可接受的 AUC值是多 ...
最新文章
- MapReduce执行过程
- numpy中的ndim、shape、dtype、astype
- spring mvc字符编码过滤器 CharacterEncodingFilter ,添加例外url
- memcpy(cv::Mat.data,unsigned char *,320x240),保存数据失真问题解决方法
- 使用SQL Server作业设置定时任务
- Django讲课笔记03:创建Django项目
- 47不用加减乘除做加法
- 阿里云全站加速DCDN全面支持WebSocket协议
- window.open window.showModelDialog 打开一个新窗口/子窗口中调用父窗口的方法
- java导出简单写法
- linux内核相关的两个问题
- smobiler中实现页面切换_Smobiler如何实现.net一键开发,ios和android跨平台运行
- 使用python代码调用三汇语音卡硬件拨打电话
- Snapper:通过同义、分类关键词快速定位并调用WAV文件
- 如何让自己发了疯、拼了命、石乐志的学习?
- Cadence Orcad Capture全局修改元件属性方法及技巧图文及视频演示
- java小马哥百度网盘_思否编程(小马哥):Java 微服务实践 - Spring Boot / Spring Cloud全套,完整版下载 - VIPC6资源网...
- 设计模式 - 状态模式
- 访问控制模型详细介绍
- Arch的双显卡驱动
热门文章
- python使用pypandoc将html转换成word文档
- 如何查看电子元器件的丝印信息
- C语言五子棋双人模式
- U-GAT-IT 翻译
- 夜神模拟器卡在android,夜神安卓模拟器很卡怎么办?模拟器卡顿解决方法分享...
- SSM 运行报错Failed to load resource: the server responded with a status of 404 (Not Found)
- 该文件没有与之关联的程序来执行操作。解决方案
- 图片秒加水印制作生成威信小程序源码下载
- 远不止三色,图片被压扁了,用Python的Tkinter做一个既高颜值又好用的计算器
- linux学习(跟着b站尚硅谷老师学习)