搞机器学习的人一定频繁的听到ROC,AUC或者AUC-ROC,但这个概念又不向准确率召回率那么直观容易理解,给我带来了小小的困扰,这里就系统的学习下这两个概念。

ROC

ROC即Receiver Operating Characteristics, 中文一般翻译成“受试者工作特性曲线”。

这是一种度量二分类性能的指标。直观来讲,ROC曲线表示的是模型在准确识别正例不把负例错误的识别成正例这两种能力之间相互制约的关系(当我们需要“宁可错杀一千,也不放过一个”的时候,ROC能告诉你到底要错杀多少才能一个坏人都不放过)。

在详细解释ROC之前需要先解释两个前置概念,即TPR(True Positive Rate)和FPR(False Positive Rate)。

TPR 真正率(召回率):找出的正例占所有的正例的比率。比如有10人换糖尿病,通过模型确诊了其中的8个,则 TPR=0.8

FPR 假正率: 即所有的负例中分类错误的比例。比如有十个人没有患糖尿病(这里把患病作为正例),但是模型错误的将其中一个人误诊为患病,则FPR=0.1

ROC即为以FPR为横轴,以TPR为纵轴的一条曲线(如下图),有了这条曲线你就能清楚的回答下面这些问题

  1. 知道在可以放过1%坏人的情况下要错杀多少好人?

  2. 在最多能错杀1%好人的情况下会放掉多少坏人?

  3. 当糖尿病的误诊率不能高于5%时,会有多少有病的患者被错误判断成无病?

ROC曲线很直观,也方便使用。但他有个致命的弱点,就是无法对比多个模型的性能。AUC就是为了解决这个问题而出现的。

AUC

AUC,即 Area Under Curve(曲线下面积)。严格上讲,“AUC”并没有意义,因为它可以是你随手绘制的一条曲线的曲线下面积,不过在机器学习领域一般默认AUC就是指AUC-ROC(AUROC也是同样的意思)。

AUC-ROC代表一个模型对正负例的区分能力(既不放过一个,也不错杀一个),他的值在0和1之间,越大代表模型性能越好。

从上图中很容易直观的感受到什么是AUC-ROC(途中笔误写成了AOC)。知道了AUC-ROC,还需要知道几个典型值:

  • 当AUC-ROC的值接近1的时候,代表模型效果很好;

  • 当值为0的时候代表模型总是颠倒黑白,把好的说成坏的,坏的说成好的;

  • 当值为0.5时可以认为模型知识随机做出判断,不具备区分能力。

“众智汇”愿景

尽职尽才,允公允能 —— 本社群不定期举行线上分享,组织群友分享知识、经验、资源,以达到让我们每个人的职业生涯得到最大程度的发展的目的

欢迎扫面下列二维码关注“悦思悦读”公众微信号

白话详解ROCAUC | 小白深度学习入门相关推荐

  1. 什么是生成对抗网络(GAN)| 小白深度学习入门

    小白深度学习入门系列 1. 直观理解深度学习基本概念 2. 白话详解ROC和AUC 3. 什么是交叉熵 4. 神经网络的构成.训练和算法 5. 深度学习的兴起:从NN到DNN 6. 异军突起的激活函数 ...

  2. 什么是Transformer?| 小白深度学习入门

    小白深度学习入门系列 1. 直观理解深度学习基本概念 2. 白话详解ROC和AUC 3. 什么是交叉熵 4. 神经网络的构成.训练和算法 5. 深度学习的兴起:从NN到DNN 6. 异军突起的激活函数 ...

  3. 干货 | 详解如何用深度学习消除背景,实现抠图

    微信公众号 关键字全网搜索最新排名 [机器学习算法]:排名第一 [机器学习]:排名第一 [Python]:排名第三 [算法]:排名第四 这篇文章介绍了作者 Gidi Sheperber 在 green ...

  4. 通俗易懂word2vec详解词嵌入-深度学习

    https://blog.csdn.net/just_so_so_fnc/article/details/103304995 skip-gram 原理没看完 https://blog.csdn.net ...

  5. 全文详解:「深度学习」如何协助处理医疗中的「数据难题」

    原文来源:WordPress 作者:Luke Oakden-Rayner 「雷克世界」编译:嗯~是阿童木呀.KABUDA.EVA 医疗数据很难处理. 在医学成像中,数据存储(档案)是基于临床假设进行操 ...

  6. 详解如何获取深度学习模型中间层的输出值

    1. 引入 深度学习模型,大都是多层的网络,各个层可能各有不同(Dense, Dropout, Flatten, Activation, BatchNormalization, GlobalAvera ...

  7. 什么是交叉熵啊?| 小白深度学习入门

    大家在学习深度学习的过程中,都会碰到cross-entropy这个词,中文叫"交叉熵",多么高大上的名词! 然而这个"熵"到底是干啥用的,实际上很多人包括我,在 ...

  8. 【NLP年度重磅盘点】12项重大行业突破!详解2017年深度学习加持下的NLP大事件

    翻译 | 林椿眄.刘畅.彭硕 编辑 | Donna Suisui 过去几年,深度学习架构和算法在图像识别和语音处理等领域取得了重大的进步.而在NLP(自然语言处理)领域,起初并没有太大的进展.不过现在 ...

  9. 代码详解:用深度学习在Keras中对蝴蝶进行分类

    全文共11345字,预计学习时长23分钟或更长 荷兰一个组织Vlinderstichting每年都会收集大量的蝴蝶.一些志愿者会帮忙分辨花园中蝴蝶的类别,Vlinderstichting则负责收集信息 ...

最新文章

  1. 又一款4800像素手机曝光:vivo V15 Pro
  2. POJ - 2175 Evacuation Plan(最小费用最大流+消圈定理)
  3. Jensen不等式及其证明
  4. jozj3419-最大利润【树形dp】
  5. vb.net中滚动条一直显示没有数据时也显示_Android Studio 中 System Trace 的新增功能...
  6. php mysql 排序规则_php 数组排序以及按照某个字段排序
  7. 使用jsp,tag提取字符串中的单词
  8. Go1.18 新特性:多 Module 工作区模式
  9. Arduino-ESP8266环境配置及点灯
  10. angular input 为file on-change 无效
  11. day16 Python 类的实现关系
  12. 聊聊springboot session timeout参数设置
  13. MRD市场需求文档结构
  14. 简单计算机病毒黑屏,电脑被木马病毒侵袭,黑屏了怎么处理
  15. 西门子PLC,STEP7 v5.5安装以及仿真软件Plcsim v5.4 sp5安装
  16. 装饰模式 DecoratePattern
  17. uboot启动流程详解
  18. Linux学习06--进程
  19. GPIO与IOMUX
  20. iOS中视频播放的学习

热门文章

  1. url编码 android,Android中的URL编码
  2. java合集系列之pring@Component @Repository@Service的区别
  3. 315前瞻|百合佳缘旗下百合婚恋、世纪佳缘等婚恋平台乱象频生
  4. 计算机接口硬盘,电脑硬盘有几种 接口有几种?
  5. Android Studio 视频教程分享
  6. 红米k40pro+一键锁屏设置教程分享
  7. python自学 适合新手的 python人机对战小游戏
  8. php答题闯关游戏,陌陌新上线“答题闯关”对战小游戏 涨知识得现金红包
  9. 中国的高级软件工程师你们难道上网只看技术吗?悲哀啊。
  10. 空当接龙java源码_空当接龙java源代码