转自: https://www.zhihu.com/question/39840928

作者:小小丘 (该作者对 auc的意义 讲得非常棒, 感谢付出)
链接:https://www.zhihu.com/question/39840928/answer/84906286
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

看到前面答主的答案,我表示很激动的想来一个简化的版本。
曾经面试的时候被问到过这么一个问题,怎么向一个没有任何计算机、数学、统计等基础的人介绍下什么是AUC,当时我败北了。不过后来我有一天顿悟了,为了检验我的顿悟是否有效,特此一答。
我给出的答案是 AUC是指 从一堆样本中随机抽一个,抽到正样本的概率 比 抽到负样本的概率 大的可能性。 其实这个解释百度下到处都是,我是看别人说的然后理解了。 (这里列出无数参考文献,请自行百度)
详细解释如下: 随机抽取一个样本, 对应每一潜在可能值X都对应有一个抽中的概率P。
按概率从高到矮排个降序, 对于正样本中概率最高的,排序为rank_1, 比它概率小的有M-1个正样本(M为正样本个数), (rank_1 - M) 个负样本。
正样本概率第二高的, 排序为rank_2, 比它概率小的有M-2个正样本,(rank_2 - M + 1) 个 负样本。
以此类推
正样本中概率最小的, 排序为rank_M,比它概率小的有0个正样本,rank_M - 1 个负样本。
总共有MxN个正负样本对(N为负样本个数)。把所有比较中 正样本概率大于负样本概率 的例子都算上, 得到公式(rank_1 - M + rank_2 - M + 1 .... + rank_M - 1) / (MxN) 就是正样本概率大于负样本概率的可能性了。 化简后(因为后面是个等差数列)得:
<img src="https://pic3.zhimg.com/a84974778b7d3c1387971c181876c4e2_b.png" data-rawwidth="571" data-rawheight="113" class="origin_image zh-lightbox-thumb" width="571" data-original="https://pic3.zhimg.com/a84974778b7d3c1387971c181876c4e2_r.png">这就是传说中的AUC公式。这只是用于理解,具体计算时候需要考虑rank平列的情况这就是传说中的AUC公式。这只是用于理解,具体计算时候需要考虑rank平列的情况

机器学习和统计里面的auc怎么理解?相关推荐

  1. 如何理解机器学习和统计中的AUC?

    1.如何理解机器学习和统计中的AUC? 首先,在试图弄懂AUC和ROC曲线之前,一定,一定要彻底理解混淆矩阵的定义!!!混淆矩阵中有着Positive.Negative.True.False的概念,其 ...

  2. auc 和loss_如何理解机器学习和统计中的AUC?

    看到前面答主的答案,我表示很激动的想来一个简化的版本. 曾经面试的时候被问到过这么一个问题,怎么向一个没有任何计算机.数学.统计等基础的人介绍下什么是AUC,当时我败北了.不过后来我有一天顿悟了,为了 ...

  3. auc 损失_如何理解机器学习和统计中的AUC?

    一只蚂蚁:到底如何理解AUC?​zhuanlan.zhihu.com AUC相关概念及作用定义 AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会 ...

  4. 机器学习和统计中的AUC

    首先,在试图弄懂AUC和ROC曲线之前,一定,一定要彻底理解混淆矩阵的定义!!!混淆矩阵中有着Positive.Negative.True.False的概念,其意义如下:称预测类别为1的为Positi ...

  5. 笔记︱统计评估指标AUC 详解

    文章目录 1 AUC的两种解读视角: 1.1 ROC曲线与坐标轴形成面积 1.2 古典概率模型--求导AUC 2 AUC的特性与优劣 3 AUC多大才算好? 4 线上.线下AUC差异较大成因分析 4. ...

  6. python可视化多个机器学习模型在独立测试集(test data set)上面的AUC值、可视化模型效能

    python可视化多个机器学习模型在独立测试集(test data set)上面的AUC值.可视化模型效能 # x_lables为模型名称列表,包括,逻辑回归.朴素贝叶斯.支持向量机.随机森林.xgb ...

  7. Simple java里面的paint(Graphics g)的理解

    以前写画图板时,总不理解什么时候要调用这个方法,老师说:你写了paint(g)方法后,在窗体改变时,就会调用,可是不太理解. 没写paint(g)的演示:画图板v1 1:绘制简单直线 2.执行最小化操 ...

  8. woe分析_机器学习-谈谈逻辑回归里面的woe化-20170911

    1.woe是什么东西 如果有人接触过信用评分卡,那么肯定是有看过在变量处理那一步,有一个变量woe的过程.那么woe是如何计算的呢,有什么具体含义呢. woe全称是Weight of Evidence ...

  9. 理解Java集合框架里面的的transient关键字

    2019独角兽企业重金招聘Python工程师标准>>> 在分析HashMap和ArrayList的源码时,我们会发现里面存储数据的数组都是用transient关键字修饰的,如下: H ...

最新文章

  1. 粤嵌——电子相册代码实现
  2. python使用matplotlib可视化线图(line plot)、自定义可视化图像的四个边框的色彩、可以分别设置矩形每一条边的色彩(change the axis color)
  3. 乐源机器人优点跟缺点_机床实现自动化上下料选桁架机械手还是关节机器人好?...
  4. Esxi服务器虚拟化平台搭建
  5. 平面设计师和ui设计师_游戏设计师的平面设计
  6. 基于AgileEAS.NET企业应用平台实现基于SOA架构的应用整合方案-开篇
  7. PYTHON 自动化学习之路
  8. error code 0x80131022什么意思_page fault时发生了什么
  9. C++ Qt学习笔记(4)绘图
  10. Leetcode每日一题:29.divide-two-integers(两数相除)
  11. Git基础教程(三)
  12. Uva(10158)
  13. 《剑指offer》-中序遍历下一个节点
  14. Android自定义控件封装之自定义属性的实现
  15. 类成员变量初始化总结
  16. python气象数据处理与绘图(9)_《利用Python进行数据分析·第2版》第9章 绘图和可视化...
  17. 建立云服务器_中国云游戏元年 顺网科技跻身头号玩家队列
  18. 前端逼死强迫症系列之javascript
  19. Java Windows,Linux视频抽帧的4种方式
  20. 创客使用Fusion 360 - 认识Fusion 360

热门文章

  1. Codeforces Round #593 (Div. 2) D. Alice and the Doll 暴力 + 二分
  2. Bigraph Extension
  3. P2447 [SDOI2010]外星千足虫
  4. P2146 [NOI2015] 软件包管理器
  5. 最短路模板:dij,spfa与floyd
  6. 二分:[BJWC2008]秦腾与教学评估
  7. P3180-[HAOI2016]地图【圆方树,莫队,分块】
  8. P3850-[TJOI2007]书架【Splay】
  9. jzoj6305-最小值【线段树,dp,双端链表】
  10. CF735D-Taxes【数学,数论】