返回主目录

返回决策树目录

上一章:机器篇——决策树(四)

下一章:机器篇——决策树(六)

本小节,细说 评估指标的相关曲线(ROC、KS、PR),下一小节开始细说 评估指标的交叉验证。

三. 评估指标

1. 混淆矩阵

混淆矩阵(confusion matrix) 也称为误差矩阵,是表示精度评价的一种标准格式,用  行  列的矩阵形式来表示。可以理解为就是一张表格而已。

下面以终端营销为例:

营销命中率 =  

营销误判率 =  

营销成功率 =  

2. ROC 曲线

(1). 定义

ROC 曲线(Receiver Operating Characteristic Curve, ROC) 又称接收者操作特征曲线,是描述分类预测模型命中率和误判率之间的一种图形化方法。

(2). 该曲线绘制了两个参数

①. 真正例率:

真正例率  是召回率  的同义词,即:

②. 假正例率:

: 命中(True Positive, TP)

: 漏判(False Negative, FN)

: 误判(False Positive, FP)

: 真负例(True Negative, TN)

精确率   

(3). ROC 曲线思路

根据学习器的预测结果对样本例进行排序,按此顺序逐个把样本作为正例进行预测,每次计算出两个重要量的值(TPR、FPR),分别以它们为横、纵坐标轴作图。

(4). ROC 曲线示图

(5). 绘制 ROC 曲线

可以设定阈值大于 0.5 为正样本,否则为负样本。

设置不同的阈值,可以得到不同的 ROC 曲线。

具体流程如下:

①. 假设为正类定义了连续值输出,对检验记录按它们的输出值递增排序。

②. 把检验样本都作为正类进行预测。这相当于所有的正检验样本都被正确分类,而所有的负检验样本都被误分。因此,     

③. 从排序列表中选择下一个检验记录,把选择的记录以及那些秩高于它记录的指派为正类,而把那些秩低于它记录的指派为负类。通过考察前面选择的记录的实际类标号来更新  和  计数。如果前面选择的记录为正类,则  计数减少而  计数不变。如果前面选择的记录为负类,则  计数减少而  计数不变。

④. 重复步骤 ③,并相应地更新  和  计数,直到最高秩的计算被选择。

⑤. 根据分类器的  画出  曲线

(6). ROC 曲线的主要作用

①. ROC 曲线能方便地查出给定命中率或误判率的任意约束区间时,预测模型对目标的识别能力。

②. 常用来比较两种以上不同预测模型的精准营销能力。靠近左边上角的 ROC 曲线所代表的预测模型更加精准。亦可通过计算 ROC 曲线下的面积 AUC 进行比较,AUC 越大,则预测模型越精准。

③. ROC 曲线对实际营销策略的意义

首先,选择 ROC 曲线最佳的预测模型(最佳算法)

其次,在最佳 ROC 曲线中选择最佳的点(最佳参数)

(7). AUC 的概念与示例

ROC 曲线下方的面积 AUC (Area Under The ROC Curve, AUC) 提供了评价模型平均性能的一种方法。如果模型是完美的,则它的 AUC = 1;如果模型是简单的随机猜测模型,那么它的 AUC = 0.5。如果一个模型好于另一个,则它的 ROC 曲线下方是的面积 AUC 会相对较大

(8). AUC 值作为评价标准

①. AUC 被定义为 ROC 曲线下的面积,取值范围一般在 0.5~1.0 之间。使用 AUC 值作为评估标准是因为很多时候 ROC曲线并不能很清晰地说明哪个分类器效果更好,而作为一个数值,对应 AUC 更大的分类器效果更好。(AUC 为一个概率值)

②. AUC 的计算法

a. 非参数法

(a). 梯形法则

早期由于测试样本有限,得到的 AUC 曲线呈阶梯状。曲线上的每点向 x 轴做垂线,得到若干梯形,这些梯形面积之和也就是 AUC

(b). Mean-Whitney 统计量:

统计正负样本对中,有多少个组中的正样本概率大于负样本概率。这种估计随着样本规模的扩大而逐渐逼近真实值。

b. 参数法:

主要适用于二项分布的数据,即正反样本分布符合正态分布,可以通过均值和方差来计算。

③. 从 AUC 判断分类器(预测模型)优劣的标准

a. AUC = 1.0,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合不存在完美分类器。

b. 0.5 < AUC < 1.0,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。

c. AUC = 0.5,跟随机猜测一样(例:抛硬币),模型没有预测价值。

d. AUC < 0.5,比随机猜测还差;但只要反预测而行,就优于随机猜测。

(9). 可以通过 KS 曲线得到 ROC 曲线的最好阈值

①. KS (Kolmogorov-Smirnov, KS) 值越大,表示模型能够将正、负例率分开的程度越大。KS值的取值范围为 [0, 1]

②. KS 曲线的纵轴表示  和  的值,就你是这两个值可以同时在一个纵轴上体现。横轴就是阈值,然后在两条曲线分割最开的地方,对应的就是最好的阈值,也是该模型最好的 AUC 值。

图示:一条曲线是 ,一条是 

(10). PR 曲线(Precision-Recall, PR)

①.介绍

PR 曲线和 ROC 曲线类似,ROC 曲线是  和  的点连成的线,PR 曲线是准确率(查准率) Precision 和召回率(查全率) Recall 的点连成的线。

②. PR 曲线示图

③. 如果一个学习器的 PR 曲线被另一个学习器的 PR 曲线完全包住,则可断言后者的性能优于前者,例如上图的 B 和 C 优于学习器 A,但是 B 和 C 的性能无法直接判断,但往往仍希望把学习器 B 和 C 进行比较,此时可以根据曲线下方的面积大小来进行比较,但更常用的是平衡点或者  值。平衡点(BEP)是   查准率 = 查全率   时的取值。如果这个值较大,则说明学习器的性能较好。而 ,同样, 值越大,可以认为该学习器的性能越好。

④. ROC 曲线和 PR 曲线的取舍

相对来讲,ROC 曲线会稳定很多,在正负样本量都足够的情况下,ROC 曲线足够反映模型的判断能力。因此对于同一模型,PR 和 ROC 曲线都可以说明一定的问题,而二者有一定的相关性,如果想评测模型效果,也可以把两条曲线都画出来综合评估。对于有监督的二分类问题,在正负样本都足够的情况下,可以直接用 ROC 曲线、AUC、KS 评估模型效果。在确定阈值过程中,可以根据 Precision、Recall 或  来评价模型的分类效果。对于多分类问题,可以对每一类分类计算 Precision、Recall 和 ,综合作为模型评价指标。

返回主目录

返回决策树目录

上一章:机器篇——决策树(四)

下一章:机器篇——决策树(六)

机器篇——决策树(五) 细说 评估指标的相关曲线(ROC、KS、PR)相关推荐

  1. R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率、抽样ROC的指标并绘制密度图

    R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率.抽样ROC的指标并绘制密度图 目录 R语言使用caret包对GBM模型参数调优(自定义调优的评 ...

  2. 【王喆-推荐系统】评估篇-(task2)推荐模型评估指标

    学习总结 学习了模型离线评估中使用的评估指标.低阶评估指标主要包括准确率,精确率,召回率和均方根误差.均方根误差的定义是预测值跟真实值之间差值的均方根. 高阶指标包括 P-R 曲线,ROC 曲线和平均 ...

  3. 分类器评估指标——混淆矩阵 ROC AUC KS AR PSI Lift Gain

    目录 1.混淆矩阵 混淆矩阵原理 混淆矩阵的python代码 2.准确率(Accuracy).精确率(Precision).灵敏度(Sensitivity).召回率(Recall).特异度(Speci ...

  4. 模型评估指标 AUC 和 ROC,这是我看到的最透彻的讲解

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Webbley blog.csdn.net/liweibin ...

  5. 评估指标:混淆矩阵、PR、mAP、ROC、AUC

    文章目录 TP.TN.FP.FN 准确率 Accuracy 和 错误率 Error rate 混淆矩阵 confusion matrix 查准率 Precision 和 召回率 Recall PR 曲 ...

  6. 深度学习(四十四)——GAN的评估指标, DCGAN, WGAN-GP, CGAN, BEGAN EBGAN

    GAN的评估指标 尽管可用的GAN模型非常多,但对它们的评估仍然主要是定性评估,通常需要借助人工检验生成图像的视觉保真度来进行.此类评估非常耗时,且主观性较强.具备一定误导性.鉴于定性评估的内在缺陷, ...

  7. 分类算法中的ROC与PR指标

    本文转自:http://blog.csdn.net/xiahouzuoxin/article/details/43165253 做过图像识别.机器学习或者信息检索相关研究的人都知道,论文的实验部分都要 ...

  8. 机器学习应用篇(五)——决策树分类实例

    机器学习应用篇(五)--决策树分类实例 文章目录 机器学习应用篇(五)--决策树分类实例 一.数据集 二.实现过程 1 数据特征分析 2 利用决策树模型在二分类上进行训练和预测 3 利用决策树模型在多 ...

  9. R语言分类模型:逻辑回归模型LR、决策树DT、推理决策树CDT、随机森林RF、支持向量机SVM、Rattle可视化界面数据挖掘、分类模型评估指标(准确度、敏感度、特异度、PPV、NPV)

    R语言分类模型:逻辑回归模型LR.决策树DT.推理决策树CDT.随机森林RF.支持向量机SVM.Rattle可视化界面数据挖掘.分类模型评估指标(准确度.敏感度.特异度.PPV.NPV) 目录

最新文章

  1. Vue项目启动报错 error:cannot find module xxx
  2. 【SpringCloud】Spring cloud 版本与 spring boot版本对应关系
  3. js页面传值php页面,php实现跳转传值有什么方法,js页面跳转传值
  4. VS2010 打包生成exe文件后 执行安装文件出现 TODO:lt;文件说明gt;已停止工作并已关闭...
  5. Nginx的反向代理实验
  6. 入驻蚂蚁金服财富号的基金公司,学“乖”了
  7. netmeeting 人数限止
  8. 酒店管理系统服务器网络,方讯酒店管理系统网络版安装配置说明.doc
  9. 腾讯云副总裁王慧星:持续加大基础设施投入规模和自研创新力度
  10. win7怎么更改浏览器主页?win7浏览器主页更改教程
  11. java 微信请求超时_java – SQL服务器“超出锁定请求超时时间”..再次
  12. ArcGIS——dwg与shp转换原理
  13. [4G/5G/6G专题基础-155]: 5G 3GPP高精确室内定位原理、AI方案概述
  14. MongoDB 数据文件损坏修复救命repair与致命危险
  15. linux7.5开放端口,Centos/linux开放端口
  16. 上海2021年高考成绩排位查询,2021年上海高考分数一分一段位次表,上海高考个人成绩排名查询方法...
  17. 基本数据类型python_Python中的基本数据类型
  18. 信息学复赛用linux,参加过信息学竞赛是怎样一种体验?
  19. 《如何阅读一本书》读后感1
  20. Mysql数据库基础第八章:窗口函数和公用表表达式(CTE)

热门文章

  1. Sinfor AC在内网使用代理服务器环境下的部署
  2. 【NLP模型笔记】GloVe模型简介
  3. Python英文单词变形
  4. 微信个人号API接口,个人号开发
  5. 微信小程序开发教程手册文档
  6. 湖北计算机二级考试c语言报名时间,全国计算机二级考试2019年9月份报名须知
  7. 2006年度世界500强企业排行榜完全榜单
  8. api hook 栈平衡_5个主流的数字货币行情API服务
  9. HTAP数据库:Hubble加倍实现数据湖价值
  10. 什么是SD-WAN?