机器篇——决策树(五) 细说 评估指标的相关曲线(ROC、KS、PR)
返回主目录
返回决策树目录
上一章:机器篇——决策树(四)
下一章:机器篇——决策树(六)
本小节,细说 评估指标的相关曲线(ROC、KS、PR),下一小节开始细说 评估指标的交叉验证。
三. 评估指标
1. 混淆矩阵
混淆矩阵(confusion matrix) 也称为误差矩阵,是表示精度评价的一种标准格式,用 行 列的矩阵形式来表示。可以理解为就是一张表格而已。
下面以终端营销为例:
营销命中率 =
营销误判率 =
营销成功率 =
2. ROC 曲线
(1). 定义
ROC 曲线(Receiver Operating Characteristic Curve, ROC) 又称接收者操作特征曲线,是描述分类预测模型命中率和误判率之间的一种图形化方法。
(2). 该曲线绘制了两个参数
①. 真正例率:
真正例率 是召回率 的同义词,即:
②. 假正例率:
: 命中(True Positive, TP)
: 漏判(False Negative, FN)
: 误判(False Positive, FP)
: 真负例(True Negative, TN)
精确率
(3). ROC 曲线思路
根据学习器的预测结果对样本例进行排序,按此顺序逐个把样本作为正例进行预测,每次计算出两个重要量的值(TPR、FPR),分别以它们为横、纵坐标轴作图。
(4). ROC 曲线示图
(5). 绘制 ROC 曲线
可以设定阈值大于 0.5 为正样本,否则为负样本。
设置不同的阈值,可以得到不同的 ROC 曲线。
具体流程如下:
①. 假设为正类定义了连续值输出,对检验记录按它们的输出值递增排序。
②. 把检验样本都作为正类进行预测。这相当于所有的正检验样本都被正确分类,而所有的负检验样本都被误分。因此,
③. 从排序列表中选择下一个检验记录,把选择的记录以及那些秩高于它记录的指派为正类,而把那些秩低于它记录的指派为负类。通过考察前面选择的记录的实际类标号来更新 和 计数。如果前面选择的记录为正类,则 计数减少而 计数不变。如果前面选择的记录为负类,则 计数减少而 计数不变。
④. 重复步骤 ③,并相应地更新 和 计数,直到最高秩的计算被选择。
⑤. 根据分类器的 画出 曲线
(6). ROC 曲线的主要作用
①. ROC 曲线能方便地查出给定命中率或误判率的任意约束区间时,预测模型对目标的识别能力。
②. 常用来比较两种以上不同预测模型的精准营销能力。靠近左边上角的 ROC 曲线所代表的预测模型更加精准。亦可通过计算 ROC 曲线下的面积 AUC 进行比较,AUC 越大,则预测模型越精准。
③. ROC 曲线对实际营销策略的意义
首先,选择 ROC 曲线最佳的预测模型(最佳算法)
其次,在最佳 ROC 曲线中选择最佳的点(最佳参数)
(7). AUC 的概念与示例
ROC 曲线下方的面积 AUC (Area Under The ROC Curve, AUC) 提供了评价模型平均性能的一种方法。如果模型是完美的,则它的 AUC = 1;如果模型是简单的随机猜测模型,那么它的 AUC = 0.5。如果一个模型好于另一个,则它的 ROC 曲线下方是的面积 AUC 会相对较大
(8). AUC 值作为评价标准
①. AUC 被定义为 ROC 曲线下的面积,取值范围一般在 0.5~1.0 之间。使用 AUC 值作为评估标准是因为很多时候 ROC曲线并不能很清晰地说明哪个分类器效果更好,而作为一个数值,对应 AUC 更大的分类器效果更好。(AUC 为一个概率值)
②. AUC 的计算法
a. 非参数法
(a). 梯形法则
早期由于测试样本有限,得到的 AUC 曲线呈阶梯状。曲线上的每点向 x 轴做垂线,得到若干梯形,这些梯形面积之和也就是 AUC
(b). Mean-Whitney 统计量:
统计正负样本对中,有多少个组中的正样本概率大于负样本概率。这种估计随着样本规模的扩大而逐渐逼近真实值。
b. 参数法:
主要适用于二项分布的数据,即正反样本分布符合正态分布,可以通过均值和方差来计算。
③. 从 AUC 判断分类器(预测模型)优劣的标准
a. AUC = 1.0,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合不存在完美分类器。
b. 0.5 < AUC < 1.0,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
c. AUC = 0.5,跟随机猜测一样(例:抛硬币),模型没有预测价值。
d. AUC < 0.5,比随机猜测还差;但只要反预测而行,就优于随机猜测。
(9). 可以通过 KS 曲线得到 ROC 曲线的最好阈值
①. KS (Kolmogorov-Smirnov, KS) 值越大,表示模型能够将正、负例率分开的程度越大。KS值的取值范围为 [0, 1]
②. KS 曲线的纵轴表示 和 的值,就你是这两个值可以同时在一个纵轴上体现。横轴就是阈值,然后在两条曲线分割最开的地方,对应的就是最好的阈值,也是该模型最好的 AUC 值。
图示:一条曲线是 ,一条是
(10). PR 曲线(Precision-Recall, PR)
①.介绍
PR 曲线和 ROC 曲线类似,ROC 曲线是 和 的点连成的线,PR 曲线是准确率(查准率) Precision 和召回率(查全率) Recall 的点连成的线。
②. PR 曲线示图
③. 如果一个学习器的 PR 曲线被另一个学习器的 PR 曲线完全包住,则可断言后者的性能优于前者,例如上图的 B 和 C 优于学习器 A,但是 B 和 C 的性能无法直接判断,但往往仍希望把学习器 B 和 C 进行比较,此时可以根据曲线下方的面积大小来进行比较,但更常用的是平衡点或者 值。平衡点(BEP)是 查准率 = 查全率 时的取值。如果这个值较大,则说明学习器的性能较好。而 ,同样, 值越大,可以认为该学习器的性能越好。
④. ROC 曲线和 PR 曲线的取舍
相对来讲,ROC 曲线会稳定很多,在正负样本量都足够的情况下,ROC 曲线足够反映模型的判断能力。因此对于同一模型,PR 和 ROC 曲线都可以说明一定的问题,而二者有一定的相关性,如果想评测模型效果,也可以把两条曲线都画出来综合评估。对于有监督的二分类问题,在正负样本都足够的情况下,可以直接用 ROC 曲线、AUC、KS 评估模型效果。在确定阈值过程中,可以根据 Precision、Recall 或 来评价模型的分类效果。对于多分类问题,可以对每一类分类计算 Precision、Recall 和 ,综合作为模型评价指标。
返回主目录
返回决策树目录
上一章:机器篇——决策树(四)
下一章:机器篇——决策树(六)
机器篇——决策树(五) 细说 评估指标的相关曲线(ROC、KS、PR)相关推荐
- R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率、抽样ROC的指标并绘制密度图
R语言使用caret包对GBM模型参数调优(自定义调优的评估指标,例如ROC指标):抽取预测标签及类概率.抽样ROC的指标并绘制密度图 目录 R语言使用caret包对GBM模型参数调优(自定义调优的评 ...
- 【王喆-推荐系统】评估篇-(task2)推荐模型评估指标
学习总结 学习了模型离线评估中使用的评估指标.低阶评估指标主要包括准确率,精确率,召回率和均方根误差.均方根误差的定义是预测值跟真实值之间差值的均方根. 高阶指标包括 P-R 曲线,ROC 曲线和平均 ...
- 分类器评估指标——混淆矩阵 ROC AUC KS AR PSI Lift Gain
目录 1.混淆矩阵 混淆矩阵原理 混淆矩阵的python代码 2.准确率(Accuracy).精确率(Precision).灵敏度(Sensitivity).召回率(Recall).特异度(Speci ...
- 模型评估指标 AUC 和 ROC,这是我看到的最透彻的讲解
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Webbley blog.csdn.net/liweibin ...
- 评估指标:混淆矩阵、PR、mAP、ROC、AUC
文章目录 TP.TN.FP.FN 准确率 Accuracy 和 错误率 Error rate 混淆矩阵 confusion matrix 查准率 Precision 和 召回率 Recall PR 曲 ...
- 深度学习(四十四)——GAN的评估指标, DCGAN, WGAN-GP, CGAN, BEGAN EBGAN
GAN的评估指标 尽管可用的GAN模型非常多,但对它们的评估仍然主要是定性评估,通常需要借助人工检验生成图像的视觉保真度来进行.此类评估非常耗时,且主观性较强.具备一定误导性.鉴于定性评估的内在缺陷, ...
- 分类算法中的ROC与PR指标
本文转自:http://blog.csdn.net/xiahouzuoxin/article/details/43165253 做过图像识别.机器学习或者信息检索相关研究的人都知道,论文的实验部分都要 ...
- 机器学习应用篇(五)——决策树分类实例
机器学习应用篇(五)--决策树分类实例 文章目录 机器学习应用篇(五)--决策树分类实例 一.数据集 二.实现过程 1 数据特征分析 2 利用决策树模型在二分类上进行训练和预测 3 利用决策树模型在多 ...
- R语言分类模型:逻辑回归模型LR、决策树DT、推理决策树CDT、随机森林RF、支持向量机SVM、Rattle可视化界面数据挖掘、分类模型评估指标(准确度、敏感度、特异度、PPV、NPV)
R语言分类模型:逻辑回归模型LR.决策树DT.推理决策树CDT.随机森林RF.支持向量机SVM.Rattle可视化界面数据挖掘.分类模型评估指标(准确度.敏感度.特异度.PPV.NPV) 目录
最新文章
- Vue项目启动报错 error:cannot find module xxx
- 【SpringCloud】Spring cloud 版本与 spring boot版本对应关系
- js页面传值php页面,php实现跳转传值有什么方法,js页面跳转传值
- VS2010 打包生成exe文件后 执行安装文件出现 TODO:lt;文件说明gt;已停止工作并已关闭...
- Nginx的反向代理实验
- 入驻蚂蚁金服财富号的基金公司,学“乖”了
- netmeeting 人数限止
- 酒店管理系统服务器网络,方讯酒店管理系统网络版安装配置说明.doc
- 腾讯云副总裁王慧星:持续加大基础设施投入规模和自研创新力度
- win7怎么更改浏览器主页?win7浏览器主页更改教程
- java 微信请求超时_java – SQL服务器“超出锁定请求超时时间”..再次
- ArcGIS——dwg与shp转换原理
- [4G/5G/6G专题基础-155]: 5G 3GPP高精确室内定位原理、AI方案概述
- MongoDB 数据文件损坏修复救命repair与致命危险
- linux7.5开放端口,Centos/linux开放端口
- 上海2021年高考成绩排位查询,2021年上海高考分数一分一段位次表,上海高考个人成绩排名查询方法...
- 基本数据类型python_Python中的基本数据类型
- 信息学复赛用linux,参加过信息学竞赛是怎样一种体验?
- 《如何阅读一本书》读后感1
- Mysql数据库基础第八章:窗口函数和公用表表达式(CTE)