首先,有如下预备知识需要清楚,即分类的四个基本属性,而其他相关指标均是通过该四项属性进行组合计算得出的。

1. TP、TN、FP、FN

- Relevant NonRelevant
Retrieved true positives (tp) false positives(fp)
Not Retrieved false negatives(fn) true negatives (tn)

2. TPR、FPR

其中,

TPR = TP / (TP+FN);

表示当前分到正样本中真实的正样本所占所有正样本的比例;

FPR = FP / (FP + TN);

表示当前被错误分到正样本类别中真实的负样本所占所有负样本总数的比例;

3. Precision、Recall、F-Score

其中常见的Precision 和 Recall 定义如下:

Precision Definition

Recall Definition

实际上:
Recall = TPR,即当前被分到正样本类别中,真实的正样本占所有正样本的比例,即召回率(召回了多少正样本比例);
Precision就是当前划分到正样本类别中,被正确分类的比例(即正式正样本所占比例),就是我们一般理解意义上所关心的正样本的分类准确率;

虽然PrecisionRecall 的值我们预期是越高越好,但是这两个值在某些场景下却是存在互斥的,比如仅仅取一个样本,并且这个样本也确实是正样本,那么Precision = 1.0, 然而 Recall 可能就会比较低(在该样本集中可能存在多个样本);相反,如果取所有样本,那么Recall = 1.0,而Precision就会很低了。所以在这个意义上,该两处值需要有一定的约束变量来控制。

F-Score就是 Precision和 Recall的加权调和平均:

F-Score Definition

其中,当 α = 1时,则 F-Score 即为F1:

F1-Score Definition

当然 F1 综合了 PrecisionRecall 的结果,因此当 F1/F-Score 较高时,说明结果较为理想。

4. ROC curve

有了如上的预备知识,现在来看ROC curve就比较容易了。关于ROC的由来,以及相关概念这里就不在赘述,网上资料特别多,但是关键在于理解其中重要的相关概念。ROC是用来形象展现二分类的效果的。先看一个栗子:

ROC Curve

十分清晰,对于ROC来说,横坐标就是FPR,而纵坐标就是TPR,因此可以想见,当 TPR越大,而FPR越小时,说明分类结果是较好的。因此充分说明ROC用于二分类器描述的优势,但是除此之外,有一个新的问题:
ROC曲线并不能完美的表征二分类器的分类性能,那么如何评价?

5. AUC

AUC 即ROC曲线下的面积,计算方式即为ROC Curve的微积分值,其物理意义可以表示为:随机给定一正一负两个样本,将正样本排在负样本之前的概率,因此AUC越大,说明正样本越有可能被排在负样本之前,即分类额结果越好。
除了计算积分面积之外,还能如何计算AUC呢?
1)ROC Curve 面积计算法;
2)根据物理意义:对于所有的二元组合,假设样本集合包含 M个正样本、N个负样本,那么二元组即有 M* N个,对于M* N个根据各自的Score计算所有的正样本是否排在负样本之前,正确的技术所占比例即为AUC;

6. ROC Curve 绘制

ROC本质上就是在设定某一阈值之后,计算出该阈值对应的TPR & FPR,便可以绘制出ROC上对应的一个点,当设定若干个阈值之后,便可以连成ROC曲线,因此可以想见,当所采样的阈值越多,ROC Curve越平滑。

7. ROC的相关总结

  • 1) ROC 可以反映二分类器的总体分类性能,但是无法直接从图中识别出分类最好的阈值,事实上最好的阈值也是视具体的场景所定;
  • 2)ROC Curve 对应的AUC越大(或者说对于连续凸函数的ROC曲线越接近(0,1) )说明分类性能越好;
  • 3)ROC曲线一定是需要在 y = x之上的,否则就是一个不理想的分类器;

作者:chengjian666
链接:https://www.jianshu.com/p/be2e037900a1
来源:简书

ROC、Precision、Recall、TPR、FPR理解相关推荐

  1. Detection:目标检测常用评价指标的学习总结(IoU、TP、FP、TN、FN、Precision、Recall、F1-score、P-R曲线、AP、mAP、 ROC曲线、TPR、FPR和AUC)

    目录 前言 1. IoU 2. TP.FP.TN.FN 2.1 混淆矩阵 2.2 TP.FP.TN.FN的定义 2.3 TP.FP.TN.FN在目标检测中的对应内容 2.3.1 TP,FP在目标检测中 ...

  2. 模型评估指标-2-ROC与PR曲线对比,TPR/FPR/Precision关系,3种特殊的评估指标

    导语:在进阶篇里面,将会讨论ROC和PR曲线的联系,在不平衡数据中的偏差问题,同时利用公式来说明TPR/FPR/Precision三者之间的关系,在第三部分结合业务场景将介绍了几个特殊指标,但是没有说 ...

  3. 机器学习常用的评测指标Rank-n、Precision Recall、F-score、Map 、CMC、ROC Single shot 和Muti shot

    机器学习中常用的评测指标为:Rank-n.Precision & Recall.F-score.Map .CMC.ROC Single shot 和Muti shot,下面一个个进行介绍. 写 ...

  4. 机器学习分类器评价指标详解(Precision, Recall, PR, ROC, AUC等)(一)

    为了系统性地理解机器学习模型的不同评价指标及其之间的关系,我们将从其定义出发,探究其物理含义及彼此之间的联系,并从数学上给出相应的公式推导,以方便后续用到时复习理解.由于篇幅较长,因此将其分为两篇,这 ...

  5. 算法模型评价详解:confusion matrix Accuracy Precision Recall F1 调和平均 加权F1 Micro-F1 Macro-F1 PRC ROC AUC

    目录 问题定义 confusion matrix Accuracy Precision和Recall和PRC F1和调和平均 加权F1 Micro-F1和Macro-F1 ROC和AUC PRC对比R ...

  6. 逻辑回归模型混淆矩阵评价与ROC曲线最佳阈值的好处(附Accuracy,TPR,FPR计算函数)

    一.得到阈值在0.5和0.8下模型的混淆矩阵 y_prob=result.predict(X_test)#得到概率值y_predict1=pd.DataFrame(y_prob>0.5).ast ...

  7. ROC受试曲线AUC[TPR/ FPR/截断点/StratifiedKFold/KFold]

    概念 ROC和AUC定义 ROC全称是"受试者工作特征"(Receiver Operating Characteristic).ROC曲线的面积就是AUC(Area Under t ...

  8. 信息检索的评价指标(Precision, Recall, F-score, MAP)

    转载自: 信息检索的评价指标(Precision, Recall, F-score, MAP) - 小村长技术blog - 博客频道 - CSDN.NET http://blog.csdn.net/l ...

  9. Accuracy, Precision, Recall和F1-score解释

    本文解释分类问题常用评价指标Accuracy, Precision, Recall和F1-score 主要参考以下文章 多分类模型Accuracy, Precision, Recall和F1-scor ...

最新文章

  1. 2022年新能源汽车产业集群百人会
  2. 【敏捷开发】Node.js(nodejs)实现一个接口完成增删改查聚合接口4个功能,最大限度节省接口数量,正所谓“一口多用”(基础版、免登陆、无鉴权)
  3. SpringBoot------添加保存时自动编译插件
  4. Ubuntu安装Ceres库-安装依赖时报错:E:无法定位软件包 libcxsparse3.1.2_朱国鑫的博客-CSDN博客
  5. Android固定宽度文字自适应大小
  6. Minutes和TotalMinutes的区别
  7. html5中有哪些新属性,整理HTML5中表单的常用属性及新属性
  8. Hello Blazor:(14)CSS隔离
  9. 回顾经典,Netflix的推荐系统架构
  10. @Transactional +自定义注解不生效_SpringBoot之路(三)SpringDataJpa中常用注解的使用...
  11. Linux系统下的权限详解-1
  12. vue骨架屏以及seo优化
  13. golden gate 加initial load 在rac 上的配置
  14. 大一新生应该如何学习C语言,书上代码看不懂理解不了怎么办?
  15. 马蜂窝视频编辑框架设计及在 iOS 端的业务实践
  16. netd模块工作流程
  17. mysql统计每个学生的选课门数_SQL一个查询中包含两个聚集函数怎么弄啊例如,查询每名学生的选课门数和平均成绩怎么弄啊...
  18. 2018年deepin-wine QQ最完美解决方案
  19. MySQL【触发器】
  20. 计算机可以调剂到资源与环境吗,资源与环境求调剂 - 考研 - 小木虫 - 学术 科研 互动社区...

热门文章

  1. Vue项目生产环境解决跨域问题
  2. Eclipse设置文件/方法/类注释及自定义注释风格
  3. 【20】WAV格式歌曲
  4. Kotlin使用泛型搭建一个MVP最简单实例
  5. Android10定制Google开机向导
  6. java 区间 判断_java判断多个区间是否有重合
  7. pb删除指定文件夹下所有文件
  8. 世界上最远的距离——泰戈尔 (MP3下载)
  9. 基于vue的仿饿了么webapp
  10. 苹果CEO库克: 请无所畏惧,做最不愿接受现状的人丨2018年毕业典礼演讲