查全率、查准率都和正类样本密切相关。为了便于理解这几个概念,我们给出如图 1 所示的示意图。

查全率与查准率

图 1:查全率与查准率

图中实心小圆圈代表正类样本,空心小圆圈代表负类样本,大圆形区域(由两个半圆区域构成)代表被分类系统判断为正类的样本。

查全率

查全率(Recall,简称 R,又称召回率)表示分类准确的正类样本数占全部正类样本总数的比例。针对二分类有:

R=TP/(TP+FN)

举例来说,在信息检索领域,假设一个搜索引擎返回的相关页面只有 9 个,另外 3 个相关页面并没有返回而是散落在观测范围之外。那么此时,就查询系统而言,查全率就是指检索出来的相关页面占系统中全部相关页面的百分比。查全率可用图 2 中的子图 (a) 表示。查全率反映的是检索的全面性,其补数就是漏检率。

查全率和查准率示意图

图 2:查全率和查准率示意图

查准率

查准率(Precision,简称 P)表示被预测正确的正类样本数占分类器判定为正类样本总数的比例。针对二分类有:

P=TP/(TP+FP)

需要注意的是,查准率和准确率(Accuracy)是有区别的。不论是查准率,还是查全率,它们的分子部分都是 TP(真正类样本),但分母部分有所不同。而准确率说的是被正确分类的样本数占全体样本数的比例,它的分子部分是两种被正确分类的样本数,一种是真正类样本数,一种是真负类样本数,分母则是全体样本数。

回到查准率上,我们还用信息检索的案例来说明。假设搜索引擎一共返回 13 个页面,其中 9 个是真正相关的,而另外 4 个是搜索引擎“自以为”相关的(实际并不相关)。查准率反映的是检索的准确性,即真正相关页面数占全部检索出的相关页面数的比例,其补数是误检率。查准率可用图 2 中的子图 (b) 表示。

一般来说,查准率高时,查全率往往偏低;反之,查全率高时,查准率往往偏低。举例来说,在历史上,有这么一句狠话:“宁可错杀一千,不可放过一人”。这里我们不去追寻这句话的含义,单纯从机器学习的角度来看,它追求的就是查全率,为了查全,不惜错杀,这时查准率势必不高。

F1分数

为了兼顾查准率和查全率,人们还提出了另一个衡量标准—F1 分数:

F1=2×{(P × R)/(P + R)}

本质上,F1 分数其实是 P 和 R 的调和平均数:

1/F1=1/2{(1/P)+(1/R)}

不同应用对查准率和查全率的重视程度不同,因此 F1 分数并不是对 P 和 R 的简单平均。例如,在商品推荐系统中,为了尽可能少地打搅用户,提升用户体验,往往希望检测出来的商品信息尽可能准确,这就要求查准率高。而在逃犯检索系统中,往往希望尽可能少地漏掉逃犯,此时查全率更重要。

为了有所倾向,F1 分数更通用的表达形式 Fβ 如下:

1/Fβ=1/(1+β2){(1/p)+(β2/R)}

其中,β 是衡量查全率和查准率相对重要性的比值。由上面公式可进一步推导出:

Fβ=(1+β2){1/(1/P+β2/R)}

从上面公式可以看出,当 1>β 时,β2/R 项占比较大,即查全率对 Fβ 的影响更大;反之,当 1<β 时,查准率对 Fβ 的影响更大;当 1=β 时,Fβ 即为 F1。

查全率、查准率与F1分数相关推荐

  1. [吴恩达机器学习笔记]11机器学习系统设计3-4/查全率/查准率/F1分数

    11. 机器学习系统的设计 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料 斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 11.3 偏斜类的误差度量 Error Metr ...

  2. 机器学习_评价指标Accuracy(准确率)、Precision(精准度/查准率)、Recall(召回率/查全率)、F1 Scores详解

    首先我们先上一个整体的公式: 混淆矩阵 真实情况 T或F 预测为正1,P 预测为负0,N 本来的label为1,则预测结果正的话为T,负的话为F TP(正样本预测为正) FN(正样本预测为假) – – ...

  3. 多分类f1分数_机器学习之分类模型评估总结

    一.概述 在机器学习模型搭建好之后,需要对模型进行评估,针对不同的算法模型有不同的评估方法,比如:分类算法.回归算法.聚类算法等,本文主要是针对分类算法的模型评估方法进行总结整理,便于自己对评估方法的 ...

  4. 目标检测评价指标汇总—mAP,PR曲线,F1分数,FPPI,log-average miss rate等

    对于了解目标检测的评价指标是很重要的,否则自己不懂这个代表什么意思,如何调参.网上有太多资料,可是杂乱,甚至有一乱说,记录下自己所学,总结下,也分享出来,也便于自己自己复习. 分为三块,1.解释相关概 ...

  5. 评价对象检测模型的数字度量:F1分数以及它们如何帮助评估模型的表现

    来源:DeepHub IBMA本文约2000字,建议阅读7分钟 本文为你介绍评价对象检测模型的数字度量. 介绍 使用精度和召回率评估目标检测模型可以为模型在不同置信度下的表现提供有价值的见解.类似地, ...

  6. 多分类f1分数_如何计算多标签分类中的F1测度?

    我正在研究句子类别检测问题.其中每个句子可以属于多个类别,例如:"It has great sushi and even better service." True Label: ...

  7. 记录F1分数和召回率

    内容 参考博文: F1分数以及micro.macro区别 对于上面说的矩阵是不是挺懵的,它的真名叫混下矩阵,看下面 混淆矩阵 所有正确的预测结果都在对角线上,所以从混淆矩阵中可以很方便直观的看出哪里有 ...

  8. 机器学习之选择小样本交叉验证训练模型并使用精确率、召回率、F1分数和AUC值、画出ROC曲线评估

    题目如下 (1)读入aviation数据集,设置MEMBER_NO为索引列:(4分) (2)剔除重复值.缺失值.(4分) (3)随机抽取500样本,切片特征X和标签Y:(4分) 因为调参很慢,所以这里 ...

  9. 8. 关于打分函数F1分数 TPR PPV等

    总结至https://blog.csdn.net/qq_21997625/article/details/79853483 1.PPV=nrow(tp)/(nrow(tp)+nrow(fp)) #wy ...

最新文章

  1. 加速 cinder 删除volume速度
  2. opencv-python 9.4 拆分及合并图像通道
  3. 当推荐系统遇上多模态Embedding
  4. Android----Allapps加载流程详解【AndroidICS4.0——Launcher系列五】
  5. 51Nod-1008 N的阶乘 mod P【模除】
  6. Win32Asm学习笔记[不断更新]
  7. ireport 分页配置每也显示多少条_最简洁的分页插件PageHelper
  8. weblogic控制台超时时间_WebLogic如何设置session超时时间
  9. 解决 此 Flash Player 与您的地区不相容 问题
  10. Ubuntu通过清华镜像源下载软件
  11. 小麦亩产一千八(kela)
  12. 游戏开发中的贝塞尔曲线,曲线和路径
  13. 如何用 Python 和 Pandas 分析犯罪记录开放数据?
  14. CryEngine ViewMat
  15. Cause: org.postgresql.util.PSQLException: 错误: 对于可变字符类型来说,值太长了(255)
  16. Fidder 请求信息颜色的含义
  17. 学生管理系统登入页面
  18. 常见的网页布局解决方案
  19. Oracle:ORA-24247: 网络访问被访问控制列表 (ACL) 拒绝
  20. LeetCode 202次周赛 1553. Minimum Number of Days to Eat N Oranges

热门文章

  1. win10系统隐藏u盘EFI分区的方法
  2. split方法后面为空的问题
  3. 使用mysql导入本地文件文件时提示ERROR 1148 (42000): The used command is not allowed with this MySQL version
  4. 完美解决MySQL错误日志出现大量的 Got an error reading communication packets 报错
  5. ####好好好######信息抽取——实体关系联合抽取
  6. clangllvm简介
  7. 远程服务器内存不足黑屏,手机内存不足,频繁卡机黑屏?别怕,一分钟教你正确解决方法...
  8. 异或运算法则 hdu 2095
  9. 前端JavaScript(2) --常用内置对象,函数,伪数组 arguments,关于DOM的事件操作,DOM介绍...
  10. 不懂算法,进大厂,真香!