梳理一下公式

sensitivity = recall

Precision和Recall虽然从计算公式来看并没有什么必然的相关性关系,但是,在大规模数据集合中,这2个指标往往是相互制约的。理想情况下做到两个指标都高当然最好,但一般情况下,Precision高,Recall就低,Recall高,Precision就低。所以在实际中常常需要根据具体情况做出取舍。

对于搜索应用,在保证召回率的条件下,尽量提升精确率。即减少假阳性率、搜索出无关的信息。

对于癌症检测、地震检测、金融欺诈等,则在保证精确率的条件下,尽量提升召回率。减少假阴性率、漏检、。

所以,很多时候我们需要综合权衡这2个指标,这就引出了一个新的指标F-score。这是综合考虑Precision和Recall的调和值。

当β=1时,称为F1-score,这时,精确率和召回率都很重要,权重相同。当有些情况下,我们认为精确率更重要些,那就调整β的值小于1,如果我们认为召回率更重要些,那就调整β的值大于1。

举个例子:癌症检查数据样本有10000个,其中10个数据祥本是有癌症,其它是无癌症。假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了9个,此时真阳=9,真阴=9980,假阳=10,假阴=1。

那么:
Accuracy = (9+9980) /10000=99.89%

recall = 9/10=90%

Precision=9/(9+10)= 47.36%

F1-score=2×(47.36% × 90%)/(1×47.36%+90%)=62.07%

F10-score=101× (47.36% × 90%)/(100×47.36%+90%)=89.2%

F0.5-score=(1+0.25)× (47.36% × 90%)/(0.25×47.36%+90%)=52.32%

F0.1-score=(1+0.01)× (47.36% × 90%)/(0.01×47.36%+90%)=47.58%

可以看到,当召回率更重要时,当β升高,F-score逼近于召回率。

当精确率更重要时,当β降低时,F-score逼近于精确率。

参考文献

https://blog.csdn.net/saltriver/article/details/74012163

为什么Precision高Recall就低——F1 score相关推荐

  1. R语言构建logistic回归模型并评估模型:计算混淆矩阵、并基于混淆矩阵计算Accuray、Precision、Recall(sensitivity)、F1、Specificity指标

    R语言构建logistic回归模型并评估模型:计算混淆矩阵.并基于混淆矩阵计算Accuray.Precision.Recall(sensitivity).F1.Specificity指标 目录

  2. 多分类f1分数_分类模型的F1-score、Precision和Recall 计算过程

    分类模型的F1分值.Precision和Recall 计算过程 引入 通常,我们在评价classifier的性能时使用的是accuracy 考虑在多类分类的背景下 accuracy = (分类正确的样 ...

  3. sklearn计算准确率、精确率、召回率、F1 score

    目录 混淆矩阵 准确率 精确率 召回率 P-R曲线 F1 score 参考资料 分类是机器学习中比较常见的任务,对于分类任务常见的评价指标有准确率(Accuracy).精确率(Precision).召 ...

  4. Spark - AUC、Accuracy、Precision、Recall、F1-Score 理论与实战

    一.引言 推荐场景下需要使用上述指标评估离.在线模型效果,下面对各个指标做简单说明并通过 spark 程序全部搞定. 二.指标含义 1.TP.TN.FP.FN 搜广推场景下最常见的就是 Ctr 2 分 ...

  5. 如何理解Precision和Recall?

    如何理解Precision和Recall? Precision ,在预测结果中,正确预测了多少?P可以联想到pedict,预测: Recall,在真实样本中,正确预测了多少?R可以联想到real,真实 ...

  6. 机器学习指标(Precision、Recall、mAP、F1 Score等)

    以下文章摘录自: <机器学习观止--核心原理与实践> 京东: https://item.jd.com/13166960.html 当当:http://product.dangdang.co ...

  7. F1 Score详解 查准率较高 召回率较低怎末处理?

    [机器学习]F1分数(F1 Score)详解及tensorflow.numpy实现_zjn-ai的博客-CSDN博客_f1分数 西瓜好坏二分类:模型预测出来:A分为好西瓜类(A中有好的有坏的) B分为 ...

  8. 机器学习中的 precision、recall、accuracy、F1 Score

    1. 四个概念定义:TP.FP.TN.FN 先看四个概念定义:  - TP,True Positive  - FP,False Positive  - TN,True Negative  - FN,F ...

  9. 分类问题的评价指标:多标签分类【基于标签度量(同多分类一样):准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1】【基于样本度量:Hamming Loss...】

    多标签分类的分类评价指标分为两大类: 基于标签上的度量:同多分类一样,在每一个标签上计算 Accuray.P.R.F-- 基于样本上的度量:又分为基于分类的度量.基于排序的度量 基于分类的度量:Sub ...

最新文章

  1. 使用BH1750测量激光发射器的强度
  2. BZOJ2091 [Poi2010]The Minima Game
  3. 基于阿里云 DNS API 实现的 DDNS 工具
  4. 设计模式 生成器_生成器设计模式的应用
  5. netty整合使用webscoket
  6. 01-07 Linux三剑客-grep
  7. 利用shell脚本远程磁盘分区
  8. 18.事件基础,event对象,clientX,clientY,keyCode
  9. 【优化算法】差分蜂群优化算法(DEABC)【含Matlab源码 1230期】
  10. java web表单系统
  11. 脚本文件BAT入门(1)
  12. ppt加音乐计算机一级,PPT2016背景音乐该怎么设置?
  13. 解决VMware虚拟机中Ubuntu 22.04无法联网, 安装VMwareTools失败,未发现软件包open-vm-dkms,open-vm-tools问题解决
  14. 程序员3年工资从7千到2万2,晒出跳槽经历!网友:厉害
  15. C - Write the program expr which evaluates a reverse Polish expression from the command line
  16. 网站小服务器地址,小网站需要云服务器地址
  17. TypeScript入门案例
  18. Qt setStyleSheet 透明图片叠加
  19. 让我们一起来做软件专利流氓吧
  20. LaTex将BibTex转换成bibitem

热门文章

  1. Web前端面试指导(一):写好简历是面试成功的第一步
  2. Android权限大全 (android.permission)
  3. 云适配陈本峰:多屏时代如何实现智慧政务?
  4. 山建大计算机学院,山建大丨历数20年来建大学生作业设计表达的前世今生
  5. python中成绩及格判断代码_python判断语句(第九节)
  6. springmvc 接收前台传入的文件
  7. html5学习笔记(二)(摘抄讲义加部分理解)
  8. 【C语言】练习:给出三角形三边长,求三角形面积
  9. C语言入门篇之练气化龙(八)(数组下卷)
  10. Paxos Made Practical