前2篇文章,介绍了正确率(Accuracy)精确率(Precision)的评估方法。其中指出了正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标。

那么精确率(Precision)可能会有什么问题呢?我们还是看看它的计算公式:

Precision=真阳真阳+假阳Precision=真阳真阳+假阳

Precision=\frac {真阳} {真阳+假阳}

如果“假阳=0”,那么精确率就是100%,这很好,但有什么问题呢?

举个例子:癌症检查数据样本有10000个,其中10个数据样本是有癌症,其它是无癌症。分类模型在无癌症数据中全都预测正确,在10个癌症数据中预测正确了1个,此时真阳=1,真阴=9990,假阳=0,假阴=9。根据精确率的计算公式:

Precision=11+0=100%Precision=11+0=100%

Precision=\frac {1} {1+0}=100\%

显然,这是不合理的。

因为”精确率“并没有考虑到”假阴“的问题,即它只关心查出来的”癌症”有多少是”真癌症”,至于是癌症但没査出来的,认为不是“癌症的”即”假阴“它管不着。但是,我们癌症检查的时候,有癌症却查出来”不是癌症“,这是非常要命的。

所以考虑这种情况,那么就需要用到召回率(Recall),其计算公式为:

Recall=真阳真阳+假阴Recall=真阳真阳+假阴

Recall =\frac {真阳} {真阳+假阴}

上面癌症例子中,召回率的值为:

Recall=11+9=10%Recall=11+9=10%

Recall = \frac {1} {1+9}=10\%

即从召回率数值看,这个分类模型是不好的。

还是上面的例子:假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了10个。此时真阳=10,真阴=9980,假阳=10,假阴=0。则其精确度为10/(10+10)=50%,而召回率为10/(10+0)=100%。即精确度虽然不高,谎报了几个癌症,但是所有的真癌症都没有错过,这是非常重要的。

所以,各种分类评估指标各有优缺点,我们具体采用什么指标来评估分类模型,关键还是看我们的具体应用。如果是地震、癌症、欺诈交易等,我们宁愿有误报,但不能错过一个,这时就主要看召回率。如果是文档搜索,我们并不关心搜的全不全,搜出来的都是我们想要的信息就够了,那么就主要看精确率。

召回率(Recall)还有一个名称,叫查全率。但是注意,查全率这个名称主要用在信息检索领域.例如一个论文数据库,搜索”加器学习”相关论文,总共有100万篇论文,其中与机器学习相关的论文有2万篇,搜出来的文档数量为1万篇,其中真正与”机器学习”相关的文档数量为9000篇,那么查全率就是9000/(9000+(20000-9000))=45%

分类模型的评估方法-召回率(Recall)相关推荐

  1. 分类模型的评估方法-精确率(Precision)

    上一篇文章中,提到正确率(Accuracy)是机器学习分类任务中过得一个模型评估方法,并指出正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标. 那还有什么评估方法呢?我 ...

  2. [机器学习] 二分类模型评估指标---精确率Precision、召回率Recall、ROC|AUC

    一 为什么要评估模型? 一句话,想找到最有效的模型.模型的应用是循环迭代的过程,只有通过持续调整和调优才能适应在线数据和业务目标. 选定模型时一开始都是假设数据的分布是一定的,然而数据的分布会随着时间 ...

  3. 机器学习:分类模型的评估精确率Presicion和召回率Recall

    estimator.score() 准确率:预测结果正确的百分比 混淆矩阵 预测结果Predicted Condition 正确标记 True Condition 预测结果 正例 假例 真实 正例 真 ...

  4. 准确率(Precision)、召回率(Recall)、F值对于模型的评估

    一.有哪些模型评估方法? 在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前常常采用的评价指标有准确率(Precision).召回率(Recall).F值(F-Measur ...

  5. 机器学习模型评价指标:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线

    转自机器学习:准确率(Precision).召回率(Recall).F值(F-Measure).ROC曲线.PR曲线 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召 ...

  6. 机器学习各种模型评价指标:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线

    周志华老师的西瓜书的第2章:模型评估与选择 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召回率(Recall).F值(F-Measure)简介. 引言: 在机器学习 ...

  7. 机器学习分类问题指标理解——准确率(accuracy)、精确率(precision)、召回率(recall)、F1-Score、ROC曲线、P-R曲线、AUC面积

    2020.08.25更新: 修改了ROC曲线中TPR公式的错误. 2020.07.25更新: 修改了混淆矩阵,每一行为实际值,每一列与预测值. 机器学习分类问题指标理解 0. 一个例子 1.准确率(A ...

  8. 准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure(对于二分类问题)

    首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比.也就是损失函数是0-1损失时测试数据集上的准确率. 下面在介绍时使用一下例子: 一个 ...

  9. 分类、推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure) /(F-score)

    分类.推荐系统评测指标-准确率(Precision).召回率(Recall).F值(F-Measure) /(F-score) 1.准确率与召回率(Precision & Recall) 准确 ...

最新文章

  1. 年月日_C++计算输入的年月日是这一年的第几天
  2. java使用POI获取sheet、行数、列数
  3. Java中的策略设计模式-示例教程
  4. gromacs 安装_带你入门带你飞 gromacs材料计算模拟系列
  5. BugkuCTF-PWN题canary超详细讲解
  6. javascript中encodeURL对象、Boolean对象、Function对象、globalThis对象、Infinity对象、isFinite对象、isNaN对象、JSON对象
  7. [uva816]AbbottsRevenge Abbott的复仇(经典迷宫BFS)
  8. vxlan 分布式网关数据包转发过程_Vxlan基础
  9. 构建Docker镜像仓库的另一选择:Nexus3 - DockOne.io
  10. messagebox
  11. 『水晶报表』实现打印
  12. Go语言的前景、优点
  13. 唐代:李白《将进酒》《行路难》《蜀道难》《送友人》
  14. P1195口袋的天空
  15. windows media player 服务器运行失败
  16. 数据压缩——LZW 编解码算法实现与分析
  17. 如何将ios键盘返回由英文设置成中文
  18. 项目六总结 创建与使用存储过程
  19. 全体自然数的和是负十二分之一?
  20. U盘插入电脑后,有提示音,但不能显示出来,如何解决?

热门文章

  1. matlab与python交互_Python和MATLAB交互的基本操作
  2. java 快排_百度在年前会在打击一轮快排!
  3. 【数据结构-排序】5.九种排序设计分析
  4. 一个基于 Spring Boot 的项目骨架,拿走即用
  5. 蓝桥杯最短路(java过)spfa单源最短路算法
  6. 键盘鼠标录制哪个好用_好看好用还不贵的那种键盘鼠标真的有吗?这次还真让我碰到了...
  7. 如何快速上手mysql_如何快速上手数据库操作?
  8. 加载dict_PyTorch 7.保存和加载pytorch模型的两种方法
  9. 【必看】CCNA初学者必看的一篇文章
  10. 免费下载来自阿里巴巴 双11 的《云原生大规模应用落地指南》