分类模型的评估方法-召回率(Recall)

前2篇文章，介绍了正确率(Accuracy)和精确率(Precision)的评估方法。其中指出了正确率(Accuracy)虽然简单直观，但在很多时候并不是一个真正正确的评估指标。

那么精确率(Precision)可能会有什么问题呢?我们还是看看它的计算公式:

Precision=真阳真阳+假阳Precision=真阳真阳+假阳

Precision=\frac {真阳} {真阳+假阳}

如果“假阳=0”，那么精确率就是100%，这很好，但有什么问题呢?

举个例子：癌症检查数据样本有10000个，其中10个数据样本是有癌症，其它是无癌症。分类模型在无癌症数据中全都预测正确，在10个癌症数据中预测正确了1个，此时真阳=1，真阴=9990，假阳=0,假阴=9。根据精确率的计算公式：

Precision=11+0=100%Precision=11+0=100%

Precision=\frac {1} {1+0}=100\%

显然，这是不合理的。

因为”精确率“并没有考虑到”假阴“的问题，即它只关心查出来的”癌症”有多少是”真癌症”，至于是癌症但没査出来的，认为不是“癌症的”即”假阴“它管不着。但是，我们癌症检查的时候，有癌症却查出来”不是癌症“，这是非常要命的。

所以考虑这种情况，那么就需要用到召回率(Recall)，其计算公式为：

Recall=真阳真阳+假阴Recall=真阳真阳+假阴

Recall =\frac {真阳} {真阳+假阴}

上面癌症例子中，召回率的值为：

Recall=11+9=10%Recall=11+9=10%

Recall = \frac {1} {1+9}=10\%

即从召回率数值看，这个分类模型是不好的。

还是上面的例子：假设分类模型在无癌症数据9990中预测正确了9980个，在10个癌症数据中预测正确了10个。此时真阳=10，真阴=9980，假阳=10，假阴=0。则其精确度为10/(10+10)=50%，而召回率为10/(10+0)=100%。即精确度虽然不高，谎报了几个癌症，但是所有的真癌症都没有错过，这是非常重要的。

所以，各种分类评估指标各有优缺点，我们具体采用什么指标来评估分类模型，关键还是看我们的具体应用。如果是地震、癌症、欺诈交易等，我们宁愿有误报，但不能错过一个，这时就主要看召回率。如果是文档搜索，我们并不关心搜的全不全，搜出来的都是我们想要的信息就够了，那么就主要看精确率。

召回率(Recall)还有一个名称，叫查全率。但是注意，查全率这个名称主要用在信息检索领域.例如一个论文数据库，搜索”加器学习”相关论文，总共有100万篇论文，其中与机器学习相关的论文有2万篇，搜出来的文档数量为1万篇，其中真正与”机器学习”相关的文档数量为9000篇，那么查全率就是9000/(9000+（20000-9000）)=45%

分类模型的评估方法-召回率(Recall)相关推荐

分类模型的评估方法-精确率(Precision)
上一篇文章中,提到正确率(Accuracy)是机器学习分类任务中过得一个模型评估方法,并指出正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标. 那还有什么评估方法呢?我 ...
[机器学习] 二分类模型评估指标---精确率Precision、召回率Recall、ROC|AUC
一为什么要评估模型? 一句话,想找到最有效的模型.模型的应用是循环迭代的过程,只有通过持续调整和调优才能适应在线数据和业务目标. 选定模型时一开始都是假设数据的分布是一定的,然而数据的分布会随着时间 ...
机器学习：分类模型的评估精确率Presicion和召回率Recall
estimator.score() 准确率:预测结果正确的百分比混淆矩阵预测结果Predicted Condition 正确标记 True Condition 预测结果正例假例真实正例真 ...
准确率(Precision)、召回率(Recall)、F值对于模型的评估
一.有哪些模型评估方法? 在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前常常采用的评价指标有准确率(Precision).召回率(Recall).F值(F-Measur ...
机器学习模型评价指标：准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线
转自机器学习:准确率(Precision).召回率(Recall).F值(F-Measure).ROC曲线.PR曲线摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召 ...
机器学习各种模型评价指标：准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线
周志华老师的西瓜书的第2章:模型评估与选择摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召回率(Recall).F值(F-Measure)简介. 引言: 在机器学习 ...
机器学习分类问题指标理解——准确率(accuracy)、精确率(precision)、召回率(recall)、F1-Score、ROC曲线、P-R曲线、AUC面积
2020.08.25更新: 修改了ROC曲线中TPR公式的错误. 2020.07.25更新: 修改了混淆矩阵,每一行为实际值,每一列与预测值. 机器学习分类问题指标理解 0. 一个例子 1.准确率(A ...
准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure（对于二分类问题）
首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比.也就是损失函数是0-1损失时测试数据集上的准确率. 下面在介绍时使用一下例子: 一个 ...
分类、推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure) /(F-score)
分类.推荐系统评测指标-准确率(Precision).召回率(Recall).F值(F-Measure) /(F-score) 1.准确率与召回率(Precision & Recall) 准确 ...

分类模型的评估方法-召回率(Recall)

分类模型的评估方法-召回率(Recall)相关推荐

最新文章

热门文章