分类模型的评估方法-召回率(Recall)
前2篇文章,介绍了正确率(Accuracy)和精确率(Precision)的评估方法。其中指出了正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标。
那么精确率(Precision)可能会有什么问题呢?我们还是看看它的计算公式:
Precision=\frac {真阳} {真阳+假阳}
如果“假阳=0”,那么精确率就是100%,这很好,但有什么问题呢?
举个例子:癌症检查数据样本有10000个,其中10个数据样本是有癌症,其它是无癌症。分类模型在无癌症数据中全都预测正确,在10个癌症数据中预测正确了1个,此时真阳=1,真阴=9990,假阳=0,假阴=9。根据精确率的计算公式:
Precision=\frac {1} {1+0}=100\%
显然,这是不合理的。
因为”精确率“并没有考虑到”假阴“的问题,即它只关心查出来的”癌症”有多少是”真癌症”,至于是癌症但没査出来的,认为不是“癌症的”即”假阴“它管不着。但是,我们癌症检查的时候,有癌症却查出来”不是癌症“,这是非常要命的。
所以考虑这种情况,那么就需要用到召回率(Recall),其计算公式为:
Recall =\frac {真阳} {真阳+假阴}
上面癌症例子中,召回率的值为:
Recall = \frac {1} {1+9}=10\%
即从召回率数值看,这个分类模型是不好的。
还是上面的例子:假设分类模型在无癌症数据9990中预测正确了9980个,在10个癌症数据中预测正确了10个。此时真阳=10,真阴=9980,假阳=10,假阴=0。则其精确度为10/(10+10)=50%,而召回率为10/(10+0)=100%。即精确度虽然不高,谎报了几个癌症,但是所有的真癌症都没有错过,这是非常重要的。
所以,各种分类评估指标各有优缺点,我们具体采用什么指标来评估分类模型,关键还是看我们的具体应用。如果是地震、癌症、欺诈交易等,我们宁愿有误报,但不能错过一个,这时就主要看召回率。如果是文档搜索,我们并不关心搜的全不全,搜出来的都是我们想要的信息就够了,那么就主要看精确率。
召回率(Recall)还有一个名称,叫查全率。但是注意,查全率这个名称主要用在信息检索领域.例如一个论文数据库,搜索”加器学习”相关论文,总共有100万篇论文,其中与机器学习相关的论文有2万篇,搜出来的文档数量为1万篇,其中真正与”机器学习”相关的文档数量为9000篇,那么查全率就是9000/(9000+(20000-9000))=45%
分类模型的评估方法-召回率(Recall)相关推荐
- 分类模型的评估方法-精确率(Precision)
上一篇文章中,提到正确率(Accuracy)是机器学习分类任务中过得一个模型评估方法,并指出正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标. 那还有什么评估方法呢?我 ...
- [机器学习] 二分类模型评估指标---精确率Precision、召回率Recall、ROC|AUC
一 为什么要评估模型? 一句话,想找到最有效的模型.模型的应用是循环迭代的过程,只有通过持续调整和调优才能适应在线数据和业务目标. 选定模型时一开始都是假设数据的分布是一定的,然而数据的分布会随着时间 ...
- 机器学习:分类模型的评估精确率Presicion和召回率Recall
estimator.score() 准确率:预测结果正确的百分比 混淆矩阵 预测结果Predicted Condition 正确标记 True Condition 预测结果 正例 假例 真实 正例 真 ...
- 准确率(Precision)、召回率(Recall)、F值对于模型的评估
一.有哪些模型评估方法? 在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前常常采用的评价指标有准确率(Precision).召回率(Recall).F值(F-Measur ...
- 机器学习模型评价指标:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线
转自机器学习:准确率(Precision).召回率(Recall).F值(F-Measure).ROC曲线.PR曲线 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召 ...
- 机器学习各种模型评价指标:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线
周志华老师的西瓜书的第2章:模型评估与选择 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召回率(Recall).F值(F-Measure)简介. 引言: 在机器学习 ...
- 机器学习分类问题指标理解——准确率(accuracy)、精确率(precision)、召回率(recall)、F1-Score、ROC曲线、P-R曲线、AUC面积
2020.08.25更新: 修改了ROC曲线中TPR公式的错误. 2020.07.25更新: 修改了混淆矩阵,每一行为实际值,每一列与预测值. 机器学习分类问题指标理解 0. 一个例子 1.准确率(A ...
- 准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure(对于二分类问题)
首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比.也就是损失函数是0-1损失时测试数据集上的准确率. 下面在介绍时使用一下例子: 一个 ...
- 分类、推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure) /(F-score)
分类.推荐系统评测指标-准确率(Precision).召回率(Recall).F值(F-Measure) /(F-score) 1.准确率与召回率(Precision & Recall) 准确 ...
最新文章
- 年月日_C++计算输入的年月日是这一年的第几天
- java使用POI获取sheet、行数、列数
- Java中的策略设计模式-示例教程
- gromacs 安装_带你入门带你飞 gromacs材料计算模拟系列
- BugkuCTF-PWN题canary超详细讲解
- javascript中encodeURL对象、Boolean对象、Function对象、globalThis对象、Infinity对象、isFinite对象、isNaN对象、JSON对象
- [uva816]AbbottsRevenge Abbott的复仇(经典迷宫BFS)
- vxlan 分布式网关数据包转发过程_Vxlan基础
- 构建Docker镜像仓库的另一选择:Nexus3 - DockOne.io
- messagebox
- 『水晶报表』实现打印
- Go语言的前景、优点
- 唐代:李白《将进酒》《行路难》《蜀道难》《送友人》
- P1195口袋的天空
- windows media player 服务器运行失败
- 数据压缩——LZW 编解码算法实现与分析
- 如何将ios键盘返回由英文设置成中文
- 项目六总结 创建与使用存储过程
- 全体自然数的和是负十二分之一?
- U盘插入电脑后,有提示音,但不能显示出来,如何解决?
热门文章
- matlab与python交互_Python和MATLAB交互的基本操作
- java 快排_百度在年前会在打击一轮快排!
- 【数据结构-排序】5.九种排序设计分析
- 一个基于 Spring Boot 的项目骨架,拿走即用
- 蓝桥杯最短路(java过)spfa单源最短路算法
- 键盘鼠标录制哪个好用_好看好用还不贵的那种键盘鼠标真的有吗?这次还真让我碰到了...
- 如何快速上手mysql_如何快速上手数据库操作?
- 加载dict_PyTorch 7.保存和加载pytorch模型的两种方法
- 【必看】CCNA初学者必看的一篇文章
- 免费下载来自阿里巴巴 双11 的《云原生大规模应用落地指南》