首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。也就是损失函数是0-1损失时测试数据集上的准确率。

下面在介绍时使用一下例子:

一个班级有20个女生,80个男生。现在一个分类器需要从100人挑选出所有的女生。该分类器从中选出了50人,其中20个女生,30个男生。

准确率是指分类器正确分类的比例。正确分类是指正确的识别了一个样本是正例还是负例。例如分类器正确识别了20个女生和50个男生,正确识别的样本数是70个,因此该分类器的准确率是70%.

对于二分类问题,仅仅通过准确率不能很好的衡量分类器的性能,比如:

由准确率,我们的确可以在一些场合,从某种意义上得到一个分类器是否有效,但它并不总是能有效的评价一个分类器的工作。举个例子,google抓取了argcv 100个页面,而它索引中共有10,000,000个页面,随机抽一个页面,分类下,这是不是argcv的页面呢?如果以accuracy来判断我的工作,那我会把所有的页面都判断为"不是argcv的页面",因为我这样效率非常高(return false,一句话),而accuracy已经到了99.999%(9,999,900/10,000,000),完爆其它很多分类器辛辛苦苦算的值,而我这个算法显然不是需求期待的,那怎么解决呢?这就是precision,recall和f1-measure出场的时间了.

在说precision,recall和f1-measure之前,我们需要先需要定义TP,FN,FP,TN四种分类情况. 按照前面例子,我们需要从一个班级中的人中寻找所有女生,如果把这个任务当成一个分类器的话,那么女生就是我们需要的,而男生不是,所以我们称女生为"正类",而男生为"负类".

  相关(Relevant),正类 无关(NonRelevant),负类
被检索到(Retrieved) true positives(TP 正类判定为正类,例子中就是正确的判定"这位是女生") false positives(FP 负类判定为正类,"存伪",例子中就是分明是男生却判断为女生,当下伪娘横行,这个错常有人犯)
未被检索到(Not Retrieved) false negatives(FN 正类判定为负类,"去真",例子中就是,分明是女生,这哥们却判断为男生--梁山伯同学犯的错就是这个) true negatives(TN 负类判定为负类,也就是一个男生被判断为男生,像我这样的纯爷们一准儿就会在此处)

通过这张表,我们可以很容易得到这几个值: TP=20 FP=30 FN=0 TN=50

精确率(precision)的公式是P = \frac{TP}{TP+FP}P=TP+FPTP​,它计算的是所有"正确被检索的item(TP)"占所有"实际被检索到的(TP+FP)"的比例.

对于本文的例子来说,实际检索到了50个人,但是其中只有20个是正确的样本。因此精确率是40%

召回率(recall)的公式是R = \frac{TP}{TP+FN}R=TP+FNTP​,它计算的是所有"正确被检索的item(TP)"占所有"应该检索到的item(TP+FN)"的比例。

对于本文的例子来说,正确被检索到的样本为20个,全部应该被检索到的样本也是20个,因此召回率是100%

F1值就是精确值和召回率的调和均值,也就是

2/F1 = 1/P + 1/R

参考资料:

https://blog.argcv.com/articles/1036.c

转载于:https://www.cnblogs.com/earendil/p/8126341.html

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure(对于二分类问题)相关推荐

  1. python垃圾分类准确率计算公式_准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure...

    机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision), ...

  2. 【机器学习】准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

    在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前常常采用的评价指标有准确率(Precision).召回率(Recall).F值(F-Measure)等,下图是不同机器学习 ...

  3. 准确率、精确率、召回率、F1-measure简单总结

    - 相关(Relevant),正类 无关(NonRelevant),负类 被检索到(Retrieved) true positives(TP 正类判定为正类) false positives(FP 负 ...

  4. 准确率、精确率、召回率、F1-measure

    文章目录 准确率(Accuracy) 精确率(precision) 召回率(recall) F1-measure值 学习理解网站 - p'(Predicted) n'(Predicted) p(Act ...

  5. 准确率、精确率、召回率、F1(F-Measure)都是什么?

    机器学习ML.自然语言处理NLP.信息检索IR等领域,评估(Evaluation)是一个必要的工作,而其评论价值指标往往有如下几点: 准确率 Accuracy; 精准率 Precision; 召回率 ...

  6. 机器学习——二分类、多分类的精确率和召回率

    机器学习有很多评估的指标.有了这些指标我们就横向的比较哪些模型的表现更好.我们先从整体上来看看主流的评估指标都有哪些: 分类问题评估指标: 准确率 – Accuracy 精确率(差准率)- Preci ...

  7. auc计算公式_图解机器学习的准确率、精准率、召回率、F1、ROC曲线、AUC曲线

    机器学习模型需要有量化的评估指标来评估哪些模型的效果更好. 本文将用通俗易懂的方式讲解分类问题的混淆矩阵和各种评估指标的计算公式.将要给大家介绍的评估指标有:准确率.精准率.召回率.F1.ROC曲线. ...

  8. 机器学习面试题集-图解准确率,精确率,召回率

    https://www.toutiao.com/a6692359723615781389/ 今天进入第二章:模型评估 1. 什么是模型评估 模型训练后要对其进行评估,看模型表现如何,哪里可以改进 分类 ...

  9. [机器学习-总结] 什么是准确率, 精确率,召回率和(精确率和召回率的调和平均)

    准确率, 精确率,召回率和精确率和召回率的调和平均 1. 背景介绍 2. 准确率(accuracy) 3. 精确率(precision) 4. 召回率(recall,也称为查全率) 5. 精确率和召回 ...

最新文章

  1. POP3 SMTP DNS DHCP UDP HTTP FTP HTTPS Telnet WIDOWS TFTP 常用协议和默认端口,计算机网络的很需要!!!
  2. Facebook 3D视觉研究最新进展
  3. mysql基于init-connect+binlog完成审计功能
  4. 前些天做的一个物联网架构三层扩展
  5. 听说你,对薪酬待遇不太满意。。。
  6. 01.轮播图之四 :imageViews(2 或者 3 个imageview) 轮播
  7. gRPC的平滑关闭和在Kubernetes上的服务摘流方案总结
  8. 学成在线首页——静态页面基础项目(HTML+CSS)【学习笔记】
  9. while(条件) 语句;语句 容易理解错的一点
  10. HiveSQL和普通SQL的区别
  11. 高德导航java_通过拼接实现高清地图的下载-高德-java实现
  12. XML基础知识及四种解析方法
  13. 新单词 part 13
  14. canvas实现英雄联盟战力图
  15. Linux基础——makefile编写
  16. 专业课程解锁女性“蜕变”之秘 吕泉高维智慧实现行业新启航
  17. 关于解决webdriver更新后pycharm仍然报错版本不对的问题
  18. 对于结构体变量赋值的误区
  19. 修改docker_gwbridge的网段解决和内网ip冲突的问题
  20. 74hc595级联实现原理

热门文章

  1. Java中HashMap的常用操作
  2. 安卓机更新系统会卡吗_安卓机可以用AirPods Pro吗?告诉你真实体验
  3. 计算机科学与技术排名中澳合作,计算机科学与技术(中澳合作)2018培养方案.docx...
  4. (递推1)兔子繁殖问题
  5. 插入排序最优_排序专题插入排序
  6. java中的action是指什么_Struts2【开发Action】知识要点
  7. HTML+CSS+JS实现 ❤️酷炫的时光隧道旅行动特效❤️
  8. ccf魔数c语言,ccf 201609-4 交通规划
  9. mongodb创建local库用户_mongodb用户与角色使用
  10. android广播注册源码,android 广播源码简要分析-注册