机器学习——算法常用评价指标

  • 一、常用评价指标
  • 二、案例

一、常用评价指标

参考书籍:《机器学习》——周志华

错误率: 分类错误的样本数占样本总数的比例
精度: 分类正确的样本数占样本总数的比例, 错误率+精度=1
查准率(precision): 算法挑出来的样本中有多少比例是正样本
查全率(recall): 所有的正样本中有多少比例被算法挑了出来

查准率与查全率是一对矛盾的度量。一般来说,查准率高,查全率就低;查全率高,查准率就高。
而在实际的模型评估中,单用查准率或者查全率来评价模型是不完整的,评价模型时必须用查准率/查全率两个值。一般有三种使用方法:平衡点(Break-Even
Point,BEP)、F1度量、F1度量的一般化形式。
这里只介绍F1度量:F1是基于查准率与查全率的调和平均定义的


显然F1越大越好

以《机器学习》西瓜问题为例

  • TP: 正确地标记为正,即算法预测它为好西瓜,这个西瓜真实情况也是好西瓜(双重肯定是肯定);
  • FP: 错误地标记为正,即算法预测它是好西瓜,但这个西瓜真实情况是坏西瓜;
  • FN: 错误地标记为负,即算法预测为坏西瓜,(F算法预测的不对)但这个西瓜真实情况是好西瓜(双重否定也是肯定);
  • TN: 正确地标记为负,即算法标记为坏西瓜,(T算法预测的正确)这个西瓜真实情况是坏西瓜。

西瓜总数:TP+FP+FN+TN
错误率:(FP+FN)/(TP+FP+FN+TN)
精度:(TP+TN)/(TP+FP+FN+TN)
查准率:TP/(TP+FP)
查全率:TP/(TP+FN)

二、案例

题目:
假设运用两套算法测试:从学生宿舍区一段监控视频中识别男生的人数。

实验结果如下:

1)算法1的检测结果:检测出“男生”人数82人,其中78人为男生,4人其实是女生;

2)算法2的检测结果:检测出“男生”人数88人,其中80人为男生,8人其实是女生;

3)经过人工检测,视频中实际准确的总人数为100人,其中男生80人,女生20人。

请问算法1和算法2的“查准率”“查全率”“F1-score”等分别是多少?你认为哪个更优秀?

答案:
算法1查准率:78/82,查全率:78/80,F1:156/162
算法1查准率:80/88,查全率:80/80,F1:160/168
156/162 > 160/168
所以算法1更好

机器学习——算法常用评价指标相关推荐

  1. 机器学习分类算法常用评价指标

    目录 1.准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 2.宏平均(Macro-averaging)和微平均(Micro-averaging) 3.Python3  sklea ...

  2. 机器学习算法常用指标总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 机器学习性能评价标准是模型优化的前提,在设计机器学习算法过程中,不 ...

  3. 预测评价系统_「机器学习」一文读懂分类算法常用评价指标

    前言 评价指标是针对将相同的数据,输入不同的算法模型,或者输入不同参数的同一种算法模型,而给出这个算法或者参数好坏的定量指标. 在模型评估过程中,往往需要使用多种不同的指标进行评估,在诸多的评价指标中 ...

  4. 搞懂机器学习的常用评价指标!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:陈安东,湖南大学,Datawhale成员 我与评价指标的首次交锋是 ...

  5. 【机器学习】搞懂机器学习的常用评价指标!

    作者:陈安东,湖南大学,Datawhale成员 我与评价指标的首次交锋是第一次实习面试时,面试官开头就问分类任务的评价指标.我当时TP,FP,FN,TN各种组合一顿上,回答得乱七八糟.后来经历多了,发 ...

  6. 机器学习模型常用评价指标(Accuracy, Precision, Recall、F1-score、MSE、RMSE、MAE、R方)

    前言 众所周知,机器学习分类模型常用评价指标有Accuracy, Precision, Recall和F1-score,而回归模型最常用指标有MAE和RMSE.但是我们真正了解这些评价指标的意义吗? ...

  7. 推荐算法常用评价指标:NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等

    1 混淆矩阵 TP(true positive):表示样本的真实类别为正,最后预测得到的结果也为正: FP(false positive):表示样本的真实类别为负,最后预测得到的结果却为正: FN(f ...

  8. 机器学习算法评价指标 recall(召回率)、precision(精度)、F-measure(F值)、ROC曲线、RP曲线

    机器学习中算法评价指标总结 recall(召回率).precision(精度).F-measure.ROC曲线.RP曲线 在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前 ...

  9. 【机器学习算法专题(蓄力计划)】一、机器学习简史和常用算法的梳理

    文章目录 机器学习简史 二十世纪五十年代:推理期 二十世纪七十年代中期:知识期 二十世纪八十年代:从样例中学习 符号主义学习 连接主义学习 二十世纪九十年代中期:统计学习 二十一世纪:深度学习 机器学 ...

最新文章

  1. 项目经理面试中可能遇到的问题
  2. 最直接的解决服务器宕机的方法
  3. Spring MVC中的视图解析ViewResolver
  4. idea-spark-sbt 打包jar
  5. 学计算机二级分数,2020年9月计算机二级考试成绩可以查了 多少分及格
  6. Codeforces Round #498 (Div. 3) F. Xor-Paths
  7. JDK1.8的接口新特性
  8. SAP License:SAP 销售成本会计VS期间会计
  9. Mstar平台_遥控器驱动
  10. STM32 LoRaWAN探索板B-L072Z-LRWAN1入门指南
  11. python 傅里叶变换_理解快速傅里叶变换算法
  12. 京东云618年中大促开始啦!
  13. 嗖嗖~您有一份上云计划待查收
  14. 如何高效的寻找Github项目
  15. tcpdump详解(转)
  16. SEM自动化管理工具的罩门
  17. 详细的FFmpeg编译流程与脚本分析
  18. 天载股票资讯碳中和今天较强的方向之一
  19. CD4046和CD4518B 组成的 100倍倍频器
  20. Java基础代码入门练习题(你也来试试?)

热门文章

  1. 4个万能的扫描工具,各种文件3秒扫描成电子档
  2. 【HCIP第15天学习(企业网的三层架构、VLAN)】
  3. 作为一个程序员,读不懂Spring就像读不懂对象的心?
  4. 家居家具行业外贸软件解决方案
  5. 实战spring自定义属性(schema)
  6. vite配置Router时报错error when starting dev server: Error: ENOTEMPTY: directory not empty
  7. 数据库知识【第1期】-- 数据库基础
  8. LeetCode - 刷题记录
  9. java 动态库_java调用dll动态库文件的一般总结
  10. 《Android 网络开发与应用实战详解》——2.3节Android系统架构