在运用机器学习或深度学习进行数据分类时,通常会用一些性能的指标来度量分类的效果。在这里我们介绍最常用的几种分类的性能度量指标(准确率、精确度、召回率、F1值、Kappa系数)。

对于二分类问题,我们的原始数据是被分为两类的(设他们分别是正、反类或0、1类),而在经过分类器分类之后,每一个数据样本都会被分类器认定为某一类(正(positive)或反(negative)),这也就是分类结果,最终判断其分类结果正确与否(true和false)。所以我们有一些符号设定:

把原数据集中为正类,分类后仍为正类的样本集合记为TP(true positive);
把原数据集中为正类,但分类后为反类的样本集合记为FN(false negative);
把原数据集中为反类,但分类后为正类的样本集合记为FP(false positive);
把原数据集中为反类,分类后仍为反类的样本集合记为TN(true negative);

如下表可以发现:T和F代表最终的分类结果是否正确;P和N代表分类的结果是正类或反类。

接下来,我们根据上面的基础总结几个分类性能评估指标:

准确率(accuracy)

准确即正确的,所以公式是所有的分类正确的样本数(正类预测为正类、反类预测为反类)除以总得样本数。

精确度(precision)

精确度也叫查准率,即研究区域为预测为正类的样本,表示的是在研究区域内,预测正确的样本所占比例。

召回率(recall)

召回率也叫查全率。其研究区域为原始类别为正类的所有样本。表示的是在该研究区域内,预测正确的样本所占的比例。

这这里,可以将精确度和召回率对比记忆。查准率,“准”是指预测的准确性,所以研究区域为预测为正类的样本。而查全率,“全”是指原始样本的完整性,所以研究区域为原始类别为正类的样本。

查准率和查全率是一对矛盾的度量。一般情况下,查准率高时,查全率往往偏低;而查全率高时,查准率往往偏低。

F1值

F1值为算数平均数除以几何平均数,且越大越好,将Precision和Recall的上述公式带入会发现,当F1值小时,True Positive相对增加,而false相对减少,即Precision和Recall都相对增加,即F1对Precision和Recall都进行了加权。

整理化简得:

Kappa系数

许多人会将Kappa系数和上述的度量指标搞混淆。Kappa系数用于一致性检验,也可以用于衡量分类精度,kappa系数的计算是基于混淆矩阵的。Kappa系数是一种比例,代表着分类与完全随机的分类产生错误减少的比例。

kappa系数是一种衡量分类精度的指标。它是通过把所有地表真实分类中的像元总数(N)乘以混淆矩阵对角线(Xkk)的和,再减去某一类地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方减去某一类地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的 。——引自百度百科

Po是每一类正确分类的样本数量之和除以总样本数。也就是上述的准确率(accuracy)。
假设每一类的真实样本个数分别为a1,a2,……,ac;
而预测出来的每一类的样本个数分别为b1,b2,……,bc
总样本数为n,
则有:

kappa计算结果为-1~ 1,但通常kappa是落在 0~ 1 间,可分为五组来表示不同级别的一致性:

0.0~ 0.20极低的一致性(slight);
0.21~ 0.40一般的一致性(fair);
0.41~ 0.60 中等的一致性(moderate);
0.61~ 0.80 高度的一致性(substantial);
0.81~1几乎完全一致(almost perfect)。

分类的性能度量(准确率、精确度、召回率、F1值、Kappa系数)相关推荐

  1. 精确度/召回率/F1值/Micro-F1和Macro-F1的理解

    如下图所示,假设有若干张图片,其中12张是狗的图片其余是猫的图片.现在利用程序去识别狗的图片,结果在识别出的8张图片中有5张是狗的图片,3张是猫的图片(属于误报). 图中,实心小圆代表狗的图片,虚心小 ...

  2. 聊一聊几种衡量推荐算法的度量---准确率、召回率、覆盖率、新颖度

    准确率 准确率用来衡量推荐结果中有多少推荐被用户所接受. 某电商网站推荐给我100个商品,而我点击了其中的20个商品 那么该电商网站推荐系统的准确率 = 20 / 100 = 0.2 准确率计算公式定 ...

  3. 准确率,召回率,F值,机器学习分类问题的评价指标

    下面简单列举几种常用的推荐系统评测指标: 1.准确率与召回率(Precision & Recall) 准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量.其中精度 ...

  4. Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 3926次阅读| 来源AirBNB/Data| 1 条评论| 作者Ariana Radianto

    Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 3926次阅读| 来源AirBNB/Data| 1 条评论| 作者Ariana Radianto ...

  5. Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事

     Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 504次阅读| 来源AirBNB/Data| 0 条评论| 作者Ariana Radiant ...

  6. 机器学习分类与性能度量

    机器学习分类与性能度量 数据集:训练集(Training Set).验证集(Validation Set)和测试集(Test Set) 1. 当模型无需人为设定超参数,所用参数都通过学习得到,则不需要 ...

  7. 准确率,召回率,mAP,ROC,AUC,特异性,敏感性,假阴性,假阳性

    P/R和ROC是两个不同的评价指标和计算方式,一般情况下,检索用准确率.召回率.F1.AP和mAP,分类.识别等用ROC和AUC(特异性和敏感性是ROC当中的一个部分). 准确率.召回率.F1.AP和 ...

  8. 机器学习中的准确率、召回率、F值详解

    机器学习算法中的准确率(Precision).召回率(Recall).F值(F-Measure): 摘要: 数据挖掘.机器学习和推荐系统中的评测指标-准确率(Precision).召回率(Recall ...

  9. 推荐系统中评测指标准确率和召回率

    推荐系统中的评测指标10个: 这10个并不就是全部的,它的评测指标有很多,比如用户满意度(最重要的指标).预测准确度.覆盖率.多样性.新颖性.信任度.实时性.健壮性和商业目标. 其中准确率和召回率是在 ...

最新文章

  1. HarmonyOS 2面世!是没有退路还是时机成熟?中国操作系统崛起元年或已到来
  2. CLR Via CSharp读书笔记(26) - 计算限制的异步操作
  3. subversion SVN
  4. 刘强东解读京东AI战略布局,沈南鹏高文杨强助阵谈AI机遇
  5. 语音识别十年来发展的历程
  6. 2013年C++A:神奇的算式
  7. 具有万有引力加速机理的布谷鸟搜索算法
  8. python xy 3_python(3):文件操作/os库
  9. 网站常用广告代码大全
  10. 2021年茶艺师(中级)考试内容及茶艺师(中级)操作证考试
  11. ibm tivoli_Tivoli Access Manager信任关联拦截器(TAI ++)
  12. c语言中d1的分辨率是,高分一号(GF-1)、高分一号B、C、D星 卫星介绍
  13. linux conforming code segment nonconforming code segment
  14. 考验AI对代词的理解力,解读艾伦AI研究所公布的数据集“QUOREF”
  15. 梦幻西游手游服务器维护时间,梦幻西游手游5.11维护公告
  16. POSIX是什么,为什么需要POSIX
  17. OpenCV学习17_ 分水岭算法
  18. java国内外详情研究动态,国内外研究现状分析及文献综述.doc
  19. 高维数组相乘的运算规则
  20. springboot2 配置404、403、500等错误页面自动跳转

热门文章

  1. R9000P 混合模式 system持续占用cpu 解决
  2. 如何用天纵手机APP快速开发框架开发手机APP
  3. C# 封装miniblink 使用HTML/CSS/JS来构建.Net 应用程序界面和简易浏览器
  4. pygame 安装不上
  5. 查看linux的防火墙状态
  6. 【C++】Mutex
  7. 决策树一CART算法(第四部分)
  8. css英文文本不换行,css怎么实现英文不换行
  9. mysql数据库如何克隆好友怎么弄_怎么把mysql一个数据库从一台机器上 拷贝到另外一台...
  10. pytorch中的掩膜mask