类别不平衡问题

在二分类问题中,通常假设正负类别相对均衡(混淆矩阵),然而实际应用中类别不平衡的问题,如100, 1000, 10000倍的数据偏斜是非常常见的,比如疾病检测中未患病的人数远超患病的人数,产品质量检测中合格产品数量远超不合格产品等。在检测信用卡欺诈问题中,同样正例的数目稀少,而且正例的数量会随着时间和地点的改变而不断变化,分类器要想在不断变化的正负样本中达到好的检测效果是非常困难的。


由于类别不平衡问题的特性使然,一般常使用于评估分类器性能的准确率错误率可能就不再适用了。因为在类别不平衡问题中我们主要关心数目少的那一类能否被正确分类,而如果分类器将所有样例都划分为数目多的那一类,就能轻松达到很高的准确率,但实际上该分类器并没有任何效果。


True Positive (真正例,TP):实际为正例,预测为正例。

False Negative (假负例,FN):实际为正例,预测为负例。

True Negative (真负例,TN):实际为负例,预测为负例。

False Positive (假正例,FP):实际为负例,预测为正例。

                                     F1 score =

 F1 score 是一个综合指标,为Precision和Recall的调和平均 (harmonic mean),数值上一般接近于二者中的较小值

因此如果F1 score比较高的话,意味着Precision和Recall都较高。

类别不平衡问题 —— 各种评估指标相关推荐

  1. 类别不平衡问题之评估指标

    源自博客 https://zhuanlan.zhihu.com/p/34473430 https://zhuanlan.zhihu.com/p/34655990 以下是我的一些摘抄笔记 由于类别不平衡 ...

  2. 分类模型-评估指标(2):ROC曲线、 AUC值(ROC曲线下的面积)【只能用于二分类模型的评价】【不受类别数量不平衡的影响;不受阈值取值的影响】【AUC的计算方式:统计所有正负样本对中的正序对】

    评价二值分类器的指标很多,比如precision.recall.F1 score.P-R曲线等.但这些指标或多或少只能反映模型在某一方面的性能.相比而言,ROC曲线则有很多优点,经常作为评估二值分类器 ...

  3. 不平衡多分类问题模型评估指标探讨与sklearn.metrics实践

    我们在用机器学习.深度学习建模.训练模型过程中,需要对我们模型进行评估.评价,并依据评估结果决策下一步工作策略,常用的评估指标有准确率.精准率.召回率.F1分数.ROC.AUC.MAE.MSE等等,本 ...

  4. 目标检测扩(六)一篇文章彻底搞懂目标检测算法中的评估指标计算方法(IoU(交并比)、Precision(精确度)、Recall(召回率)、AP(平均正确率)、mAP(平均类别AP) )

    ​ 基本在目标检测算法中会碰到一些评估指标.常见的指标参数有:IoU(交并比).Precision(精确度).Recall(召回率).AP(平均正确率).mAP(平均类别AP)等.这些评估指标是在评估 ...

  5. 「机器学习速成」分类,评估指标(TP、FP、TN、FN),ROC曲线和AUC

    https://www.toutiao.com/a6706449645901464078/ 2019-06-25 20:49:47 大家好,今天我们学习[机器学习速成]之 分类,评估指标(TP.FP. ...

  6. Lesson 5.分类模型决策边界与模型评估指标

    Lesson 5.分类模型决策边界与模型评估指标(上) 在逻辑回归的算法基础内容结束之后,我们还需要补充一些关于分类模型的基础知识,包括观察分类模型判别性能的决策边界基本的概念与实现方法,同时也包括对 ...

  7. 如何解决NLP分类任务的11个关键问题:类别不平衡低耗时计算小样本鲁棒性测试检验长文本分类 JayLou娄杰

    原文链接:https://zhuanlan.zhihu.com/p/183852900 欢迎关注<高能AI>公众号- 声明:文中观点谨代表笔者个人立场,盲目搬运有风险- 在2020这个时间 ...

  8. 机器学习 | 分类评估指标

    文章目录 1. 分类评估指标 1.1 混淆矩阵 Confusion Matrix 1.1.1 scikit-learn 混淆矩阵函数接口 1.2 真阳性TP.假阳性FP.真阴性TN.假阴性FN 1.2 ...

  9. 深度学习分类任务常用评估指标

    摘要:这篇文章主要向大家介绍深度学习分类任务评价指标,主要内容包括基础应用.实用技巧.原理机制等方面,希望对大家有所帮助. 本文分享自华为云社区<深度学习分类任务常用评估指标>,原文作者: ...

最新文章

  1. error LNK2019: 无法解析的外部符号 __imp__inet_ntoa@4
  2. 内置类型存储空间(32位机参考)
  3. [WC2018]州区划分(FWT_OR卷积)
  4. P4555-[国家集训队]最长双回文串【Manacher】
  5. cookie里面用到的关键字_晓龙吊打面试官系列:synchronized关键字入门(同步方法与同步代码块)...
  6. 如何实现上一条、下一条的功能
  7. FPGA开平方的实现
  8. Android自定义控件学习(三)----- 自定义视图组件
  9. linux添加sshkey,使用SSH密钥对连接Linux实例
  10. CA服务器的安装和学习.
  11. POJ NOI MATH-7833 幂的末尾
  12. 模拟电路与数字电路基础知识及实训QY-DG760A
  13. 通过BIOS设置启用CPU虚拟化解决VMware虚拟机不支持X86_64位linux操作系统安装问题
  14. 网站优化中SEO关键词密度到底多少属于合理?
  15. JSP程序设计实训(十一)——JSP与Servlet技术(一)
  16. Bugku:分析 手机热点
  17. 【OpenGL学习笔记④】——纹理贴图【SOIL2的配置 + 绘制木板 + 纹理环绕】
  18. K3 单据,单据体自定义字段显示及时库存
  19. 关于Vuex的简单理解和使用
  20. 解决Cannot read properties of undefined (reading ‘name ‘)“found in,初次加载报错(user.classmate.name)

热门文章

  1. TCP三次握手原理,你真的了解吗?
  2. move_uploaded_file()
  3. javascript之回调函数小知识
  4. ApplicationListener,Game,Screen,Stage,Actor,Group
  5. 实用C#编程规范(转载)
  6. 编写简单的服务和客户端(C++)---ROS学习第10篇
  7. js添加多个子节点_JS创建DOM节点-使用document.createElement()创建子节点或同级节点...
  8. JNDI学习总结(1)——JNDI入门简介
  9. application.properties中自定义属性的使用
  10. 总结的一些json格式和对象/String/Map/List等的互转工具类