文章目录

  • 准确率(Accuracy) 精确率(Precision) 召回率(Recall)和F1-Measure(精确率和召回率的调和平均值)
    • Spark 构建分类模型
    • 先验知识
    • 准确率(Accuracy)
    • 精确率(Precision)
    • 召回率(Recall)
    • F1-Measure
    • 总结

准确率(Accuracy) 精确率(Precision) 召回率(Recall)和F1-Measure(精确率和召回率的调和平均值)

Spark 构建分类模型

学习分类模型的基础知识以及如何在各种应用中使用这些模型。分类通常指将事
物分成不同的类别。在分类模型中,我们期望根据一组特征来判断事物的类别,这些特征代表了
与物品、对象、事件或上下文相关的属性(变量)。

最简单的分类形式是分为两个类别,即二分类。一般将其中一类标记为正类(记为 1),另
外一类标记为负类(记为1 或者 0)。下图展示了一个二分类的简单例子。例子中输入的特征有
二维,分别用 x 轴和 y 轴表示每一维的值。我们的目标是训练一个模型,它可以将这个二维空间
中的新数据点分成红色和蓝色两类。

先验知识

我们首先将数据的类别统一分为两类:正类和负类。例如:一个数据集中的数据一共有3类,小学生、中学生、高中生。我们的目标是预测小学生,那么标记为小学生的数据就是正类,标记为其他类型的数据都是负类。

数据有两种状态:测试集数据和预测结果数据。对一批测试数据进行预测,结果可以分成四种。

  • TP(True Positive): 原本是正类,预测结果为正类。(正确预测为正类)
  • FP(False Positive): 原本是负类,预测结果为正类。(错误预测为正类)
  • TN(True Negative): 原本是负类,预测结果为负类。(正确预测为负类)
  • FN(False Negative): 原本是正类,预测结果为负类。(错误预测为负类)

如图所示:

准确率(Accuracy)

对于给定的测试数据集,分类器正确分类的样本数与样本总数之比,就称为准确率,即(TP+TN)/(TP+TN+FP+FN)

精确率(Precision)

在预测结果为正类的数据中,有多少数据被正确预测(原本就是正类),即TP/(TP+FP)。
  对应于检索中的查准率,检索出相关文档数/检索出的文档总数
精确率就是说 在所有预测数据中 的 预测成功率

召回率(Recall)

在测试集中为正类的数据中,有多少数据被正确预测(预测结果是正类),即TP/(TP+FN)。
  对应于检索中的查全率。检索出相关文档数/文档库中相关文档总数
召回率就是说在你所有样本数据

F1-Measure

精确率和召回率的调和平均值:Accuracy * Precision * 2 / (Accuracy + Precision)

总结

理论上,数据预测的准确率和召回率越接近1,说明预测模型的效果越好。但是实际中也不一定,取决于场景更倾向于哪一种。例如我们去某搜索引擎搜索XX病,一共返回了10条结果,其中5条广告,5条有用的相关信息,那么准确率就是50%,而后台数据库中一共就5条有用的相关信息,召回率却是100%,所以大家就认为这个搜索引擎也能凑合用。

区别精确率和召回率主要记住他们是分母不同就好了,召回率是对应测试集中的正类数据而言,而准确率是对应预测结果为正类的数据而言。

准确率(Accuracy) 精确率(Precision) 召回率(Recall)和F1-Measure(精确率和召回率的调和平均值)相关推荐

  1. 准确率(Accuracy) | 查准率(Precision) | 查全率(Recall)

    目录 样本 识别结果 指标计算 Accuracy(准确率) Precision(精确率.查准率) Recall (召回率.查全率) 为什么要不同的指标? 综合评价 (F-Score) 在机器学习中,对 ...

  2. 分类模型的评估方法-精确率(Precision)

    上一篇文章中,提到正确率(Accuracy)是机器学习分类任务中过得一个模型评估方法,并指出正确率(Accuracy)虽然简单直观,但在很多时候并不是一个真正正确的评估指标. 那还有什么评估方法呢?我 ...

  3. FP、FN、TP、TN、精确率(Precision)、召回率(Recall)、准确率(Accuracy)评价指标详述

    来自微信公众号:小白CV关注可了解更多CV,ML,DL领域基础/最新知识;如果你觉得小白CV对您有帮助,欢迎点赞/收藏/转发 在机器学习领域中,用于评价一个模型的性能有多种指标,其中几项就是FP.FN ...

  4. 准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure(对于二分类问题)

    首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比.也就是损失函数是0-1损失时测试数据集上的准确率. 下面在介绍时使用一下例子: 一个 ...

  5. python垃圾分类准确率计算公式_准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure...

    机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision), ...

  6. FP、FN、TP、TN、精确率(Precision)、召回率(Recall)、准确率(Accuracy)是什么意思

    在机器学习领域中,用于评价一个模型的性能有多种指标,其中几项就是FP.FN.TP.TN.精确率(Precision).召回率(Recall).准确率(Accuracy).这里我们就对这块内容做一个集中 ...

  7. Precision(精确率,正确率), Recall(召回率,查全率),Accuracy(准确率),F-Measure(F值)...

    一.指标概念 TP - 将正类预测为正类 FN - 将正类预测为负类, 类似假设检验中的第一类错误,拒真 FP - 将负类预测位正类,类似假设检验中的第二类错误,取伪 TN - 将负类预测位负类 假设 ...

  8. Python混淆矩阵(confusion_matrix)FP、FN、TP、TN、ROC,FROC,精确率(Precision),召回率(Recall),准确率(Accuracy),F1分数详述与实现

    目录 一.FP.FN.TP.TN 二.准确率(Accuracy).精确率(Precision).召回率(Recall).F1score 2.1.准确率(Accuracy) 2.2.召回率(Recall ...

  9. 【机器学习】准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

    在机器学习.数据挖掘.推荐系统完成建模之后,需要对模型的效果做评价. 业内目前常常采用的评价指标有准确率(Precision).召回率(Recall).F值(F-Measure)等,下图是不同机器学习 ...

  10. 机器学习分类问题指标理解——准确率(accuracy)、精确率(precision)、召回率(recall)、F1-Score、ROC曲线、P-R曲线、AUC面积

    2020.08.25更新: 修改了ROC曲线中TPR公式的错误. 2020.07.25更新: 修改了混淆矩阵,每一行为实际值,每一列与预测值. 机器学习分类问题指标理解 0. 一个例子 1.准确率(A ...

最新文章

  1. 雅虎宣布关闭旗下7个数字杂志
  2. python opencv 内存泄露_解决python中显示图片的plt.imshow plt.show()内存泄漏问题
  3. centos 7 nginx hhvm mysql_CentOS 7 编译安装 HHVM 3.4.1
  4. 基础算法 —— 高精度计算 —— 高精度乘法
  5. 计算机网络基本操作命令的使用,计算机网络-路由器基本命令操作实验指导书--华为...
  6. SpringSecurity系列(四) Spring Security 实现权限树形菜单
  7. 功夫小子实践开发-英雄实体类的基本分析和实现
  8. C++ STL 学习 :for_each与仿函数(functor)
  9. HTML5 实现拼图游戏
  10. C++过河(动态规划dp)
  11. Unity 本地化比较实用的实现方案
  12. MongoDB~从入门到入坑。
  13. apachecn归档下载
  14. 开发用于互操作性的应用程序_云标准:确保云应用互操作性的工具
  15. 西门子杯流程工业及其自动化(1)
  16. LeetCode1-320题汇总,希望对你有点帮助!
  17. L1-040 最 佳情侣身高差
  18. 【前端学习】CSS入门
  19. c语言遍历文件内容_编程语言安全性排行榜:Ruby 最佳,C 语言漏洞最多
  20. 困扰我一周左右的semver

热门文章

  1. 解决mac系统压缩文件.zip,在win解压后,出现乱码
  2. 有趣!让你的桌面独一无二——iWall for Mac2.1.1破解版可以交互的动态桌面壁纸!
  3. 怎样把小米手机便签内容转存到百度网盘中去?
  4. 任玉刚【Android开发艺术探索】读后笔记一
  5. java递归算法 空瓶换水_公务员考试行测指导:思维策略之空瓶换水
  6. 地理信息安全在线培训考试系统题库-单选题
  7. jrebel离线激活_jrebel激活
  8. 中国历史37位奇女子
  9. sql添加字段并设置外键
  10. vue项目实战-电商后台管理系统