当面对一个机器学习问题时,有很多不同的思想来改进学习算法。

  1. 通过一个简单的算法来快速实现它,然后使用交叉验证集来测试数据;
  2. 画出相应的学习曲线;
  3. 误差分析;

  机器学习分类模型存在一种情况叫偏斜类。偏斜类简单理解就是在训练模型时由于正样本和负样本之间的严重不平衡,导致模型最后检测全部都是1或者全部都是0。

精确率和召回率
几个常用术语

1) True positives(TP):  被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;
2) False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;
3) False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;
4) True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。 


  精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是

  召回率针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。

  精确率和召回率作为遇到偏斜类问题的评估度量值。需要对精确率和召回率进行权衡,权衡的方法为使用F1Score:

  最终选择F1Score最高的算法3;

吴恩达机器学习(二十二)精确率和召回率相关推荐

  1. 吴恩达机器学习(十二)主成分分析(降维、PCA)

    目录 0. 前言 1. 主成分分析(PCA) 2. 主成分分析PCA的流程 3. 低维空间维度的选择 4. 主成分分析使用方式 学习完吴恩达老师机器学习课程的降维,简单的做个笔记.文中部分描述属于个人 ...

  2. 吴恩达机器学习(十二)—— 机器学习系统的设计

    吴恩达机器学习系列内容的学习目录→\rightarrow→吴恩达机器学习系列内容汇总. 1. 优先处理的工作:垃圾邮件分类例子 2. 误差分析 3. 偏斜类的误差度量 4. 查准率和查全率之间的权衡 ...

  3. 西瓜书+实战+吴恩达机器学习(十二)监督学习之AdaBoost

    文章目录 0. 前言 1. AdaBoost算法 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 Boosting:先训练一个基学习器,然后根据学习器的表现对样本 ...

  4. 吴恩达机器学习(十二)正规方程在矩阵不可逆的情况下的解决方法

    正规方程以及不可逆性   当计算θ = (XTX)-1XTy 的时候,如果矩阵XTX不可逆怎么办?   XTX不可逆的问题其实很少发生,在Octave中,如果使用pinv(X'*X)*X'*y来计算θ ...

  5. 吴恩达机器学习(十)支持向量机(SVM)

    目录 0. 前言 1. 代价函数(Cost Function) 2. 假设函数(Hypothesis) 3. 范数表示 4. 高斯核函数(Gaussian Kernel) 5. SVM实现多分类 6. ...

  6. 吴恩达机器学习(十六)机器学习流水线、上限分析

    目录 0. 前言 1. 流水线 2. 上限分析(Ceiling analysis) 学习完吴恩达老师机器学习课程的照片OCR,简单的做个笔记.文中部分描述属于个人消化后的理解,仅供参考. 如果这篇文章 ...

  7. 吴恩达机器学习(十四)推荐系统(基于梯度下降的协同过滤算法)

    目录 0. 前言 1. 基于内容的推荐算法(Content-based recommendations) 2. 计算电影特征 3. 基于梯度下降的协同过滤算法(Collaborative filter ...

  8. 吴恩达机器学习(十五)大规模机器学习(Batch、Stochastic、Mini-batch gradient descent、MapReduce)

    目录 0. 前言 1. Stochastic Gradient Descent 2. Mini-batch Gradient Descent 3. MapReduce 4. 在线学习(online l ...

  9. 吴恩达机器学习 Coursera 笔记(二) - 单变量线性回归

    Model and Cost Function 1 模型概述 - Model Representation To establish notation for future use, we'll us ...

  10. 吴恩达机器学习笔记(二) —— Logistic回归

    主要内容: 一.回归与分类 二.Logistic模型即sigmoid function 三.decision boundary 决策边界 四.cost function 代价函数 五.梯度下降 六.自 ...

最新文章

  1. 成功解决AttributeError: module tensorflow.compat has no attribute v1
  2. git中的删除命令操作
  3. 操作系统中的内存分配
  4. 分布式系统的面试题5
  5. CDH 组件升级:zookeeper升级到 3.4.14
  6. BugkuCTF-MISC题隐写3
  7. 201521123050 《Java程序设计》第8周学习总结
  8. 程序员的传奇“破圈”之路
  9. 关于python循环
  10. select选中值传递到后台action中
  11. 4台服务器集群搭建_Redis Cluster高可用集群搭建
  12. git-svn使用教程:git与svn进行同步
  13. 【阅读笔记】BI系统介绍及建设思路
  14. Unity体积光实现浅析
  15. 编程题(买帽子求第三便宜价格)
  16. 云主机被挖矿解决方法
  17. 优秀logo,最基础的设计技巧(五)
  18. 2021年起重机司机(限桥式起重机)最新解析及起重机司机(限桥式起重机)考试试卷
  19. IE浏览器中img标签不显示图片
  20. RStudio入门教程(二)RStudio数据处理

热门文章

  1. 解密阿里内部P级岗位
  2. 本科学计算机专业当海军可以分配什么兵种,当兵被分配到海军几率大吗 会分配到哪里...
  3. 全国工商联观摩 万企兴万村-万祥军:对话何华先国稻种芯三产融合
  4. steam搬砖,长期稳定副业,附防坑指南助你不掉坑
  5. 计算机二级真题汇总,【2017年整理】计算机二级历年真题汇总.doc
  6. C'EST UN TEST de français
  7. DL基石-卷积神经网络(CNN)简易教程
  8. c++ 文字识别_AI算法测试——语音识别(ASR)模型评估指标探索
  9. 非线性振动 matlab,基于MATLAB的车削细长轴过程非线性振动分析.pdf
  10. safari浏览器兼容css3旋转同时位移处理