本文重点

上一节课程中我们学习了查准率和召回率,作为遇到偏斜类问题的评估度量值。那么究竟是查准率更好一些还是召回率更好一些呢?其实都不是,真正好的应该是使得查准率和召回率的相对平衡,那么这个相对平衡的就是F1值。

为什么需要F1值

现在我们训练一个肿瘤的分类器。我们的算法输出的结果在 0-1 之间,我们使用阀值 0.5 来预测真和假。也就是说如何分类器输出大于0.5那么我们可以认为这个人患有肿瘤,如果分类器小于0.5那么我们可以认为这个人没有患有肿瘤,但是实际上是否患有肿瘤这件事情很重要。

假如我们预测一个病人hθ(x)=0.51,那么我们说这个病人是癌症,虽然这样符合我们逻辑回归,但是仅仅比0.5多了0.01就预测癌症,多少有点不太靠谱,因为癌症发生的相对来说还是比较少的,所以我们可以设置阈值不是0.5,我们可以设置阈值为0.7,只有大于0.7的时候我们才预测y=1(有癌症),这样看起来就靠谱一些了。

我们将阈值设置为0.7的时候,这样预测y=1的病人会有较高的机率真正患有癌症,所以此时的模型会有较高的查准率,较低的召回率(查全率)。

我们将阈值设置为0.7会有一个问题,我们不能说小于0.7的就是没有癌症的,这样万一有的话,就可能耽误治疗,所以为了不让有癌症的人漏掉,我们可以设置我们的阈值为0.3,只要大于0.3,就可能有癌症,就要接受进一步的治疗,那么此时我们将获得一个较高的召回模型和较低的查准率。

F1值

那么现在就出现这个问题了,以上两个模型究竟哪个更好呢?或者说我们是想

每天五分钟机器学习:评价算法模型常用的数值评估方式——F1值相关推荐

  1. 每天五分钟机器学习:如何计算模型的假阳性率和真阳性率?

    本文重点 如上所示,我们学习了查准率和召回率,本文我们将学习真阳性率和假阳性率,学会这个对将来构建ROC曲线非常有帮助 真阳性率和假阳性率 假如使用测试集来评估一个分类模型(二分问题):所以样本实际值 ...

  2. svm分类器训练详细步骤_「五分钟机器学习」向量支持机SVM——学霸中的战斗机...

    大家好,我是爱讲故事的某某某. 欢迎来到今天的[五分钟机器学习]专栏内容 --<向量支持机SVM> 今天的内容将详细介绍SVM这个算法的训练过程以及他的主要优缺点,还没有看过的小伙伴欢迎去 ...

  3. 五分钟学会用Simulink模型生成HDL代码

    五分钟学会用Simulink模型生成HDL代码 1 核心步骤 2 视频展示 3 生成HDL代码的注意事项 3.1 HDL支持的库和模块 3.2 设置simulink模型为可生成 hdl 的模式 3.3 ...

  4. 每天五分钟机器学习:模型效果不好怎么办?使用诊断方法解决问题

    本文重点 当我们在设计机器学习的系统时,什么时候才能保证我们设计的过程是正确的,也就是说当模型出现问题,我们应该如何解决呢? 模型效果不好 通过对数据的学习得到了学习参数θ,所以我们的模型也就是假设函 ...

  5. 【机器学习】算法模型自动超参数优化方法

    什么是超参数? 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,我们称为参数(Parameter).还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,我们称为超参数(Hyper ...

  6. 每天五分钟机器学习:随着算法迭代次数动态调整学习率

    本文重点 我们使用的学习率往往是不变的,本节课程我们将令学习率随着迭代次数的增加而减小,这会对算法的学习有很大的好处. 好处 当我们运行随机梯度下降时,算法会从某个点开始,然后曲折的逼近最小值,但是不 ...

  7. 每天五分钟机器学习:PCA算法如何确定数据压缩降维的最佳维度?

    本文重点 上节课程中我们已经学习了pca算法,已经知道了如何将n维特征变量降到k维,k是PCA算法的一个参数,也被称为主成分的数量.那么现在就产生了一个问题,这个问题就是如何选择K,因为PCA要做的就 ...

  8. 每天五分钟机器学习:聚类算法中经常使用的肘部法则是什么?

    本文重点 如何选择聚类的数目K,也就是说我们要将数据聚成几簇.我们可以通过可视化的方式(画图),或者聚类算法的输出结果(试一试)来手动的决定聚类的数目,或者根据实际需要来确定我们想要聚成几簇,比如前面 ...

  9. 机器学习:算法模型:决策树

    原文链接:https://www.cnblogs.com/wenyi1992/p/7685131.html [基本流程] 分类决策树的核心思想就是在一个数据集中找到一个最优特征,然后从这个特征的选值中 ...

最新文章

  1. 从MATLAB帮助文档上学习 chirp
  2. CSDN移动助手v0.01发布
  3. 2.1.5 梯度检验
  4. 里面怎么缓存图片_浏览器缓存原理总结
  5. 识别手指pos 20个
  6. 01_kubernetes初始化系统和全局变量
  7. 笔记本Windows7系统安装教程
  8. SMPP协议,CMPP协议是啥子
  9. MariaDB安装教程
  10. 健身中有氧运动和无氧运动是什么?它们有什么区别?
  11. VMware下安装Raspbian树莓派系统
  12. html5把六张图片做成立方体,一篇文章教会你利用html5和css3实现3D立方体效果图...
  13. MSP430学习心得
  14. Python网络爬虫之HTTP原理
  15. 某计算机地址总线宽度为32位,这台计算机能够寻址的内存单元是多少?,某计算机地址总线宽度为32位,这台计算机能够寻址的内存单元是多少?...
  16. UAP扩展开发 - 新增按钮
  17. 迄今为止最深刻分析家乐福的文章—从商业模式、公司制度、公司文化三方面
  18. android switch设置背景文字,switchView
  19. C++入坑系列(五)之函数指针
  20. Windows Server 2003 介绍

热门文章

  1. 直播加热是什么意思?抖音直播加热方法有哪些?
  2. jquery input标签中 中checkbox全部选中与全部取消
  3. Java线程等待唤醒机制(加深理解)
  4. 【LeetCode 简单题】15-爬楼梯
  5. 《地图气球》小程序从产品到运维的个人全栈开发过程分享(长文)
  6. 德勤技术咨询 oracle,【内推】德勤急招Oracle/SAP功能、开发顾问,Siebel顾问,BI顾问,IT审计顾问...
  7. JAVAEE和项目开发——JSP详解
  8. 迭代器 iter()
  9. 2021年4月7日 关于三层交换机的配置及命令!!!
  10. 从RPA 向 IPA 转型升级!实在智能金秋发布会:重新定义流程自动化