机器学习-西瓜书-模型评估

  • 精度和错误率
  • 误差分析
  • 过拟合和欠拟合
  • 评估方法
    • 留出法
  • 交叉验证法
  • 自助法
  • 调参

本人的很多知识都是从西瓜书中摘录来的,只是在这基础上加上一些自己理解

精度和错误率

精度和错误率一般是在分类问题中用来衡量模型的型能的评估指标,我们通常将分类错误的样本数占样本总数的比例称为错误率。所以比如有a个样本分错了,总样本数为m个样本。
那么错误率=a/m

而精度正是和错误率相反的一个性能指标,我们通常把1-a/m称为精度

误差分析

在训练过程中,我们一般会出现两种误差
1.第一种在训练集上出现的误差一般称为训练误差,或者说是经验误差。
2.在新样本上的误差我们一般称为泛化误差

过拟合和欠拟合

其实我觉得这个两个已经非常熟悉的概念。
但是还是在这里提一下吧
过拟合:简单来说就是在模型在训练集上表现很好,在新样本上泛化能力非常弱。为什么会出现这种情况呢,因为我们的模型学习了太多训练集中的特征,不光一些我们需要的特征还有一些噪声一起学习进去了。
欠拟合:欠拟合则是模型在训练集上的表现就不太好,一般我们认为出现欠拟合则是模型没有学习到一些该有的特征

这幅图可以很清楚的展示欠拟合和过拟合的基本概念

评估方法

这里我介绍西瓜书中给的三种评估方法

留出法

其实我们在初学过程中经常用到的就是留出法,留出法是什么意思呢。简单理解就是对数据进行分层抽样(有的时候还不是分层抽样)
其实像经常我个人在目前初学阶段,划分数据集都是直接用sklearn的train_test_split方法来按照比例划分。有的时候也是自己根据数据集的长度来按照比例划分。sklearn的方法可以设置随机数来打乱数据。但是针对于分类问题,关于数据分类这个问题还是有很多细节问题需要注意的
我们一般做的是将70%的数据集切分为训练集,30%的数据集切分为验证集
但是这里我有一个疑问,以二分类任务为例,若原样本数据正反例分布本就没有经过过采样或者欠采样而使得正反例数据数量相同,那么按照留出法进行分层采样后是不是划分出的数据不平衡性会更大呢?
留出法虽然是我们经常使用的方法,但是留出法一次划分训练后的结果是不稳定的,所以我们通常采用若干次随机划分,再对重复实现的结果求平均值
留出法有个非常明显的缺点:若划分出来的训练集样本数量相比于样本总量而言比较小,会导致验证集相比比较大,同时会影响模型学习整个样本数据的分布特征。
同理,若训练集样本数量接近样本总量,那么验证集的数量就相对而言比较小,模型的泛化能力就得不到很好的体现。
这个问题目前没有很好的解决方法,所以一般把2/3-4/5的数据集作为训练集,剩余的作为测试集

交叉验证法

交叉验证法是不同于留出法的一种数据划分方法
其思路是:首先将数据集划分为K个大小相近的互斥子集。并为保证每个子集尽量拟合数据分布趋势。划分子集时通常采用分层抽样的方式。
在划分数据集后,形成一个K-1个训练集和1个测试集,随后对数据进行K次训练,每次以其中1个为测试集,剩下的K-1个作为训练集。
最后对K个测试集进行测试并得到结果后取平均值
我们常用的K值有5,10,20。最常用的是10,所以通常称为10折交叉验证法

在交叉验证法中,为避免采用同一划分子集方式引起的误差,我们通常使用 P次不同划分子集方式
所以最后我们的方法是P次K折交叉验证

交叉验证法的特例是留一法,每次用1个样本作为测试集,其他作为训练集。这样就需要对数据训练K轮

交叉验证法的优缺点
优点:能极大保证训练集和样本总量的分布接近
缺点:若数据量过大,则需要非常大的计算量

自助法

交叉验证法同样存在与留出法一样的缺点,那么为了更加有效的避免这个缺点。自助法由此而生
假设有m个样本的训练集D,我们每次从D中随机取一个样本放入D’中,再将这个样本放回D中。重复m次,我们就得到了一个与D数量一样的数据集D‘
那么我们取每个样本抽到m次的概率

通过计算公式可以得知,每次划分数据集后,大概D中会有36.8%的数据未出现在D’中,这样我们以D‘为训练集,D-D’为测试集。这样的测试结果我们称为包外估计。

自助法的缺点:自助法会改变数据原有的分布

调参

调参其实是我们自己对模型中的一些参数进行修改,从而影响模型的效果

机器学习-西瓜书-模型评估相关推荐

  1. 机器学习西瓜书-1-2章

    学习目标: 概览机器学习西瓜书 1.2章 学习内容: 第一章 绪论 1.1 基本术语 1.2 假设空间 1.3 归纳偏好 1.4 发展历程 第二章 模型评估与选择 2.1 经验误差与过拟合 2.2 评 ...

  2. 小白学机器学习西瓜书-第三章对数几率回归

    小白学机器学习西瓜书-第三章对数几率回归 3.3 对数几率回归 3.3.1 对数几率函数 3.3.1 估计参数 上一部分我们介绍了线性回归,包括简单的二元回归和多元回归,这两个主要解决的是拟合预测的问 ...

  3. 机器学习西瓜书(周志华)第七章 贝叶斯分类器

    第七章 贝叶斯分类器 1. 贝叶斯决策论 1.1 先验分布 1.2 后验分布 1.3 似然估计 1.4 四大概率在贝叶斯分类中指代含义 1. 朴素贝叶斯 7. 课后练习参考答案 1. 贝叶斯决策论 贝 ...

  4. 机器学习西瓜书南瓜书 神经网络

    机器学习西瓜书&南瓜书 神经网络 1. 神经元模型 神经网络:由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实事件物体所做出的交互反应. 神经网络最基本的成分 ...

  5. ML之ME/LF:机器学习中常见模型评估指标/损失函数(LiR损失、L1损失、L2损失、Logistic损失)求梯度/求导、案例应用之详细攻略

    ML之ME/LF:机器学习中常见模型评估指标/损失函数(LiR损失.L1损失.L2损失.Logistic损失)求梯度/求导.案例应用之详细攻略 目录 常见损失函数求梯度案例 1.线性回归求梯度 2.L ...

  6. ML之ME/LF:机器学习中的模型评估指标/损失函数(连续型/离散型)的简介、损失函数/代价函数/目标函数之间区别、案例应用之详细攻略

    ML之ME/LF:机器学习中的模型评估指标/损失函数(连续型/离散型)的简介.损失函数/代价函数/目标函数之间区别.案例应用之详细攻略 目录 损失函数的简介 损失函数/代价函数/目标函数之间区别 损失 ...

  7. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归

    本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...

  8. 周志华 《机器学习初步》模型评估与选择

    周志华 <机器学习初步>模型评估与选择 Datawhale2022年12月组队学习 ✌ 文章目录 周志华 <机器学习初步>模型评估与选择 一.泛化能力 二.过拟合和欠拟合 泛化 ...

  9. 机器学习基础:模型评估(下)

    目录 1. 引言 2. 进一步评估 3. 机器学习中的偏差和方差种类 3.1 过拟合 3.2 欠拟合 3.3 训练曲线观察泛化性 3.4 模型偏差和方差(bias and variance) 3.4. ...

  10. 《统计学习方法》-李航、《机器学习-西瓜书》-周志华总结+Python代码连载(一)--模型选择+误差评估

    一.模型选择 1.1 模型 模型就是学习的条件概率分布或者决策函数(这里只指监督学习).条件概率的集合:,决策函数的集合:.条件概率表示的模型为概率模型,决策函数表示的模型为非概率模型. 1.2 模型 ...

最新文章

  1. GoDaddy万用https ssl证书如何通过DNS审核
  2. 如何仅用递归函数和栈操作逆序一个栈——你要先用stack实现,再去改成递归——需要对递归理解很深刻才能写出来...
  3. jw player相关JS插件
  4. 从刷票了解如何获得客户端IP
  5. 在已安装win10环境中利用EasyBCD引导安装Ubuntu18.04(亲自测试,都是血和泪)
  6. 更锋利的C#代码-读书笔记
  7. 深度学习之循环神经网络(12)预训练的词向量
  8. 惊了!最通俗易懂的Djongo入门竟然在这里!
  9. Python3 encode中的unicode-escape和raw_unicode_escape
  10. Teamviewer 曝重大安全漏洞,攻击者可任意控制用户或属乌龙事件!(内附安全处理建议)...
  11. 信捷PLC之C函数编程(一)
  12. 气溶胶反演输入转化错误_暗目标法的Himawari-8静止卫星数据气溶胶反演
  13. 如何从技术上分析舌战群儒?
  14. 安卓TV开发遇到的那些坑
  15. python实现.jpeg转.jpg
  16. P3191 [HNOI2007]紧急疏散EVACUATE
  17. 如何高效设计游戏——塔防游戏设计方案
  18. java如何继承两个类?以及讨论一下多继承的利弊。
  19. eos采用的共识机制是_EOS共识机制
  20. python学习之路:期权定价与python实现

热门文章

  1. SLG手游卡牌类游戏机器人逻辑算法
  2. 【BZOJ4399】—膜法少女LJJ(线段树合并)
  3. IKEv2子网之间秘钥重协商
  4. Allegro对不规则outline处理
  5. 西普实验吧CTF-Hashkill
  6. 全国失信被执行人黑名单信息查询API接口
  7. httpclient中 RequestEntity和RequestBody区别
  8. 物理:相量代数式和相量极坐标式的互相转换
  9. UVA11584PartitioningByPalindromes
  10. 打造数字化转型IT生态系统的IT管理方法:IT4IT一瞥