周志华《机器学习初步》模型评估与选择

Datawhale2022年12月组队学习 ✌

文章目录

周志华《机器学习初步》模型评估与选择
一.泛化能力
二.过拟合和欠拟合
- 泛化误差 VS 经验误差
- 过拟合 VS 欠拟合
三.模型选择的三大问题
- 如何获得测试结果：评估方法
- 如何评估性能优劣：性能度量
- 如何判断实质差别：比较检验
四.评估方法
- 怎么样得到测试结果？
- 流出法
- k-折交叉验证法
- 自助法
五.调参与验证集
- 参数和超参数
- 验证集（validation set）
六.性能度量
- 回归（regression）任务常用均方误差
- 错误率
- 精度
- 查准率 vs 查全率
- - 查准率 Precision
  - 查全率 Recall
  - F1度量
  - - 若对P/R有不同偏好
七.比较检验
- 常用方法
参考资料

一.泛化能力

我们当然是要学一个好的模型，但是什么模型好？这个问题不易回答。可以希望这个模型能够很好的适用于我们没有见过的样本，很好的适用于 unseen instance。
但是问题是什么叫”好“？可能有一些基本理解，比如错误率低，精度高，做 100 次如果能做对 99 次，这比做对 80 次要好。但这还是不易说出来。
比如我们考虑做推荐。一个淘宝上的电商，希望有一个机器学习的系统能把推荐做好。
- 比如说我手机上只看到 5 个东西，这 5 个东西推荐的都是我想要的，至于你第6个开始是不是好的，我不关心。
- 但是对另外一个人来说，在电脑上看，一下能看 15 个。要前 15 个都好才行。
- 这两个是完全不同的结果。
我们最希望的结果是一个东西对所有的标准都好，但这不太现实，太困难。所以我们要做的是搞清楚你要的到底是什么，我把你要的给你就好了，我不用关心对别人来说好不好。其实这和我们刚才说的 no free lunch 是同一个思想。
- 如果只关心前 5 个推荐是正确的，就不用去关心第 6 个开始推荐正不正确。
- 这实际上是做机器学习的人在看待问题的一个世界观或者方法论 O(∩_∩)O
  
  很多做机器学习的人，会认为给你数据你就去跑，跑个算法，跑个结果，回来把结果给我，我说结果不好，你再给我一个新结果。其实不是这样的。
  
  我们通常会要搞清楚你到底要什么，只有我把你到底要什么搞清楚了，我才知道我要给你什么。
- 模型评估和选择要解决这个问题，一方面我们要知道你到底要什么，另一方面我还要知道我给你的是不是你要的？这就是我们要解决的关键的背后的这两个问题。而这两个问题从技术上表现来看，它的表现形式可能又要拆解为具体的进几步要讨论的技术问题。
总的来说，一个模型的泛化能力强，就是对新的没有见过的数据的处理能力强。

但是问题是，就算我知道你想要的是什么，我手上没有没见过的数据，我怎么知道我给你的东西恰恰是在没见过的数据上表现的特别好，真的是你想要的呢？

周志华《机器学习初步》模型评估与选择相关推荐
1. 《机器学习》周志华第二章——模型评估与选择笔记
  <机器学习>周志华第二章--模型评估与选择过拟合和欠拟合过拟合:对训练数据拟合过当的情况,训练集表现很好,测试集表现差. 欠拟合:模型在训练和预测时都表现不好. 降低过拟合的方法: ...
2. 周志华机器学习初步线性模型
  周志华 <机器学习初步> 线性模型还未更新完,会持续更新文章目录周志华 <机器学习初步> 线性模型一.线性回归 1.线性模型线性模型的特点和重要性线性模型的基本形式 ...
3. 【读书笔记】周志华机器学习第二章模型评估和选择
  第二章模型评估和选择 1 欠拟合和过拟合偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...
4. 周志华机器学习--模型评估与选择
  周志华机器学习–模型评估与选择第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章支持向量机第六章神经网络第七章贝叶斯分类器第八章集成学习和聚类文章目录周 ...
5. 周志华机器学习--绪论
  周志华机器学习–绪论第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章支持向量机第六章神经网络第七章贝叶斯分类器第八章集成学习和聚类文章目录周志华机器学 ...
6. 周志华机器学习（西瓜书）学习笔记（持续更新）
  <周志华机器学习>笔记第1章绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状第2章模型评估与选择 2.1 经验误差与过拟 ...
7. 周志华机器学习-决策树
  周志华机器学习-决策树第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章支持向量机第六章神经网络第七章贝叶斯分类器第八章集成学习和聚类文章目录周志华机器 ...
8. 周志华机器学习-支持向量机
  周志华机器学习-支持向量机第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章支持向量机第六章神经网络第七章贝叶斯分类器第八章集成学习和聚类 – 文章目录周 ...
9. 周志华机器学习（6）：支持向量机
  周志华机器学习(6):支持向量机 6 支持向量机 6.1 间隔与支持向量 6.2 对偶问题(dual problem) 6.3 核函数 6.4 软间隔与正则化基本是大段摘录西瓜书加上一些自己的解释补 ...
10. 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归
  本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...
最新文章
热门文章

周志华 《机器学习初步》模型评估与选择

周志华 《机器学习初步》模型评估与选择

文章目录

一.泛化能力

周志华 《机器学习初步》模型评估与选择相关推荐

最新文章

热门文章

周志华《机器学习初步》模型评估与选择

周志华《机器学习初步》模型评估与选择

周志华《机器学习初步》模型评估与选择相关推荐