周志华 《机器学习初步》模型评估与选择
周志华 《机器学习初步》模型评估与选择
Datawhale2022年12月组队学习 ✌
文章目录
- 周志华 《机器学习初步》模型评估与选择
- 一.泛化能力
- 二.过拟合和欠拟合
- 泛化误差 VS 经验误差
- 过拟合 VS 欠拟合
- 三.模型选择的三大问题
- 如何获得测试结果:评估方法
- 如何评估性能优劣:性能度量
- 如何判断实质差别:比较检验
- 四.评估方法
- 怎么样得到测试结果?
- 流出法
- k-折交叉验证法
- 自助法
- 五.调参与验证集
- 参数和超参数
- 验证集(validation set)
- 六.性能度量
- 回归(regression)任务常用均方误差
- 错误率
- 精度
- 查准率 vs 查全率
- 查准率 Precision
- 查全率 Recall
- F1度量
- 若对P/R有不同偏好
- 七.比较检验
- 常用方法
- 参考资料
一.泛化能力
我们当然是要学一个好的模型,但是什么模型好?这个问题不易回答。可以希望这个模型能够很好的适用于我们没有见过的样本,很好的适用于 unseen instance。
但是问题是什么叫”好“?可能有一些基本理解,比如错误率低,精度高,做 100 次如果能做对 99 次,这比做对 80 次要好。但这还是不易说出来。
比如我们考虑做推荐。一个淘宝上的电商,希望有一个机器学习的系统能把推荐做好。
- 比如说我手机上只看到 5 个东西,这 5 个东西推荐的都是我想要的,至于你第6个开始是不是好的,我不关心。
- 但是对另外一个人来说,在电脑上看,一下能看 15 个。要前 15 个都好才行。
- 这两个是完全不同的结果。
我们最希望的结果是一个东西对所有的标准都好,但这不太现实,太困难。所以我们要做的是搞清楚你要的到底是什么,我把你要的给你就好了,我不用关心对别人来说好不好。其实这和我们刚才说的 no free lunch 是同一个思想。
如果只关心前 5 个推荐是正确的,就不用去关心第 6 个开始推荐正不正确。
这实际上是做机器学习的人在看待问题的一个世界观或者方法论 O(∩_∩)O
很多做机器学习的人,会认为给你数据你就去跑,跑个算法,跑个结果,回来把结果给我,我说结果不好,你再给我一个新结果。其实不是这样的。
我们通常会要搞清楚你到底要什么,只有我把你到底要什么搞清楚了,我才知道我要给你什么。
模型评估和选择要解决这个问题,一方面我们要知道你到底要什么,另一方面我还要知道我给你的是不是你要的?这就是我们要解决的关键的背后的这两个问题。而这两个问题从技术上表现来看,它的表现形式可能又要拆解为具体的进几步要讨论的技术问题。
总的来说,一个模型的泛化能力强,就是对新的没有见过的数据的处理能力强。
但是问题是,就算我知道你想要的是什么,我手上没有没见过的数据,我怎么知道我给你的东西恰恰是在没见过的数据上表现的特别好,真的是你想要的呢?
周志华 《机器学习初步》模型评估与选择相关推荐
- 《机器学习》周志华 第二章——模型评估与选择笔记
<机器学习>周志华 第二章--模型评估与选择 过拟合和欠拟合 过拟合:对训练数据拟合过当的情况,训练集表现很好,测试集表现差. 欠拟合:模型在训练和预测时都表现不好. 降低过拟合的方法: ...
- 周志华 机器学习初步 线性模型
周志华 <机器学习初步> 线性模型 还未更新完,会持续更新 文章目录 周志华 <机器学习初步> 线性模型 一.线性回归 1.线性模型 线性模型的特点和重要性 线性模型的基本形式 ...
- 【读书笔记】周志华 机器学习 第二章 模型评估和选择
第二章 模型评估和选择 1 欠拟合和过拟合 偏差和方差 1.1 欠拟合和过拟合 1.2 偏差和方差 2 评估方法 性能度量 2.1 评估方法 2.1.1 留出法 2.2.2 交叉验证法 2.2.3 自 ...
- 周志华机器学习--模型评估与选择
周志华机器学习–模型评估与选择 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周 ...
- 周志华机器学习--绪论
周志华机器学习–绪论 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器学 ...
- 周志华机器学习(西瓜书)学习笔记(持续更新)
<周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...
- 周志华机器学习-决策树
周志华机器学习-决策树 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器 ...
- 周志华机器学习-支持向量机
周志华机器学习-支持向量机 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 – 文章目录 周 ...
- 周志华机器学习(6):支持向量机
周志华机器学习(6):支持向量机 6 支持向量机 6.1 间隔与支持向量 6.2 对偶问题(dual problem) 6.3 核函数 6.4 软间隔与正则化 基本是大段摘录西瓜书加上一些自己的解释补 ...
- 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归
本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...
最新文章
- 四个Webix实例:生成多种类型的JavaScript列表
- redis mysql主从同步_手撕Redis,主从同步
- STL中的list详解
- 超标量体系结构_CPU体系结构以及指令流水原理
- YTU 2887: D--机器人Bill
- 一幅图秒懂LoadAverage(转载)
- 速来领取!降本增效的车间管理大屏,车间主任看了都拍手称好
- 黑夜主权个人团队主页html源码
- Java二级练习试题一
- SSM_config配置springmvc.xml模板
- GAN(生成对抗神经网络 )的一点思考
- 六种用JavaScript检测出当前浏览器是否是无头浏览器( selenium headless browser)
- python编码及初体验
- socket 编程基本步骤
- php file_get_contents路径问题,file_get_contents与相对路径
- 分享个免费的图文识别orc接口
- 前端开发规范和开发文档的书写规范
- 一起入门Citrix_XenDesktop7系列 十--跟着图片交付VMware平台Personal vDisk Windo
- 计算机病毒的自述,电脑的自述作文500字
- 倍控3865U软路由安装网络行为管控插件Fros
热门文章
- 用小程序组装App,小程序容器技术好比基建
- Laravel 速查表 Cache
- 2019,我的影像记录
- win7怎么查看计算机用户名,Win7怎么查看自己电脑ip地址?
- SpringBoot整合MongoDB实现ResultFul风格接口
- 1. 拼多多什么软件可以看到大数据?拼多多大数据分析软件有哪些?
- 手把手的教你安装PyCharm --Pycharm安装详细教程(一)(非常详细,非常....)
- 阿里云VPC网络内网实例通过SNAT连接外网
- 69的人因为穷不谈恋爱,这届年轻人脱单太难了
- [python + pillow] 自制壁纸不完全教程
- 《机器学习》周志华 第二章——模型评估与选择笔记