西瓜书+南瓜书第1-2章
西瓜书&&南瓜书前两章
- 1. 西瓜第一章
- 1.1 基本术语
- 1.2 课后习题
- 2. 西瓜书第二章
- 2.1 基本术语
- 2.2 评估方法
- 2.2.1 留出法
- 2.2.2 交叉验证法
- 2.2.3 自助法
- 2.3 性能估计
- 2.3.1 查准率和查全率
- 2.4 课后习题
- 3. 南瓜书第一章
- 3.1 公式1.1理解
- 3.2 公式1.2理解
- 4. 南瓜书第二章
- 4.1公式2.20理解
- 4.2 公式2.21理解
- 4.3 公式2.27理解(待补)
- 4.4 公式2.41理解(待补)
1. 西瓜第一章
1.1 基本术语
1.2 课后习题
感觉自己好像没咋做对,也没做完,还要继续思考一下
2. 西瓜书第二章
2.1 基本术语
2.2 评估方法
2.2.1 留出法
2.2.2 交叉验证法
2.2.3 自助法
每次从数据集D中抽取一个数据,假设抽取m次,抽取的m次得到的数据形成了数据集A;剩下的数据大概有0.368形成数据集B。
缺点:自助法没有分层抽样,改变了数据分布,会引入估计偏差。
2.3 性能估计
2.3.1 查准率和查全率
查准率:P
p = 预测为正且预测正确的 /(预测为正的全部)
查全率:R
R = 预测为正且预测正确的 / (原始数据集中正样本数量)
2.4 课后习题
3. 南瓜书第一章
3.1 公式1.1理解
目的:计算出除了训练集以外的样本在学习器
的误差。(学习器下面用A表示)
计算方法:
sum = 0
for(i = h) { //h是学习器产生的假设,遍历完所有的假设for(j = f(x)) { //遍历完所有的x,x属于除了训练集数据以外的数据sum += (h(x) != f(x) ? p(x) : 0) * p(h|X, A); //p(x)}
}
h是学习器A通过样本X产生的假设;值得注意的是h是有很多种可能的。
所以 sigma P(h | X, εa) = 1
3.2 公式1.2理解
理解:公式一只考虑一个目标函数,而公式二则是考虑很多很多个目标函数;(想要说明“没有免费的午餐”这个道理)
公式推到中间需要理解的有两个地方:
- sigma符号想要交换顺序,前提是其中的变量相互独立
- 由于假设f是均匀分布的,并且是二分类问题,所有不管h是啥都会有1/2数量的目标函数值与h函数值相等。
最后,发现了“没有免费午餐”定理——No Free Lunch Theorem.
4. 南瓜书第二章
4.1公式2.20理解
理解这个公式,其实是想让我们知道什么是AUC,只要我们知道ROC曲线是如何得到了,AUC自然就知道了;
ROC曲线绘制的方式:首先以样本的预测值为关键字从大到小进行排序;坐标轴的x轴是假正例率,y轴是真正例率;画第一个点以1为阀值,第二点以排序的第一个样本的预测值为阈值;遇到正样本点就往上点一个点,遇到负样本点就往右画一个点(这里只是经验);严谨画法需要依照公式。(同时一个正,一个负,就在右上方画一个)
4.2 公式2.21理解
理解方法一:可以按照南瓜书上的进行理解
理解方法二:我发现不用化简也可以理解;首先还是需要把1/2提取出来;然后可以理解为单位距离为1,最后括号外边的1/m+ 和 1/m-就是对单位距离的修正;(本质上还是梯形的面积计算方式)
4.3 公式2.27理解(待补)
忘记了置信区间
4.4 公式2.41理解(待补)
西瓜书+南瓜书第1-2章相关推荐
- 机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
目录 前言 主要符号表 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 前言 本博客为博主在学习 机器学习[西瓜书 / 南瓜书]过程中的学习笔记,每一章都是对<西瓜书> ...
- 机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(上)(学习笔记+公式推导)
目录 前言 2.1 经验误差与过拟合 2.2 评估方法 2.2.1 留出法(hode−outhode-outhode−out) 2.2.2 交叉验证法(crossvalidationcross val ...
- 机器学习-吃瓜教程(西瓜书+南瓜书)-神经网络
datawhale-吃瓜教程-神经网络 Task01:概览西瓜书+南瓜书第1.2章 Task02:详读西瓜书+南瓜书第3章 Task03:详读西瓜书+南瓜书第4章 Task04:详读西瓜书+南瓜书第5 ...
- datawhale-吃瓜教程(西瓜书+南瓜书)-支持向量机
datawhale-吃瓜教程-支持向量机 Task01:概览西瓜书+南瓜书第1.2章 Task02:详读西瓜书+南瓜书线性模型 Task03:详读西瓜书+南瓜书决策树 Task04:详读西瓜书+南瓜书 ...
- 【组队学习】【35期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:凌亮 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...
- 【组队学习】【33期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:潘磊 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...
- 【组队学习】【32期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:陈伟峰 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...
- 秦州:西瓜书 + 南瓜书 吃瓜系列 14. 降维与度量学习(下)
吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...
- 秦州:西瓜书 + 南瓜书 吃瓜系列 13. 降维与度量学习(上)
吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...
最新文章
- 六一:如何在Datawhale开源学习小程序中管
- php mysql cms 商城,国内最常用的PHP+MySql免费CMS系统大全
- 如何生成动态matlibplot动图?
- html5的FileReader文件读取
- ubuntu16.04 + Kdevelop + ROS开发
- LUA中相同签名函数覆盖
- 主/辅DNS服务器详细配置
- .NET下使用HTTP请求的正确姿势
- onenote创建快速笔记--此分区尚不可用,它是从其他设备添加的,该设备同步后才将可用
- 腾讯云对象存储 python_GitHub - fushall1104/cos-python3-sdk: 腾讯云对象存储服务(cos)Python3.5版本SDK...
- android动态壁纸提取,[图]大神已提取出一加8T的动态壁纸:Android 8.0+设备均可使用...
- Kafka核心概念及核心机制
- 9.数据库服务器部署之------3步实现远程访问
- C# IntPtr类型和使用/unsafe选项编译程序
- 【英语:基础进阶_原著扩展阅读】J6.原著阅读实战训练
- Retrofit统一异常处理
- VMware Workstation15.1.0安装Windows 1903虚拟机
- PostgreSQL 源码解读(35)- 查询语句#20(查询优化-简化Having和Grou...
- C语言中的函数(重点介绍自定义函数)
- JSP实现简单的登录页面实现及代码(非连接数据库)