西瓜书&&南瓜书前两章

  • 1. 西瓜第一章
    • 1.1 基本术语
    • 1.2 课后习题
  • 2. 西瓜书第二章
    • 2.1 基本术语
    • 2.2 评估方法
      • 2.2.1 留出法
      • 2.2.2 交叉验证法
      • 2.2.3 自助法
    • 2.3 性能估计
      • 2.3.1 查准率和查全率
    • 2.4 课后习题
  • 3. 南瓜书第一章
    • 3.1 公式1.1理解
    • 3.2 公式1.2理解
  • 4. 南瓜书第二章
    • 4.1公式2.20理解
    • 4.2 公式2.21理解
    • 4.3 公式2.27理解(待补)
    • 4.4 公式2.41理解(待补)

1. 西瓜第一章

1.1 基本术语

1.2 课后习题


感觉自己好像没咋做对,也没做完,还要继续思考一下

2. 西瓜书第二章

2.1 基本术语

2.2 评估方法

2.2.1 留出法

2.2.2 交叉验证法

2.2.3 自助法

每次从数据集D中抽取一个数据,假设抽取m次,抽取的m次得到的数据形成了数据集A;剩下的数据大概有0.368形成数据集B。
缺点:自助法没有分层抽样,改变了数据分布,会引入估计偏差。

2.3 性能估计

2.3.1 查准率和查全率

查准率:P
p = 预测为正且预测正确的 /(预测为正的全部)
查全率:R
R = 预测为正且预测正确的 / (原始数据集中正样本数量)

2.4 课后习题

3. 南瓜书第一章

3.1 公式1.1理解

目的:计算出除了训练集以外的样本在学习器

的误差。(学习器下面用A表示)
计算方法:

sum = 0
for(i = h) {     //h是学习器产生的假设,遍历完所有的假设for(j = f(x)) {    //遍历完所有的x,x属于除了训练集数据以外的数据sum += (h(x) != f(x) ? p(x) : 0) * p(h|X, A); //p(x)}
}

h是学习器A通过样本X产生的假设;值得注意的是h是有很多种可能的。
所以 sigma P(h | X, εa) = 1

3.2 公式1.2理解

理解:公式一只考虑一个目标函数,而公式二则是考虑很多很多个目标函数;(想要说明“没有免费的午餐”这个道理)
公式推到中间需要理解的有两个地方:

  1. sigma符号想要交换顺序,前提是其中的变量相互独立
  2. 由于假设f是均匀分布的,并且是二分类问题,所有不管h是啥都会有1/2数量的目标函数值与h函数值相等。

最后,发现了“没有免费午餐”定理——No Free Lunch Theorem.

4. 南瓜书第二章

4.1公式2.20理解

理解这个公式,其实是想让我们知道什么是AUC,只要我们知道ROC曲线是如何得到了,AUC自然就知道了;
ROC曲线绘制的方式:首先以样本的预测值为关键字从大到小进行排序;坐标轴的x轴是假正例率,y轴是真正例率;画第一个点以1为阀值,第二点以排序的第一个样本的预测值为阈值;遇到正样本点就往上点一个点,遇到负样本点就往右画一个点(这里只是经验);严谨画法需要依照公式。(同时一个正,一个负,就在右上方画一个)

4.2 公式2.21理解

理解方法一:可以按照南瓜书上的进行理解
理解方法二:我发现不用化简也可以理解;首先还是需要把1/2提取出来;然后可以理解为单位距离为1,最后括号外边的1/m+ 和 1/m-就是对单位距离的修正;(本质上还是梯形的面积计算方式)

4.3 公式2.27理解(待补)

忘记了置信区间

4.4 公式2.41理解(待补)

西瓜书+南瓜书第1-2章相关推荐

  1. 机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)

    目录 前言 主要符号表 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 前言 本博客为博主在学习 机器学习[西瓜书 / 南瓜书]过程中的学习笔记,每一章都是对<西瓜书> ...

  2. 机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(上)(学习笔记+公式推导)

    目录 前言 2.1 经验误差与过拟合 2.2 评估方法 2.2.1 留出法(hode−outhode-outhode−out) 2.2.2 交叉验证法(crossvalidationcross val ...

  3. 机器学习-吃瓜教程(西瓜书+南瓜书)-神经网络

    datawhale-吃瓜教程-神经网络 Task01:概览西瓜书+南瓜书第1.2章 Task02:详读西瓜书+南瓜书第3章 Task03:详读西瓜书+南瓜书第4章 Task04:详读西瓜书+南瓜书第5 ...

  4. datawhale-吃瓜教程(西瓜书+南瓜书)-支持向量机

    datawhale-吃瓜教程-支持向量机 Task01:概览西瓜书+南瓜书第1.2章 Task02:详读西瓜书+南瓜书线性模型 Task03:详读西瓜书+南瓜书决策树 Task04:详读西瓜书+南瓜书 ...

  5. 【组队学习】【35期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:凌亮 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...

  6. 【组队学习】【33期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:潘磊 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...

  7. 【组队学习】【32期】吃瓜教程——西瓜书+南瓜书

    吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:陈伟峰 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...

  8. 秦州:西瓜书 + 南瓜书 吃瓜系列 14. 降维与度量学习(下)

    吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...

  9. 秦州:西瓜书 + 南瓜书 吃瓜系列 13. 降维与度量学习(上)

    吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...

最新文章

  1. 六一:如何在Datawhale开源学习小程序中管
  2. php mysql cms 商城,国内最常用的PHP+MySql免费CMS系统大全
  3. 如何生成动态matlibplot动图?
  4. html5的FileReader文件读取
  5. ubuntu16.04 + Kdevelop + ROS开发
  6. LUA中相同签名函数覆盖
  7. 主/辅DNS服务器详细配置
  8. .NET下使用HTTP请求的正确姿势
  9. onenote创建快速笔记--此分区尚不可用,它是从其他设备添加的,该设备同步后才将可用
  10. 腾讯云对象存储 python_GitHub - fushall1104/cos-python3-sdk: 腾讯云对象存储服务(cos)Python3.5版本SDK...
  11. android动态壁纸提取,[图]大神已提取出一加8T的动态壁纸:Android 8.0+设备均可使用...
  12. Kafka核心概念及核心机制
  13. 9.数据库服务器部署之------3步实现远程访问
  14. C# IntPtr类型和使用/unsafe选项编译程序
  15. 【英语:基础进阶_原著扩展阅读】J6.原著阅读实战训练
  16. Retrofit统一异常处理
  17. VMware Workstation15.1.0安装Windows 1903虚拟机
  18. PostgreSQL 源码解读(35)- 查询语句#20(查询优化-简化Having和Grou...
  19. C语言中的函数(重点介绍自定义函数)
  20. JSP实现简单的登录页面实现及代码(非连接数据库)

热门文章

  1. 激光SLAM入门学习笔记
  2. SLAM算法包与地图处理
  3. 使用matlab代码读取展示MIT-BIH心律失常数据库数据(带注释)
  4. CSS样式——div居中方法
  5. H5 div 居中显示
  6. 人工智能的过去与未来——萌芽
  7. 【Linux】进程优先级PRI
  8. 蓝库云|实体店搭建一套巡店管理系统,能让大型连锁店立竿见影
  9. Libre密聊永远的神
  10. 基于Java+MySQL的三维模型素材交易平台设计